אינדקס הוא התהליך שבו ניתן לסווג מסמכים, טקסטים ואחרים, באמצעות אוצר מילים מבוקר (מונחי מפתח המתארים בצורה מושלמת את נושא הכתיבה), סיכומים וניתוחים. באשר לאינדקס מסמכים, קבוצת הנתונים החשובה היא שמאפשרת חיפוש או שמירה על טקסט מסוים, בדרך כלל, שפורסם. הוא נבדל על ידי שימוש בתדירות גבוהה יותר בתחום המדעי, ולכן עדיף לחלק אותם לפי פיסות המידע הבאות: שם המחבר, כותרת הפרסום, שנה, מו"ל, מדינה, כמו גם שם המשאב שאותו הוא מכיל אותו (עיתונים, כתבי עת), אם הוא קיים.
בין האלמנטים שניתן למצוא בתהליך האינדקס, ישנם: האינדקסר, הנושא האחראי על ביצוע ההליך ברצינות, תוך שימוש בכללים או במדיניות השולטים בו; מסמכים הם אלה המבקשים לסווג במערכת שעבורם מתבצעת סקירה ממצה, ומצליחים להפיק מהם את המידע המתאים שיהיה נגיש לכל חיפוש או אחסון בו; כללי ומדיניות הצמדה לאינדקס הם החוקים השונים לפיהם האינדקס מנוהל, כדי להפוך אותו ליעיל; שפה אינדקס, הידוע גם בשם אוצר מילים מבוקר, עוסק בבחירת מונחים המתייחסים לתוכן המסמך ושייכים למעין ארגון של מילים ספציפיות.
חשוב לציין שאוצר המילים המבוקר מחולק, בתורו, לשלוש קטגוריות. הראשון מעניק חיים לאלה המסודרים באלף-בית, תוך כיבוד הנושא אליו הם מתייחסים. מילות מפתח וביטויים תיאוריים כלולים גם כן. כמו כן, יש לכבד את התקנות הלשוניות.