Die INDEX2 - Funktion ähnelt der INDEX-Funktion, doch werden bestimmte zusätzliche Aufgaben erledigt, denn die Resultate von INDEX2 dienen auch dem SUMUP (Erstellen einer Zusammenfassung) als Grundlage.
Die wichtigste Aufgabe von INDEX2 ist die Auflösung von Mehrdeutigkeiten. Etwa wird unterschieden nach Nomen und Verben (das Versprechen <> versprechen), Pronomen/Konjunktionen/Artikel und Verben (sondern, meinen, einen) .
Die Wörter können nummeriert werden, auch kann die Anfangs- und Endposition des Wortes im Satz bestimmt werden, so dass damit wieter gearbeitet werden kann.
Es werden Wortgruppen zusammengeführt, wenn es sich um Personen oder Institutionen handelt, Datumsangaben werden erkannt und in eine Standardform umgewandelt (YYYY-MM-DD), sa dass sie leicht weiterverarbeitet werden können. Unterschiede beim britischen und amerikanischen Englisch werden berücksichtigt.
Eine wichtige Aufgabe ist es, Abkürzungspunkte von Satzende-Punkten zu unterscheiden.
Bestimmte Mehrdeutigkeiten werden aufgelöst. Es handelt sich vor allem um Mehrdeutigkeiten zwischen Substantiv und Verb (Haben = Substantiv bzw. Auxiliarverb). Oder zwischen Verb und Artikel (einen = Verb bzw. unbestimmter Artikel).
Eine Übersicht über die einzelnen Positionen findet sich unter dem Kapitel Named Entity Extraction.