Durch die INDEX2 - Funktion von EXTRAKT wird eine Erkennung von Entitäten durchgeführt.
Hierbei werden die folgenden Typen von Entitäten erkannt.
| Typ | Wort - Klasse | Beispiel | Ressourcen |
| Datum | DAT |
21. Februar 2009
von August bis September zwischen April und Juni im Mai diesen Jahres am 25. diesen Monats |
Spezielle Regeln für Deutsch, Englisch, Französisch. Im Englischen wird nach amerikanischem und britischem Englisch unterschieden; dadurch werden Datumsformate wie 1/2/2000 als Datum im Februar oder Januar interpretiert. |
| Wochentag | WTAG | Montag Monday Lundi |
Wortliste |
| Monat | MNAT | Juni June Juin |
Liste der Monatsnamen |
| Eigenname | EIG | Angela Merkel Barack Obama Ulrich Mühe Peter Müller |
Liste von Personennamen und spezielle Regeln (etwa um Namen zu identifizieren, die gleichzeitig normale Wörter sind, wie "Mühe" oder "Müller"). Ein Wörterbuch mit ca. 200.000 Personennamen wird genutzt. |
| Familienname | NNAM | Obama | Liste von Personen und deren Familienname |
| Vorname | VNAM | Peter | Liste von Vornamen |
| Institution | INS | UNO NATO Deutscher Bundestag Arbeitsagentur Siemens ONU OTAN |
Liste von Institutionen plus spezielle Regeln |
| Titel | TIT | Dr. Prof. |
Liste von Titeln |
| Geographisches Objekt | GED | Mittelmeer Schwarzes Meer Berlin Den Haag Los Angeles Abu Dhabi Black Sea Mer Noire |
Liste von Entitäten im Simplex - und im Mehr-Wort-Wörterbuch (ca. 10.000). Zu den Ortsnamen wird das zugehörige Land/ die zugehörigen Länder geliefert. |
| Paragraph | PARA |
§ 5, Abs. 4 |
Spezielle Regeln |
| Link | LNK |
Verweise auf Internet-Seiten und Mail-Adressen |
Ab Version 5.4 (September 2015) |