Named Entity Extraction
Durch die INDEX2 - Funktion von EXTRAKT wird eine Erkennung von Entitäten durchgeführt.
Hierbei werden die folgenden Typen von Entitäten erkannt.
| Typ | Wort - Klasse | Beispiel | Ressourcen |
| Datum | DAT | 21. Februar 2009 21. Februar Februar 2009 Februar 21. 2. 2009 February, 1st 2009 14 Juillet 2009 14/7/2009 |
Spezielle Regeln für Deutsch, Englisch, Französisch |
| Wochentag | WTAG | Montag Monday Lundi |
Wortliste |
| Monat | MNAT | Juni June Juin |
Liste der Monatsnamen |
| Eigenname | EIG | Angela Merkel Barack Obama Ulrich Mühe Peter Müller |
Liste von Personennamen und spezielle Regeln (etwa um Namen zu identifizieren, die gleichzeitig normale Wörter sind, wie "Mühe" oder "Müller"). Ein Wörterbuch mit ca. 200.000 Personennamen wird genutzt. |
| Familienname | NNAM | Obama | Liste von Personen und deren Familienname |
| Vorname | VNAM | Peter | Liste von Vornamen |
| Institution | INS | UNO NATO Deutscher Bundestag Arbeitsagentur Siemens ONU OTAN |
Liste von Institutionen plus spezielle Regeln |
| Titel | TIT | Dr. Prof. |
Liste von Titeln |
| Geographisches Objekt | GED | Mittelmeer Schwarzes Meer Berlin Den Haag Los Angeles Abu Dhabi Black Sea Mer Noire |
Listet von Entitäten im Simplex - und im Mehr-Wort-Wörterbuch (ca. 10.000) |
| Paragraph | PARA |
§ 5, Abs. 4 |
Spezielle Regeln |

