Durch die INDEX2 - Funktion von EXTRAKT wird eine Erkennung von Entitäten durchgeführt.
Hierbei werden die folgenden Typen von Entitäten erkannt.
Typ | Wort - Klasse | Beispiel | Ressourcen |
Datum | DAT |
21. Februar 2009
von August bis September zwischen April und Juni im Mai diesen Jahres am 25. diesen Monats |
Spezielle Regeln für Deutsch, Englisch, Französisch. Im Englischen wird nach amerikanischem und britischem Englisch unterschieden; dadurch werden Datumsformate wie 1/2/2000 als Datum im Februar oder Januar interpretiert. |
Wochentag | WTAG | Montag Monday Lundi |
Wortliste |
Monat | MNAT | Juni June Juin |
Liste der Monatsnamen |
Eigenname | EIG | Angela Merkel Barack Obama Ulrich Mühe Peter Müller |
Liste von Personennamen und spezielle Regeln (etwa um Namen zu identifizieren, die gleichzeitig normale Wörter sind, wie "Mühe" oder "Müller"). Ein Wörterbuch mit ca. 200.000 Personennamen wird genutzt. |
Familienname | NNAM | Obama | Liste von Personen und deren Familienname |
Vorname | VNAM | Peter | Liste von Vornamen |
Institution | INS | UNO NATO Deutscher Bundestag Arbeitsagentur Siemens ONU OTAN |
Liste von Institutionen plus spezielle Regeln |
Titel | TIT | Dr. Prof. |
Liste von Titeln |
Geographisches Objekt | GED | Mittelmeer Schwarzes Meer Berlin Den Haag Los Angeles Abu Dhabi Black Sea Mer Noire |
Liste von Entitäten im Simplex - und im Mehr-Wort-Wörterbuch (ca. 10.000). Zu den Ortsnamen wird das zugehörige Land/ die zugehörigen Länder geliefert. |
Paragraph | PARA |
§ 5, Abs. 4 |
Spezielle Regeln |
Link | LNK |
Verweise auf Internet-Seiten und Mail-Adressen |
Ab Version 5.4 (September 2015) |