INDEX2 und Named Entity Extraction mit EXTRAKT



Durch die INDEX2 - Funktion von EXTRAKT wird eine Erkennung von Entitäten durchgeführt.
Hierbei werden die folgenden Typen von Entitäten erkannt.

 Typ  Wort - Klasse Beispiel  Ressourcen
 Datum  DAT 21. Februar 2009
21. Februar
Februar 2009
Februar
21. 2. 2009
February, 1st 2009
14 Juillet 2009
14/7/2009
Spezielle Regeln für Deutsch, Englisch, Französisch
Wochentag WTAG Montag
Monday
Lundi
Wortliste
Monat MNAT Juni
June
Juin
Liste der Monatsnamen
Eigenname EIG Angela Merkel
Barack Obama
Ulrich Mühe
Peter Müller
Liste von Personennamen und spezielle Regeln (etwa um Namen zu identifizieren, die gleichzeitig normale Wörter sind, wie "Mühe" oder "Müller"). Ca. 200.000.
Familienname NNAM Obama Liste von Personen und deren Familienname
Vorname VNAM Peter Liste von Vornamen
Institution INS UNO
NATO
Deutscher Bundestag
Arbeitsagentur
Siemens
ONU
OTAN
Liste von Institutionen plus spezielle Regeln
Titel TIT Dr.
Prof.
Liste von Titeln
Geographisches Objekt GED Mittelmeer
Schwarzes Meer
Berlin
Den Haag
Los Angeles
Abu Dhabi
Black Sea
Mer Noire
Listet von Entitäten im Simplex - und im Mehr-Wort-Wörterbuch (ca. 10.000)
Paragraph PARA

§ 5, Abs. 4

Spezielle Regeln
       




TEXTEC Software