|
Durch die INDEX2 - Funktion von
EXTRAKT
wird eine Erkennung von Entitäten durchgeführt.
Hierbei werden die folgenden Typen von Entitäten erkannt.
| Typ |
Wort - Klasse |
Beispiel |
Ressourcen |
| Datum |
DAT |
21. Februar 2009
21. Februar
Februar 2009
Februar
21. 2. 2009
February, 1st 2009
14 Juillet 2009
14/7/2009
|
Spezielle Regeln für Deutsch, Englisch, Französisch |
| Wochentag |
WTAG |
Montag
Monday
Lundi
|
Wortliste |
| Monat |
MNAT |
Juni
June
Juin
|
Liste der Monatsnamen |
| Eigenname |
EIG |
Angela Merkel
Barack Obama
Ulrich Mühe
Peter Müller
|
Liste von Personennamen und spezielle Regeln (etwa um
Namen zu identifizieren, die gleichzeitig normale Wörter sind,
wie "Mühe" oder "Müller"). Ca. 200.000. |
| Familienname |
NNAM |
Obama |
Liste von Personen und deren Familienname |
| Vorname |
VNAM |
Peter |
Liste von Vornamen |
| Institution |
INS |
UNO
NATO
Deutscher Bundestag
Arbeitsagentur
Siemens
ONU
OTAN
|
Liste von Institutionen plus spezielle Regeln |
| Titel |
TIT |
Dr.
Prof.
|
Liste von Titeln |
| Geographisches Objekt |
GED |
Mittelmeer
Schwarzes Meer
Berlin
Den Haag
Los Angeles
Abu Dhabi
Black Sea
Mer Noire
|
Listet von Entitäten im Simplex - und im Mehr-Wort-Wörterbuch
(ca. 10.000) |
| Paragraph |
PARA |
§ 5, Abs. 4
|
Spezielle Regeln |
| |
|
|
|
TEXTEC Software
|