Die linguistic engine EXTRAKT ist in dem Suchportal LexxiNet (früher ExtraktSearch) integriert und sorgt für optimale Suchergebnisse.

LexxiNet (deutsch)
 

Named Entity Extraction

Durch die INDEX2 - Funktion von EXTRAKT wird eine Erkennung von Entitäten durchgeführt.
Hierbei werden die folgenden Typen von Entitäten erkannt.

 

 Typ  Wort - Klasse Beispiel  Ressourcen
 Datum  DAT

21. Februar 2009
21. Februar
Februar 2009
Februar
21. 2. 2009
February, 1st 2009
14 Juillet 2009
14/7/2009

 

von August bis September

zwischen April und Juni

im Mai diesen Jahres

am 25. diesen Monats

Spezielle Regeln für Deutsch, Englisch, Französisch.

Im Englischen wird nach amerikanischem und britischem Englisch unterschieden; dadurch werden Datumsformate wie 1/2/2000 als Datum im Februar oder Januar interpretiert.

Wochentag WTAG Montag
Monday
Lundi
Wortliste
Monat MNAT Juni
June
Juin
Liste der Monatsnamen
Eigenname EIG Angela Merkel
Barack Obama
Ulrich Mühe
Peter Müller
Liste von Personennamen und spezielle Regeln (etwa um Namen zu identifizieren, die gleichzeitig normale Wörter sind, wie "Mühe" oder "Müller"). Ein Wörterbuch mit ca. 200.000 Personennamen wird genutzt.
Familienname NNAM Obama Liste von Personen und deren Familienname
Vorname VNAM Peter Liste von Vornamen
Institution INS UNO
NATO
Deutscher Bundestag
Arbeitsagentur
Siemens
ONU
OTAN
Liste von Institutionen plus spezielle Regeln
Titel TIT Dr.
Prof.
Liste von Titeln
Geographisches Objekt GED Mittelmeer
Schwarzes Meer
Berlin
Den Haag
Los Angeles
Abu Dhabi
Black Sea
Mer Noire
Liste von Entitäten im Simplex - und im Mehr-Wort-Wörterbuch (ca. 10.000). Zu den Ortsnamen wird das zugehörige Land/ die zugehörigen Länder geliefert.
Paragraph PARA

§ 5, Abs. 4

Spezielle Regeln
Link LNK

Verweise auf Internet-Seiten

und Mail-Adressen

Ab Version 5.4 (September 2015)

 

 

Druckversion | Sitemap
© 1995-2024 TEXTEC Software Dr. Erwin Stegentritt