Die linguistic engine EXTRAKT ist in dem Suchportal LexxiNet (früher ExtraktSearch) integriert und sorgt für optimale Suchergebnisse.

LexxiNet (deutsch)
 

Funktionen

EXTRAKT enthält folgende Funktionen:

Mit DL wird die Sprache eines Textes bestimmt. Auch in schwierigen Typen von Texten, etwa wenn deutsche und englische Begriffe gemischt sind, erreicht diese Funktion ca. 95% korrekte Ergebnisse.

 

Diese 4 Funktionen analysieren den Text.

Die Funktion INDEX liefert die Grundformen, die Funktion ANALYZE liefert zusätzliche logische Operatoren, die die Grundformen miteinander verbinden (etwa bei Kompositateilen).

 

Die Funktion INDEX2 segmentiert den Text nach Sätzen und liefert im Sinne einer Named Entity Extraction Personen, Eigennamen (Firmen, Institutionen, Produkte), geografische Bezeichnungen, Datumsangaben, Verweise (Links) zu Internet-Seiten und Mail-Adressen. Die Funktion SUMUP führt ein "Summarize" über dem eingegeben Text aus.

 

Die GENERATE - Funktion erzeugt zu einer Grundform (Lemma) alle morphologischen Varianten.
Durch einen Parameter kann die Generierung auf unterschiedliche Stämme beschränkt werden (was einem stemming entspricht).

 

Die Generierung kann gesteuert werden über Wortklasse, Genus und dem Wortprofil aus Genus, Numerus und Kasus (für nominale Wortformen).
  

Die TRANSLATE - Funktion übersetzt Grundbegriffe von einer Sprache in eine andere Sprache.

 

  • SYNONYM

Die SYNONYM - Funktion liefert zu einem Begriff Synonyme, assoziierte Begriffe und Ableitungen (Derivationen). Eine Anwendung der Synonym-Funktion ist der Syn-Filter, der für die Aufbereitung von E-Shop-Daten verwendet wird.

 

  • THESAURUS

Die THESAURUS - Funktion liefert zu einem Begriff übergeordnete oder untergeordnete Begriffe.

 

  • SEMA1

Mit dieser semantischen Funktion werden zu den morpho-syntaktischen auch semantische Informationen aus den Thesaurus-Wörterbüchern in das Analyse-Resultat eingefügt.

 

  • TRAPHO

Die TRAPHO - Funktion liefert zu einem Begriff seine phonetische Repräsentation.


All diese Funktionen liegen in der Server - Version als auch in der API von EXTRAKT vor.

 

Die größte Verarbeitungsggeschwindigkeit mit ca. 30.000 Wörtern pro Sekunde wird in EXTRAKT4HE erreicht. Diese Variante ist für die HitEngine von Weitkämper Technology konzipiert.

Druckversion | Sitemap
© 1995-2024 TEXTEC Software Dr. Erwin Stegentritt