Linguistische Software Linguistic Engine EXTRAKT

TEXTEC SOFTWARE

entwickelt die linguistic engine EXTRAKT.

EXTRAKT ist ein umfassendes System linguistischer und statistischer Funktionen für

das Erkennen von Grundformen (Lemmatisierung mit Komposita-Zerlegung) ,

das Erzeugen von Wortvarianten aus einer Grundform (Generierung und "stemming"),

die Zuordnung von Synonymen und Ableitungen (Wortfamilie),

den Zugriff auf Thesaurus-Begriffe und ihre Auswahl mithilfe von Thesaurus-Relationen,

das Übersetzen von Suchbegriffen in andere Sprachen,

das Erkennen von Satzgrenzen, Wortgruppen und Erkennen von Entitäten (Named Entity Extraction),

das Normieren von Datumsangaben,

die TRAPHO - Funktion.

Anwendungen :

In Lexxi (www.lexxi.eu) können beliebige Wörter analysiert und ihre Varianten angezeugt werden.

Synonyme und Wortfamilien gehören dazu.

LexxiLib hilft bei der Suche in Bibliothekskatalogen - in der Deutschen Nationalbibliothek, in Europeana, in WorldCat und in Helveticat..

Die SemanticEngine erweitert EXTRAKT um eine semantische Komponente und ist dadurch in der Lage, bestimmte Begriffe aus Texten semantisch, also mit ihrer Bedeutung, zu identifizieren.

Der SilbenServer fügt Silbengrenzen in die Wörter ein. Insbesondere die Kompositazerlegung sorgt für eine korrekte Trennung von unbekannten oder neuen Wörtern.
Einsatzgebiet des SilbenServers ist die Aufbereitung von Texten für kleine Displays.

Der SilbenServer wird eingesetzt in Speech-Systemen, denn nur die korrekte Silbengrenzen ermöglichen eine korrekte Betonung bei der Aussprache.

TRAPHO erlaubt eine phonetische Suche von Wörtern und insbesondere von Eigennamen. TRAPHO gibt für die Sprachen Deutsch, Französisch, Englisch, sowie Niederländisch, Portugiesisch, Spanisch und seit April 2020 auch für Griechisch, Arabisch und Türkisch; ab Juli 2020 auch für Isländisch.

Mit TRAPHO wurde DYM3 entwickelt, wodurch ein Abgleich von Namen möglich ist, um ähnlich lautende Namen zu finden.

Dadurch werden aus Namenslisten mit mehreren Millionen Einträgen in wenigen Minuten ähnliche Namen identifiziert, bewertet und ausgegeben.

Eine Kombination einer graphematischen und phonetischen Suche wird in DYM4COMPARE eingesetzt, um aus großen Namenslisten (mehrere Millionen Namen) ähnliche Namen zu finden.

SUMUP analysiert Texte mit den linguistischen Funktionen von EXTRAKT und liefert die relevantesten Sätze aus diesen Texten.C

Die linguistic engine EXTRAKT ist in unserem Suchportal LexxiNet integriert und sorgt für optimale Suchergebnisse.

Webansicht Mobile-Ansicht

Logout Seite bearbeiten

↑