| Linguistic engine EXTRAKT |
|
Die linguistic engine
EXTRAKT
ist ein umfassendes modulares System für die Behandlung von
natürlicher (geschriebener) Sprache. Dies beinhaltet sowohl einsprachige (monolinguale) als auch
zwei- und mehrsprachige (multilinguale) Anwendungen in den verschiedensten Bereichen wie Indexierung,
Lemmatisierung, Spracherkennung, syntaktische und morphologische Analyse, linguistische Suche, usw.
EXTRAKT
wird
zumeist als Add-on eingesetzt für die Verbesserung und Präzisierung von Suchanfragen
in Internet-Suchmaschinen, Bibliothekssystemen oder in Shop-Systemen. - EXTRAKT für
eine intelligente Suche!
EXTRAKT ist seit Anfang der 90er Jahre in der Entwicklung und wurde zuerst mit seiner deutschen Komponente in dem mehrsprachigen Volltextretrieval-System EMIR (European Multilingual Information Retrieval) eingesetzt. EMIR war höchstwahrscheinlich das erste mehrsprachige Volltextretrievalsystem weltweit. Inzwischen sind die wichtigsten europäischen Sprachen hinzugekommen, so daß mit EXTRAKT auch verschiedensprachige Komponenten angeboten werden. Für eine mehrsprachige Suche ergeben sich die Möglichkeiten einer Übersetzung von allen unterstützten Sprachen ins Englische und umgekehrt sowie zusätzlich die Sprachpaare Deutsch-Französisch und Deutsch-Italienisch. EXTRAKT ist wörterbuchbasiert, was bedeutet, daß fast alle Informationen in Wörterbüchern abgelegt sind. Zudem ist ist unsere linguistic engine EXTRAKT extrem schnell, so daß riesige Datenmengen kein Problem darstellen. Darüberhinaus führte die für EMIR getroffene Entscheidung, Vollformenwörterbücher zu verwenden, dazu, daß in EXTRAKT ein einziger Wörterbuchzugriff für die Erkennung eines Wortes ausreicht - was sich ebenfalls bei der Schnelligkeit bemerkbar macht. Zugleich ergibt sich daraus die Möglichkeit, selbst private Wörterbücher anzulegen und in EXTRAKT zu integrieren, ohne vorher ein linguistisches Seminar besucht haben zu müssen. EXTRAKT-I bezeichnet eine integrierte EXTRAKT-Anwendung, in der die EXTRAKT-API genutzt wird. EXTRAKT-I stellt alle linguistischen Funktionen bereit, die auf den Inhalt einer (Eingabe-) Datei angewendet werden. Die Steuerung geschieht über eine Konfigurationsdatei, in der festgelegt wird, welche Felder der Input-Datei mit welchen EXTRAKT -Funktionen bearbeitet werden sollen. Da eine Kommunikation zwischen Client und Server entfällt, wird eine noch höhere Geschwindigkeit erreicht, als mit der Server-Version. |
|
Hier können Sie
EXTRAKT
im LexiQuo - Portal testen:
EXTRAKT bei der Bibliothekssuche testen in
|