Die linguistic engine EXTRAKT ist in dem Suchportal LexxiNet (früher ExtraktSearch) integriert und sorgt für optimale Suchergebnisse.

LexxiNet (deutsch)
 

Linguistic Engine EXTRAKT

 

Die linguistic engine EXTRAKT ist ein umfassendes modulares System für die Behandlung von natürlicher (geschriebener) Sprache. Dies beinhaltet sowohl einsprachige (monolinguale) als auch zwei- und mehrsprachige (multilinguale) Anwendungen in den verschiedensten Bereichen wie Indexierung, Lemmatisierung, Spracherkennung, syntaktische und morphologische Analyse, linguistische Suche, usw.

 

EXTRAKT basiert nicht auf AI - Künstlicher Intelligenz -, sondern basiert auf natürlicher, sprich menschlicher IIntelligenz: die Grundlage und die Voraussetzung jeder möglichen Künstlichen Intelligenz: umfangreiche Wörterbücher mit Millionen von Einträgen, grammatische Regeln, wie sie im Sprachunterricht gelernt werden müssen, und schnelle Algorithmen...

 

EXTRAKT wird zumeist als Add-on eingesetzt für die Verbesserung und Präzisierung von Suchanfragen in Internet-Suchmaschinen, Bibliothekssystemen, in Shop-Systemen oder als Einstieg zu AI-Systemen...

EXTRAKT ist seit Anfang der 90er Jahre in der Entwicklung und wurde zuerst mit seiner deutschen Komponente in dem mehrsprachigen Volltextretrieval-System EMIR (European Multilingual Information Retrieval) eingesetzt. EMIR war das erste mehrsprachige Volltextretrievalsystem weltweit.


Inzwischen sind die wichtigsten europäischen Sprachen zu EXTRAKT hinzugekommen, so dass mit EXTRAKT auch verschiedensprachige Komponenten angeboten werden. Für eine mehrsprachige Suche ergeben sich die Möglichkeiten einer Übersetzung von allen unterstützten Sprachen ins Englische und umgekehrt sowie zusätzlich die Sprachpaare Deutsch-Französisch und Deutsch-Italienisch.

EXTRAKT ist wörterbuchbasiert, was bedeutet, dass (fast) alle Informationen in Wörterbüchern abgelegt sind. Zudem ist unsere linguistic engine EXTRAKT sehr schnell, so dass riesige Datenmengen kein Problem darstellen. Darüberhinaus führte die bereits für EMIR getroffene Entscheidung, Vollformenwörterbücher zu verwenden, dazu, dass oft ein einziger Wörterbuchzugriff für die Erkennung eines Wortes ausreicht - was sich ebenfalls bei der Schnelligkeit bemerkbar macht.

 

Extrakt SERVICE

Neben der Server-Version von EXTRAKT steht nun (Januar 2021) auch ein Windows-Service zur Verfügung.

Dadurch wird die Einbindung und das Nutzen der EXTRAKT-Funktionen in Client-Anwendungen vereinfacht. Die Funktionen selbst sind mit denen der Server-Variante identisch.

 

Die Entwicklung der Service-Variante wurde in Kooperation mit unserem Partner LIB-IT DMS GmbH (www.lib-it.de) realisiert; sie kommt im Enterprise Information Management System FILERO standardmäßig zum Einsatz.

Das Server-Programm basiert auf dem Programmbeispiel „Sampleservice“ von Mohit Arora.

 

Extrakt-API

 

Diese API stellt in einer DLL oder in einem S.O. alle linguistischen Funktionen bereit, so daß sie in andere Systeme integriert werden können. Dadurch entfällt die Server-Komponente und die Kommunikation zwischen Client und Server (per TCP/IP), was eine Beschleunigung gegenüber der Server-Version bedeutet.

Druckversion | Sitemap
© 1995-2024 TEXTEC Software Dr. Erwin Stegentritt