Anwendungsbeispiele

In diesem Kapitel werden einige Anwendungen von EXTRAKT präsentiert. Sie betreffen die Bereiche

 

Bibliothekssysteme:

Dabis, Geotronic, Lib-It, OCLC, Lexilib

Mehrsprachige Suche in Bibliothekskatalogen der genannten System-Anbieter.

Lexilib ist ein Service für eine linguistisch unterstützte Suche in verschiedenen Nationalbibliotheken und -Verbünden.


Suchsysteme im Internet und Intranet:

Lexiquo

Ein mehrsprachige Meta-Suchmaschine mit den Sprachen Deutsch, Englisch, Französisch, Italienisch und Spanisch sowie der Übersetzung der Suche in eine andere Sprache.

 

Indexierungs- und Klassifikationssysteme:

HitEngine

EXTRAKT wird bei der Vorindexierung der Daten genutzt, um relevante Wortvarianten zu erzeugen, einschließlich Synonymen.

Pertimm

Die Wörterbuchkomponente von EXTRAKT wird in dem Suchsystem Pertimm für die Sprachen Deutsch, Italienisch und Spanisch genutzt.


Suchsysteme mit unscharfer Suche (fuzzy search):

Dom-Splitter

Der Dom-Splitter analysiert (mehrsprachige) Domain-Namen. Hierbei wird der EXTRAKT-SilbenServer und der Standardserver eingesetzt. Die Domain-Namen werden in die Wortbestandteile zerlegt und jedes Teil, sowie der gesamte Domain-Name hinsichtlich der Sprache identifiziert.

 

EXTRAKT als Werkzeug

Für die Bereinigung von großen Datenbeständen (Schreibfehler, Dublettenerkennung) nutzt Geotronic verschiedene Funktionen von EXTRAKT. Hierbei geht es darum, korrekte Wörter von möglicherweise falsch geschriebenen Wörtern zu trennen. Sprachlich gemischte Texte und veraltete Schreibweisen (Orthographie vor 1900) müssen erkannt werden.

Lehre und Forschung

EXTRAKT wird seit mehreren Jahren an der Fachhochschule Köln in der Lehre verwendet zur Demonstration von den linguistischen Lösungen, die mit der linguistic engine erreicht werden können.