In diesem Kapitel werden einige Anwendungen von EXTRAKT präsentiert. Sie betreffen die Bereiche
Bibliothekssysteme:
Lexxilib für Bibliotheken:
Lexxilib ist ein Service für eine linguistisch unterstützte Suche in verschiedenen Nationalbibliotheken und -Verbünden.
Suchsysteme im Internet und Intranet:
LexiQuo --- jetzt: LexxiNet
Ein mehrsprachige Meta-Suchmaschine mit den Sprachen Deutsch, Englisch, Französisch, Italienisch, Niederländisch, Portugiesisch und Spanisch sowie der Übersetzung der Suche in eine andere Sprache.
Die Suchanfrage wird an BING, GOOGLE, QWANT, YAHOO sowie der Wikipedia geschickt.
Phonetische Suche als Ergänzung zu morphologischen Wortvarianten - in LexxiNet integriert.
Indexierungs- und Klassifikationssysteme:
Linguistische Unterstützung für das Dokumenten-Management-System FILERO von Lib-It.
EXTRAKT wird bei der Vorindexierung der Daten genutzt, um relevante Wortvarianten zu erzeugen, einschließlich Synonymen.
Die Wörterbuchkomponente von EXTRAKT wird in dem Suchsystem Pertimm für die Sprachen Deutsch, Italienisch und Spanisch genutzt.
Suchsysteme mit unscharfer Suche (fuzzy search):
Der Dom-Splitter analysiert (mehrsprachige) Domain-Namen. Hierbei wird der EXTRAKT-SilbenServer und der Standardserver eingesetzt. Die Domain-Namen werden in die Wortbestandteile zerlegt und jedes Teil, sowie der gesamte Domain-Name hinsichtlich der Sprache identifiziert.
EXTRAKT als Werkzeug
Die Fähigkeit, die Wörter einer Sprache zu erkennen und die Grundform dazu zu liefern, wird von der Semantic Web Company in ihrer PoolParty Suite als Sucheinstieg verwendet.
Die Vollformen-Wörterbücher von EXTRAKT werden zur Erleichterung der Suche in den
ACOLADA-Wörterbüchern eingesetzt.
Frühere Anwendungen:
Content Management System von SIX mit linguistischer Aufbereitung durch EXTRAKT.
Über viele Jahre wurde die TRANSLATE - Funktion bei Fotofinder eingesetzt, um die Suche nach
Fotos zu erleichtern.
Für die Bereinigung von großen Datenbeständen (Schreibfehler, Dublettenerkennung) nutzte
Geotronic verschiedene Funktionen von EXTRAKT. Hierbei ging es darum, korrekte Wörter von
möglicherweise falsch geschriebenen Wörtern zu trennen. Sprachlich gemischte Texte mit
veralteten Schreibweisen (Orthographie vor 1900) müssen erkannt werden.
Für die SwissCom wurde mit EXTRAKT und dessen semantischen Komponenten ein Demonstrator
für die Überprüfung von Callcenter-Meldungen entwickelt. Hierbei ging es darum, falsche
Weiterleitungen, die extrem teuer werden können, so früh wie möglich zu erkennen.
EXTRAKT wird seit mehreren Jahren an der Fachhochschule Köln in der Lehre verwendet zur Demonstration von den linguistischen Lösungen, die mit der linguistic engine erreicht werden können.