|
BESTWORD
dient dazu, zu einem gegebenen Wort, das eventuell falsch geschrieben ist, die bestmöglichen
Alternativen und Varianten zu suchen.
BESTWORD liefert bei Eingabefehlern oder bei einer resultatslosen Suche mögliche
Kandidaten. Es wird dabei entweder in dem Datenbestand, in dem gesucht wird, oder in den Wörterbüchern,
die in EXTRAKT geladen sind, gesucht.
BESTWORD
kombiniert eine sehr schnelle Implementierung der Levenshtein-Distanz mit unserer
phonetischen Komponente TRAPHO, die Regeln für die
Sprachen Deutsch, Französisch, Griechisch, Englisch, Latein, Italienisch, Niederländisch, Norwegisch
und Spanisch.
TRAPHO ist eines der schnellsten, wenn nicht das schnellste System für eine phonetische Suche.
Durch BESTWORD werden also graphematische und phonetische Varianten gefunden.
Oder anders ausgedrückt:
die graphematischen Varianten werden durch einen lautlichen Abgleich bewertet und können somit
auch nach
lautlichen Ähnlichkeiten sortiert werden.
BESTWORD
wird für die Suche im HWWA - Katalog als zusätzliche Suchmöglichkeit
angeboten.
Unter
http://webopac.hwwa.de/HWWAopac21/opac.cfm
steht eine Testversion zur Verfügung!
Mit dem SystemBESTNAME, einer Variante zu BESTWORD,
können zwei Namensdateien gegeneinander abgeglichen werden, um mit höchster Präzision
Namen aus der einen Datei in der zweiten Liste zu identifizieren, auch wenn sie nur eine vage lautliche Ähnlichkeit
besitzen.
So wird beispielsweise schief achmed als ähnlich zu shiev ahmet gefunden.
Das System ist auf Höchstgeschwindigkeit ausgelegt und vergleicht beispielsweise 500 Namen mit 5 Mio.
Namenskandidaten in weniger als einer halben Stunde.
Die Levenshtein-Distanz und die phonetische Ähnlichkeitskeits-Prüfung wird ergänzt um ca. 10
weitere Distanz-Kriterien. Dadurch wird die Liste der Kandidaten klein gehalten und beinhaltet dennoch alle
Ähnlichkeiten.
BESTWORD & BESTNAME sind verfügbar unter WINDOWS, LINUX und
HP-Unix.
Die Kombination unscharfer Suche und Wortergänzung bietet die
HitEngine
bei der
bereits beim Eintippen
des Suchbegriffs die Suche gestartet und sofort die Resultate in Form von Treffern, Kategorien und
Wortvorschlägen
geliefert werden.
TEXTEC Software
|