Die linguistic engine EXTRAKT ist in dem Suchportal LexxiNet (früher ExtraktSearch) integriert und sorgt für optimale Suchergebnisse.

LexxiNet (deutsch)
 

DYM3

dient dazu, zu einem gegebenen Wort, das eventuell falsch geschrieben ist, die bestmöglichen Alternativen und Varianten zu suchen. DYM3 liefert bei Eingabefehlern oder bei einer resultatslosen Suche mögliche Kandidaten. Es wird dabei entweder in dem Datenbestand, in dem gesucht wird, oder in den Wörterbüchern, die in EXTRAKT geladen sind, gesucht.

DYM3 kombiniert eine sehr schnelle Implementierung der Levenshtein-Distanz mit unserer phonetischen Komponente TRAPHO, die Regeln für die Sprachen Deutsch, Französisch, Griechisch, Englisch, Latein, Italienisch, Niederländisch, Norwegisch und Spanisch.

Durch DYM werden also graphematische und phonetische Varianten gefunden. Oder anders ausgedrückt:
die graphematischen Varianten werden durch einen lautlichen Abgleich bewertet und können somit auch nach lautlichen Ähnlichkeiten sortiert werden.
 
Es können zwei Namensdateien gegeneinander abgeglichen werden, um mit höchster Präzision Namen aus der einen Datei in der zweiten Liste zu identifizieren, auch wenn sie nur eine vage lautliche Ähnlichkeit besitzen.
So wird beispielsweise schief achmed als ähnlich zu shiev ahmet gefunden.

Das System ist auf Höchstgeschwindigkeit ausgelegt und vergleicht beispielsweise 500 Namen mit 5 Mio. Namenskandidaten in weniger als 30 Minuten.

Die Levenshtein-Distanz und die phonetische Ähnlichkeitskeits-Prüfung wird ergänzt um ca. 10 weitere Distanz-Kriterien. Dadurch wird die Liste der Kandidaten klein gehalten und beinhaltet dennoch alle Ähnlichkeiten.

 

DYM3 ist dafür konzipiert, Namensvergleiche durchzuführen, wie für die Erfüllung der EU-Verordnungen Nr. 2580/2001 und 881/2002 notwendig sind. Bei diesen Verordnungen geht es um die Bekämpfung des internationalen Terrorismus. Die durch die EU herausgegebenen Liste von Personennamen und Namen von Institionen muß von Banken und anderen Institutionen mit eigenen Namenslisten abgeglichen werden, damit Konten eingefroren und Geschäfte unterbunden werden können.

Der Abgleich wird somit durch DYM3 nicht als eine 1:1-Entsprechung durchgeführt, sondern über die o.g. Ähnlichkeitsfunktionen.

 

DYM3 ist eine Weiterentwicklung des DYM-Server. DYM steht für DidYouMean. Es entstand in Kooperation mit Weitkämper Technology.

DYM3 können Sie gratis testen, wenn Sie uns eine eMail schreiben. Mit der Testversion werden Ortsnamen aus Deutschland, Österreich und der Schweiz suchbar gemacht. (Nur für Windows). EMail bitte an stegentritt@textec.de schicken.

 

Oder Sie testen DYM3 online bei Weitkamper.de !

Druckversion | Sitemap
© 1995-2024 TEXTEC Software Dr. Erwin Stegentritt