Statistische Verfahren



Es gibt Fälle, in denen statistische Verfahren zur Lösung linguistischer Fragestellungen herangezogen werden müssen, etwa bei der Klassifizierung von Dokumenten, bei der Gewichtung von Treffern bei einer Suche etc.

Im Folgenden werden zwei Produkte beschrieben, in denen wir statistische Verfahren mit der linguistic engine EXTRAKT zusammen einsetzen.

WORDSQUEEZER bedeutet Wortquetsche. Der WordSqueezer bestimmt aus parallel übersetzten Texten die Übersetzungen der Begriffe. Hierbei werden statistische Verfahren eingesetzt, was nur funktionieren kann, wenn große Datenmengen vorliegen, um sichere Kandidaten zu gewinnen.

WordSqueezer ist also ein Hilfsmittel für die Produktion von zweisprachigen Wörterbüchern... WordSqueezer wurde u.a. bei der Zuordnung von französisch-englischen Übersetzungen der französischen Gelben Seiten getestet.



TRAMA steht für TRAnslation MAnager.

TRAMA ist in der Lage, zu einem Textstück ähnliche Segmente, aufgrund statistischer und linguistischer Verfahren zu identifizieren. Dadurch werden bereits übersetzte (ähnliche) Texte erkannt und deren Übersetzung wird angezeigt. Damit ist auch eine Klassifizierung von Dokumenten möglich. Das Konzept ähnelt dem des Translation Memory, wie es für Übersetzungssysteme entwickelt worden ist. Doch TRAMA kann insbesondere dort verwendet werden, wo aus großen Beständen an übersetzten Texten automatisch die wichtigsten Übersetzungen von Fachbegriffen herausgefunden werden sollen.

Home