Geschwindigkeit
Neben der Qualität der linguistischen Funktionen ist natürlich die Geschwindigkeit der Verarbeitung ein wichtiges Kriterium.
Die Geschwindigkeit hängt von den verschiedenen Parametern ab, mit denen EXTRAKT gesteuert werden kann und auch von dem Typ der Eingabe.
Die Server - Version ist notgedrungen langsamer als die integrierte Version (API), da hierbei der Netzwerk-Transport entfällt - die API - Version (per DLL oder shared objects) ist um den Faktor 10
schneller als die Server - Version.
Einfluß auf die Geschwindigkeit hat auch der bearbeitete Text, etwa wie häufig die algorithmische Komposita-Zerlegung benötigt wird...
Hier sind einige Zahlen, die zeigen, daß EXTRAKT zu den schnellsten "engines" gehört, die es gibt.
Die Zahlen in der Tabelle zeigt die Messungen für einen Intel Core Dual Rechner mit 2,2 GHz Taktfrequenz mit der Server-Version von EXTRAKT unter Windows 7.
|
Index-Funktion mit Komposita-Zerlegung und Mehrworterkennung 1 Wort pro Zeile |
ca. 1.000 Wörter/sek. |
|
Index-Funktion mit Komposita-Zerlegung und Mehrworterkennung 1 Wort pro Zeile alle Komposita sind im Wörterbuch enthalten |
ca. 5.600 Wörter/sek. |
Werden mehr als ein einzelnes Wort pro Anfrage an den Server geschickt, so kann folgende Geschwindigkeit erreicht werden:
| Index-Funktion mit Komposita-Zerlegung Mehrere Wörter pro Zeile |
ca. 9.200 Wörter/sek. |
Die Funktionen innerhalb der EXTRAKT - API erreichen für die HitEngine folgende Geschwindigkeit:
| Index-Funktion mit Komposita-Zerlegung und Erzeugen von Wortvarianten Ein Wort pro Zeile |
ca. 31.700 Wörter/sek. |
Ein PC mit Windows 7 und einem Intel i7 - Prozessor ermöglicht folgende Geschwindigkeit:
| Index-Funktion mit Komposita-Zerlegung Ein Wort pro Zeile |
ca. 41.550 Wörter/sek. |

