Die Semantic Engine EXTRAKT erweitert die Linguistic Engine um eine semantische Komponente.
Sie baut auf den Resultaten der linguistischen Analyse durch EXTRAKT auf und fügt zusätzliche, aus einer Wissensbasis abgeleitete (semantische) Informationen zu den Wörtern hinzu. Dadurch
wird es möglich, relevante Begriffe aus Texten herauszuziehen und als Resultat zu liefern. Die dazu verwendete Funktion heißt SEMA1 (siehe Funktionen).
Eine erste Anwendung ist die Extraktion von relevanten Begriffen aus Twitter-Nachrichten, um Such- und Angebotsmeldungen für Immobilien zu erkennen und auf sie adäquat reagieren zu können.
Eine weitere Anwendung liefert mit Unterstützung der semantischen Komponente Informationen für einen Abgleich der Aufgaben von Abteilungen mit Problembeschreibungen von Kunden: Widersprüche und
Entsprechungen zwischen Aufgaben und Beschreibungen liefern Hinweise, ob die Angaben den Problembeschreibungen korrekt zugeordnet wurden.
Die Grundlage für eine derartige Anwendung ist eine Wissensbasis. Eine solche Wissensbasis entspricht einem semantischen Wörterbuch, das um ein komplexes Regelwerk ergänzt wird. Mit
der semantischen Komponente lassen sich die in der Wissensbasis abgelegten Informationen lesen und auswerten.
Semantische Informationen werden in Thesaurien oder Ontologien gespeichert und können über standardisierte Schnittstellen leicht anderen Systemen zugänglich gemacht werden.
Wir haben einen Bestand von 30.000 Begriffen, die mit der semantischen "Ist ein" ("is a") Relation verbunden sind. Dadurch lassen sich übergeordnete Begriffe finden und in die semantische Analyse einbinden.
Beispiele : ein Zweibeiner ist ein Mensch, eine Axialbremse ist eine Bremse, ein Balirind ist ein Säugetier, eine Blockflöte ist ein Musikinstrument, ein Neudruck ist ein Druck, etc.