Die linguistic engine EXTRAKT ist in dem Suchportal LexxiNet (früher ExtraktSearch) integriert und sorgt für optimale Suchergebnisse.

LexxiNet (deutsch)
 

Silbentrennung bei Komposita

Im Deutschen werden wie in jeder anderen Sprache ständig neue Wörter gebildet.

 

Nennen wir etwa "hartzen", "guttenbergen", oder "wulffen". Hierbei kann es zu verschiedenen Trennungsmöglichkeiten kommen - beispielsweise wulf / fen - wulff / te.

 

Die Besonderheit des Deutschen ist jedoch die Möglichkeit, Komposita zu bilden - und sie sind meist lang und deshalb oft Kandidaten für zu trennende Wörter.

 

Das im SilbenServer genutzte linguistische System stützt sich auf sehr sehr große Wörterbücher, in denen die Trennungen enthalten sind. Das sind mehr als 1,5 Mio. Wortformen (Simplizia).

 

Dazu kommen nochmals mehr als 1 Mio. Komposita (ebenfalls mit Trennungen).

 

Das bedeutet, es ist ein riesiger Bestand an Wörtern verhanden, die eine Trennung enthalten.

 

In den Fällen, in denen es sich um (noch) unbekannte Komposita handelt, wird ein Zerlegungsalgorithmus eingeschaltet. Mit  linguistischen Regeln wird das Wort in seine Bestandteile zerlegt (wodurch die Grenze zwischen den Teilen gefunden ist). Die Wortstücke werden mit den vorhandenen Silbentrennungen ausgestattet.

 

Das ist der entscheidende Unterschied zu anderen Systemen: man kann die deutsche Silbentrennung nicht allein über Regeln durchführen (einige Beispiele sind auf der vorangehenden Seite aufgelistet).

 

In den verbleibenden Fällen, wenn unsere Linguistik keine Zerlegung machen, werden Regeln zur Trennung angewendet. Es sind ungefähr 100 Regeln, die dafür sorgen, dass unbekannte Wortformen an den richtigen Stellen getrennt werden.

 

Druckversion | Sitemap
© 1995-2024 TEXTEC Software Dr. Erwin Stegentritt