NEWS

Die LinguisticEngine EXTRAKT wird ergänzt durch die SemanticEngine EXTRAKT:
Mit der SemanticEngine werden semantisch-relevante Begriffe aus Texten extrahiert.
Eine Anwendung besteht darin, aus Kurznachrichten die wichtigsten Begriffe zu identifizieren und sie als Resultat zu liefern.
-20.06.2010-


Die Version 3.12 von EXTRAKT bietet neue Funktionen:
* THESAURUS: durch semantische Relationen verbundene Begriffe können gesucht und ausgefiltert werden.
* TRAPHO: die phonetische Transformation ist in die EXTRAKT integriert. Es ist die selbe Funktionalität, wie sie die phonetic engine TRAPHO anbietet.
* GENERATE: die Generate-Funktion wurde durch einen neuen Parameter erweitert. Dadurch kann die Generierung reduziert werden auf die Erzeugung von Formen, die unterschiedliche Stämme haben. Beispiel: Stuhl erzeugt nicht mehr Stuhls, Stühle, Stühlen, sondern nur noch Stuhl + Stühle.
-16.01.2010-




Das TRAPHO-System wird als Beispiel einer sprachabhängigen phonetischen Suche in der deutschen Wikipedia genannt. (Aktuelle Version anklicken!).
-16.10.2009-



Für unsere heutige Welt ist Englisch die wichtigste Verkehrssprache. Doch bis in die Neuzeit hatte diese Rolle das Latein inne. Und so gibt es - besonders in den Bibliotheken - eine riesige Menge von lateinischen Büchern.
Deshalb wurde auf dem LexiLib-Portal nun auch eine Suche in Latein integriert.

Das Lateinwörterbuch ist zwar noch klein, es wird aber nach und nach aufgefüllt werden.
Versuchen Sie doch auch eine Suche unter http://lexilib.de/index_libgateway.html, denn dort werden die linguistischen Resultate gezeigt, so dass Sie die Arbeit der linguistischen Komponente verfolgen können.
-25.09.2009-



Die HitEngine von Weitkämper Technology integriert TEXTEC's linguistic engine EXTRAKT und die phonetic engine TRAPHO.
Dadurch wird es möglich, mit der HitEngine auch unscharfe Suchen durchzuführen und die Suche durch die Fähigkeiten unserer linguistischen Lösungen noch weiter zu verbessern.
-03.09.2009-



Für den 98. Deutschen Bibliothekartag in Erfurt haben wir die mehrsprachige Suche in LEXILIB um eine Suche in dem Bibliothekenverbund Österreich / Südtirol ergänzt.
Dieser Dienst wird angeboten von unserem Partner DABIS in Wien.
Die Bibliothek in Bozen verfügt vor allem Titel in den Sprachen Deutsch und Italienisch, weshalb dieses Sprachpaar für eine mehrsprachige Suche besonders relevant ist.
-28.05.2009-



Die phonetische Suche mit dem TRAPHO - Server ist auf AQ-Verlag hinzugefügt. Die Suche startet automatisch nach der Eingabe des 3. Buchstabens.
Die Suche ist eine Ähnlichkeitssuche und somit werden Treffer auch dann gefunden, wenn sie nur ähnlich lauten.
-14.04.2009-



Eine neue EXTRAKT-Komponente wurde entwickelt, um die Arbeit mit der Linguistic Engine weiter zu vereinfachen und den Einsatz zu beschleunigen:
EXTRAKT-I.

EXTRAKT-I bezeichnet eine integrierte EXTRAKT-Anwendung, in der die EXTRAKT-API genutzt wird. EXTRAKT-I stellt alle linguistischen Funktionen bereit, die auf den Inhalt einer (Eingabe-) Datei angewendet werden. Die Steuerung geschieht über eine Konfigurationsdatei, in der festgelegt wird, welche Felder der Input-Datei mit welchen EXTRAKT-Funktionen bearbeitet werden sollen. Da eine Kommunikation zwischen Client und Server entfällt, wird eine noch höhere Geschwindigkeit erreicht, als mit der Server-Version.
EXTRAKT-I ist 2 bis 10 mal schneller als die Server - Version.
-12.02.2009-

Die Fachhochschule Köln, Institut für Informationswissenschaft, setzt die Nutzung von EXTRAKT fort und hat die Funktion INDEX2 (zur Named Entity Extraction) und EXTRAKT-I lizenziert.
Prof. Klaus Lepsky sagt dazu: "Durch Extrakt-i ist die Nutzung und Konfiguration von EXTRAKT deutlich vereinfacht und verbessert worden! Extrakt-i ist die Lösung, um beliebige Daten (...) rasch in die Indexierung zu schicken"
-20.03.2009-



Eine neue EXTRAKT-Komponente wurde entwickelt, um die Arbeit mit der Linguistic Engine weiter zu vereinfachen und den Einsatz zu beschleunigen:
EXTRAKT-I.

EXTRAKT-I bezeichnet eine integrierte EXTRAKT-Anwendung, in der die EXTRAKT-API genutzt wird. EXTRAKT-I stellt alle linguistischen Funktionen bereit, die auf den Inhalt einer (Eingabe-) Datei angewendet werden. Die Steuerung geschieht über eine Konfigurationsdatei, in der festgelegt wird, welche Felder der Input-Datei mit welchen EXTRAKT-Funktionen bearbeitet werden sollen. Da eine Kommunikation zwischen Client und Server entfällt, wird eine noch höhere Geschwindigkeit erreicht, als mit der Server-Version.
EXTRAKT-I ist 2 bis 10 mal schneller als die Server - Version.
-12.02.2009-



EUROVOC THESAURUS

Der mehrsprachige Thesaurus EUROVOC der Europäischen Kommission wurde testweise in das
Lexiquo Portal
integriert.
Zunächst wurden nur die einsprachigen Relationen in Deutsch und Englisch genutzt. Es handelt sich um die Relationen "Used for", "Broader Term" und "Related Term".
Die verbundenen Terme erscheinen als zusätzliche Synonyme in dem Fenster "Suche verbessern". Der Synonym-Bestand wurde um ca. 16.000 Einträge erweitert.
-26.01.2009-



Ein Überblicksartikel über LexiQuo (in dem unsere linguistic engine EXTRAKT genutzt wird) ist auf www.altsearchengines.com erschienen (in Englisch).
-12.01.2009-


Phonetische Suche mit Norwegisch

Bisher unterstützte die phonetische Suche TRAPHO die Sprachen Deutsch, Englisch, Französisch, Italienisch, Niederländisch und Spanisch.
Norwegisch wurde nun hinzugefügt. Regelsysteme für Schwedisch und Dänisch werden demnächst folgen.
-17.12.2008-


Die geografischen Terme enthalten nun auch Angaben dazu, wo sich das Objekt, auf den der Begriff verweist, lokalisiert ist.
London liefert also die Information "GB" für Großbritannien,
Vatikan liefert "VA" (Vatikanstaat),
Lake Itasca liefert "US" (USA),
Lukla liefert "NP" (Nepal),
Vaucluse liefert "FX" (Frankreich).

Es wird ISO 3166 zur Kodierung verwendet.
Es stehen zur Vefügung:
ca. 8.800 Einträge fürs Deutsche, plus ca. 2.000 Kompositaformen,
ca. 3.000 Einträge fürs Englische
ca. 2.500 Einträge fürs Französische.

-11.10.2008-


Fußball-Fans können unter
www.fussballersuche.de
die Namen der Fußbballspieler der EM 2008 finden, auch wenn der Name nicht korrekt geschrieben ist.
Selbst eine Suche nach 'Käwin Kurani' führt zum richtigen Namen.
Weiß vielleicht jemand, wie 'Meistorovitsch' richtig geschrieben wird?

Die Suchtechnologie von fussballersuche.de basiert auf dem DydYouMean-Server, den wir mit
Weitkämper Technology entwickelt haben.

-28.5.2008-


Kooperation mit
Pertimm
verlängert.
Die langjährige Kooperation zwischen TEXTEC Software und dem in Frankreich führenden Anbieter von Suchtechnologie, PERTIMM wird fortgesetzt.
Die Suchtechnologie von PERTIMM basiert auf einer ausgefeilten linguistischen Analyse der Daten. Die linguistische Komponente für die Sprachen Deutsch, Spanisch und Italienisch sowie die mehrsprachigen Module stammen von TEXTEC's linguistic engine.
Im Jahre 2007 wurde u.a. EADS mit PERTIMM's Suchtechnologie ausgestattet.

PERTIMM hat Niederlassungen in Frankreich und den USA.
-28.1.2008-


EXTRAKT 3.11

Eine neue Version von EXTRAKT wird unter der Versionsnummer 3.11 angeboten.

Diese neue Version bietet neben der Verbesserung der Mehrwort-Behandlung die Möglichkeit, die Satzstruktur erkennen und Mehrdeutigkeiten aufzulösen.
Die englische Komponente der linguistic engine wird durch eine Wörterbuch der Wortfamilien (Derivationswörterbuch), wie sie bereits für Deutsch und Französisch vorliegen, vervollständigt.

-17.01.2008-

Weitere Installation in Frankreich

Unser Partner PERTIMM vermeldet eine weitere Installation mit den EXTRAKT - Wörterbüchern (Deutsch, Spanisch, Italienisch): beim französischen Verteidigungsministerium wird das System PERTIMM für die Aufbereitung und Lieferung von Informationen aus den verschiedensten Quellen eingesetzt.
Ausschlaggebend für die Wahl von PERTIMM war die Qualität der Suche und die Fähigkeit, große neue Datenmengen in kürzester Zeit zu integrieren.

-25.06.2007-

DidYouMean

Die fehlertolerante Such-Lösung heißt: DidYouMean. Sie kombiniert die BESTWORD und die TRAPHO-Suche und ermöglicht millisekunden-schnelles Finden in riesigen Datenmengen.
DYM wurde zusammen mit WMC GmbH entwickelt.
Eine Demo-Suche in 40.000 Namen ist hier zu testen!


-14.06.2007-

SCIDOK Suche der Saarländischen Landes- und Universitätsbibliothek freigeschaltet.

Nachdem bereits die PSYDOK - Suche mit der Anreicherung durch EXTRAKT angeboten wird, ist nun auch die Suche in den wissenschaftlichen Publikationen der Saarländischen Landes- und Universitätsbibliothek auch mit der verbesserten Suche von EXTRAKT ausgestattet: Hier zu testen!


-25.04.2007-

Schon wieder Preis für einen Partner!!!

Unser Partner Weitkämper Medien Consulting gewinnt den Innovationspreis 2007 ITK der Initiative Mittelstand in der Kategorie Wissensmanagement!


-20.04.2007-

Urs Lang, Betreiber der Jobsuchmaschine www.speed.ch (und Nutzer von EXTRAKT), gewinnt Zuger Jungunternehmerpreis.



-16.03.2007-

EXTRAKT in der Schweiz

Die Schweizer Jobsuchmaschine www.speed.ch optimiert ihre Suchergebnisse mit der linguistic engine EXTRAKT!

SPEED.CH stellt rund 30.000 Stellenanzeigen aus verschiedenen Datenbanken, Zeitungen und amtlichen Veröffentlichungen zur Suche bereit. Die Unterstützung der Suche durch eine linguistische Aufbereitung der Inhalte ist vor allem durch das Angebot von Synonymen und Wortvarianten von Bedeutung.

-15.03.2007-

Installationen in Frankreich

Unser Partner PERTIMM vermeldet verschiedene Installationen in Frankreich, u.a. bei EADS. Hier kommt die linguistische Suche mit den Sprachen der Heimatländer von Airbus zum Einsatz: Deutsch und Spanisch (durch die EXTRAKT-Komponente) und Französisch und Englisch (durch die Pertimm-eigenen Wörterbücher).

-03.03.2007-

EXTRAKT - und Delphi

Für die API der linguistic engine EXTRAKT gibt es auch eine Version, die in eine Delphi-Umgebung eingebunden werden kann.

-08.02.2007-

EXTRAKT - Version 3.9

In der neuen Version 3.9 kann EXTRAKT's Generate-Funktion alle Komposita mit Wortvarianten ausstatten - gleichgültig ob die Komposita bekannt sind oder nicht.
Dies ist ein wichtiges neues Feature, denn im Deutschen können jederzeit neue Komposita gebildet werden, die in keinem Wörterbuch verzeichnet sind.

-08.01.2007-

EXTRAKT - angereicherte Suche in PSYDOK

Die Dokumente aus dem Sondersammelgebiet Psychologie der Landes- und Universitätsbibliothek des Saarlandes können mit den Suchmöglichkeiten von EXTRAKT leichter und präziser gefunden werden.
Die Suche kann in Deutsch, Englisch oder Französisch eingegeben werden, Synonyme und Wortableitungen können ausgewählt und hinzugefügt werden. Übersetzung der Suchbegriffe ist möglich und vervollständigt das Such-Angebot erheblich.
Neben dem besseren Zugriff auf die Dokumente ist hierbei interessant, daß der Zugriff auf ein System geschieht, das bei www.scirus.com liegt : wiederum wird die Flexibilität von EXTRAKT bei der Integration/Kooperation mit Fremdsystemen unter Beweis gestellt.
PSYDOK ist zu finden unter http://psydok.sulb.uni-saarland.de/.

-19.12.2006-

EXTRAKT Version 3.8 unterstützt Unicode.

Die neue Version 3.8 unterstützt die verschiedenen Codepages und Unicode, so daß unterschiedliche Zeichensätze gleichzeitig von EXTRAKT verarbeitet werden können.
-10.10.2006-

WMC integriert EXTRAKT in das X-Search® System.

Die Leistungsfähigkeit und die Flexibilität von EXTRAKT im Zusammenspiel mit anderen Systemen waren für die Wahl von entscheidender Bedeutung.
-28.08.2006-

Neue Version der linguistic engine EXTRAKT

EXTRAKT Version 3.7 wartet mit folgenden neuen Möglichkeiten auf:

* Die Groß-/Kleinschreibung kann ausgenutzt werden, um Mehrdeutigkeiten aufzulösen. So wird "Garten" nur als Garten (Substantiv) und nicht als garen (Verb; "...sie garten das Fleisch..") interpretiert. Im Falle von "die Moderne" bzw. "die moderne Galerie" wird das Substantiv Moderne, bzw. das Adjektiv modern identifiziert.

* Der Zugriff auf den Server kann durch eine Konfigurationsdatei gesteuert werden, so daß EXTRAKT nur auf die in der Konfigurationsdatei gelisteten IP-Adressen reagiert. Dies bedeutet einen zusätzlichen Schutz für die Anwendungen.
-13.06.2006-

Interview von Charlotte Janischewski, 'senior editor for newspaper techniques' der IFRA mit Dr. Erwin Stegentritt zum Thema der linguistischen Unterstützung bei der Suche.

-11.06.2006-

Bibliotheksportal LexiLib ist freigegeben!

Genauso wie die Suche in LexiQuo wird die Suche in den Bibliothekskatalogen der Deutschen Nationalbibliothek, der Bristish Library und der Library of Congress durch unsere Linguistic Engine unterstützt. Damit schließt sich der Kreis beginnend mit dem EU-Projekten CANAL/LS und VILIB: in diesen Projekten wurde die Technologie von EXTRAKT zum ersten Mal auf Katalogdaten angewendet - ab sofort gibt es die Funktionalität der linguistischen Anreicherung und Übersetzung im Portal www.lexilib.de.
-07.06.2006-

Als Ergänzung zur linguistischen EXTRAKT-Suche im LexiQuo-Portal ist ab sofort auch die phonetische Suche mit TRAPHO auf LexiQuo freigeschaltet.

Die durch EXTRAKT unterstützte Suche zielt auf Präzision, d.h. die Suchresultate enthalten genau die Begriffe, die auch gesucht werden - einschließlich der automatisch erzeugten Varianten und ergänzenden Begriffe (Synonyme, Übersetzungen). Als Pendant dazu gibt es die phonetische Suche, mit der ähnlich lautende Begriffe / Namen gesucht werden können. Es handelt sich also um eine 'unscharfe' Suche. Eine derartige Suche kann jedoch nicht wie im Falle von EXTRAKT auf unbekannte Dokumente geschickt werden, da die Varianten zu einem Namen nicht (in akzeptabler Zeit) berechnet werden können. Deswegen ist eine phonetische Suche nur auf bekannten Datenmengen möglich, die zuvor phonetisch indexiert werden müssen.
Für LexiQuo wurde die Liste der Fußballspieler, die an der Weltmeisterschaft teilnehmen, gewählt. Hier ist es besonders interessant, daß die Namen aus den unterschiedlichsten Sprachen stammen und auch für den größten Fan nicht leicht zu merken sind. Mit der TRAPHO-Suche in LexiQuo ist es möglich, auf lautliche und auf Buchstaben-Ähnlichkeit zu suchen.
-25.04-06-

EXTRAKT im LexiQuo-Portal

LexiQuo baut auf unserer linguistic engine EXTRAKT auf und erleichtert dem Nutzer die Suche in Suchmaschinen, Shops und Presseportalen.
Die Verbesserung der Suche wird mit LexiQuo entscheidend verbessert und erleichtert, weil alle Wortvarianten und Zerlegungen per Klick in die Suche eingefügt werden können. Zwischen den einzelnen Portalen und Shops kann hin- und hergeschaltet werden, so daß sich die Resultate vergleichen lassen.
Ein Widget für die Yahoo Widget-Engine kann von
http://widgets.yahoo.com/gallery/index.php?category=12
heruntergeladen werden.
-3.4.06-

EXTRAKT bei der Deutschen Hochschule für Verwaltungswissenschaften SPEYER

Im Bibliothekssystem LIBERO der LIB-IT GmbH heißt unsere linguistic engine WebCANAL. WebCANAL wird stets in den Sprachen Deutsch, Französisch und Englisch angeboten, so daß eine mehrsprachige Suche möglich wird.
Die neueste Installation von WebCANAL ist bei der DHV Speyer.
Die DHV ist "das Kompetenzzentrum für Verwaltungswissenschaften". Ihre Aufgabe ist die "Aus- und Weiterbildung der Angehörigen des öffentlichen Dienstes".
-28.12.05-

EXTRAKT beim HWWA:

Beim HWWA ist eine Testversion des mehrsprachigen Katalogs freigeschaltet, in dem neben der mehrsprachigen Suche auch die phonetische Suche und die BESTWORD-Suche zur Verfügung stehen. Die phonetische Suche liefert lautlich ähnliche Namen, wenn im Personenfeld gesucht wird (wenn nach Merkel gesucht wird, werden auch die Autoren Mergel und Mergell gefunden). - Hier ist unser TRAPHO-System im Einsatz.
Die BESTWORD-Suche versucht ähnlich geschriebene Wörter zu finden (vielleicht um Tippfehler auszugleichen). So zeigt die Suche nach Haburg die Alternativen Hamburg, Harburg, Hmburg, Aarburg, etc.) - eine zusätzliche Hilfe für den Benutzer!
Hier kann man sich das anschauen.
Eine Testversion ist hier erreichbar!
-09.10.05-

Präsentation von WebCANAL bei dem Anwendertreffen von LIBERO

Am 22. September wurde WebCANAL, die Anwendung unserer Linguistic Engine EXTRAKT zusammen mit dem Bibliothekssystem LIBERO von LIB-IT präsentiert.
Mehr als 100 Vertreter der verschiedenen Bibliotheken, die LIBERO im Einsatz haben, nahmen daran teil.
Das Thema des Vortrags war: "WebCANAL oder eine bessere Suche".
-30.9.2005-

Einige Zahlen:

In der aktuellen Version 3.5 besitzt das deutsche Wörterbuch der einfachen Wörter (Simplizia) über 1 Million Einträge. Zusammen mit den Komposita sind es also nun fast 2 Millionen Einträge.
-04.07.2005-

Lob für SISIS Elektra - EXTRAKT inside!

Das Informations- und Bibliotheksportal des Bundes basiert auf SISIS Elektra (siehe http://www.sisis.de/index.php). Nun wird im Fortschrittsbericht zu diesem Projekt großes Lob ausgesprochen. Auch wenn EXTRAKT darin nicht eigens erwähnt wird : wir sind dennoch stolz auf diesen Bericht, denn EXTRAKT ist in dieser Anwendung enthalten.
-17.06.2005-

WebCANAL zusammen mit LIBERO auf der SULB installiert.

EXTRAKT wird unter dem Namen WebCANAL mit dem Bibliothekssystem LIBERO von LIB-IT angeboten. Während LIBERO bereits seit einigen Jahren bei der Saarländischen Universitäts- und Landesbibliothek (SULB) im Einsatz ist, wurde nun der WebOPAC durch WebCANAL ergänzt.
Hierbei werden die Sprachen Deutsch, Französisch und Englisch zusammen mit der Übersetzungfunktion mit den Sprachpaaren Deutsch-Französisch, Deutsch-Englisch und Englisch-Französisch (bzw. umgekehrt) für den Nutzer möglich. Bei einer wissenschaftlichen Bibliothek wie die SULB ist eine mehrsprachige Suche (cross-lingual) von großem Vorteil, da mit einer einzigen Suchanfrage präzise Resultate in den drei Sprachen gleichzeitig gefunden werden können.
Die SULB war seinerzeit Partner in dem EU-Projekt CANAL/LS und kennt die Effektivität von EXTRAKT. Hinzukommt, daß an der SULB das Fach Psychologie Sondersammelgebiet ist und im CANAL - Projekt wurde insbesondere das psychologische Vokabular aufbereitet.
-06.05.2005-

EXTRAKT 3.5 unter SUN SOLARIS

Die neueste EXTRAKT-Version ist nun auch unter SUN SOLARIS lauffähig.
-23.05.2005-

TRAPHO Server

Ab sofort ist unsere phonetische Funktion TRAPHO auch als Server (TRAPHO - Server) verfügbar. Ähnlich wie bei dem EXTRAKT-Server wird er über TCP (per Skripts) angesprochen.
Die Funktionen sind:
* TRAPHO:1 -- Umwandlung eines Eingabestrings in die "phonetische" Repräsentation, je nach Sprachauswahl für Deutsch, Französisch, Englisch, Latein oder Italienisch. Die Resultate können in einzelne Dateien geleitet werden, so daß sie für die "phonetische" Suche verwendet werden können.
* EQUALS:1 -- die Suche eines Wortes nach Ähnlichkeit in dem Wortbestand, der zuvor in den Server geladen wurde; auch hier mit Sprachauswahl.
Dank der Server-Variante von TRAPHO vereinfacht sich die Integration und die Arbeit mit dieser phonetischen Suchfunktion beträchtlich, insbesondere im Zusammenspiel mit EXTRAKT, da die Kommunikation ähnlich gestaltet ist.
- 21.05.2005 -

EXTRAKT Version 3.5 ist ausgeliefert.

Diese neue Version erlaubt die Steuerung der benutzten Wörterbücher über einen (DICTS) Parameter. Das heißt, bestimmte Wörterbücher, die geladen sind, können für eine Aufgabe gesperrt oder hinzugeschaltet werden. Dadurch kann jede Anfrage für verschiedene Benutzer konfiguriert werden oder verschiedene Funktionen können mit unterschiedlichen Wörterbuch-Sets arbeiten und auf ein und denselben EXTRAKT Server zugreifen.
- 10.05.2005 -

TEXTEC Software