SumUp erzeugt aus einem Text eine Zusammenfassung, indem die relevantesten Sätze des Textes automatisch herausgesucht und bewertet werden.
Die Berechnung der Relevanz geschieht auf der Grundlage einer morpho-syntaktischen Analyse des Textes (s. INDEX2) und einer nachfolgenden statistischen Berechnung.
Jeder einzelne Satz wird in Bezug auf das Kapitel, aus dem er stammt, bewertet. Durch einen Parameter kann festgelegt werden, wieviele relevante Sätze (über einem kritischen Wert) geliefert werden sollen.
Entweder werden die relevanten Sätze in der Reihenfolge ihrer Relevanz oder in der textlichen Reihenfolge des Dokumentes geliefert.
Ein frühes SumUp wurde vor 1914 schon von Christian Morgenstern in seinem Gedicht "Die Brille" beschrieben:
Korfs Brille [ oder ein frühes SUMUP ]
Korf liest gerne schnell und viel;
Darum widert ihn das Spiel
all des zwölfmal unerbetnen
Ausgewalzten, Breitgetretnen.
Meistens ist in sechs bis acht
Wörtern völlig abgemacht,
und in ebensoviel Sätzen
läßt sich Bandwurmweisheit schwätzen.
Es erfindet drum sein Geist
etwas, was ihn dem entreißt:
Brillen, deren Energieen
ihm den Text - zusammenziehen!
Beispielsweise dies Gedicht
läse, so bebrillt, man - nicht!
Dreiunddreißig seinesgleichen
gäben erst - ein - - Fragezeichen!!
(Christian Morgenstern)