Suchen im Wortbergwerk

Die Süddeutsche befaßt sich am 20.2.02 mit „Text Mining“:

Dichtung und Wahrheit liegen bekanntlich nah beieinander. Und so überrascht es kaum, dass die Software auch Dichter anhand ihres Schreibstils zu unterscheiden vermag. Dem Mathematiker Emanuele Caglioti und seine Kollegen von der Universität La Sapienza in Rom gelang dies sogar mit ganz simplen Mitteln, nämlich dem Kompressionsprogramm „Zip“, das auf fast jedem PC installiert ist. Mit diesem Programm, das Dateien verdichtet und dabei ihre Größe schrumpfen lässt, konnten die Mathematiker verschiedene literarische Texte ihren Autoren zuordnen (Physical Review Letters, Bd. 88, Nr.048702, 2002).

„Zip“ komprimiert Daten, indem es wiederkehrende Zeichenfolgen erkennt und durch ein Kürzel ersetzt. Weil jeder Autor seine individuellen Vorlieben für ganz bestimmte Satzkonstruktionen und Redewendungen hat, erreicht „Zip“ bei seinen Werken einen charakteristischen Komprimierungsgrad. Anhand dieses Wertes konnte das Programm Dante, Pirandello, Macchiavelli sowie acht weitere italienische Schriftsteller unterscheiden. Erfolgsquote: 93 Prozent.

Forscher der University of Pennsylvania behaupten sogar, dass man die Selbstmordneigung von Lyrikern an einfachen Wortmustern erkennt. Laut ihrer Computeranalyse verwendeten Dichter, die den Freitod wählten, auffällig häufig das Pronomen „ich“ statt „wir“ und selten Verben aus dem Bedeutungsfeld Kommunikation (Psychosomatic Medicine, Bd.63, S.517, 2001).

Kommentar verfassen

Bitte logge dich mit einer dieser Methoden ein, um deinen Kommentar zu veröffentlichen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google Foto

Du kommentierst mit Deinem Google-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.

%d Bloggern gefällt das: