Wahre Verbrechen 14 Min. Lesezeit

Forensische Stylometrie: 5 erschreckende Fälle, die anonyme Autoren entlarvten

Dieser Artikel wurde automatisch aus dem Englischen von einer KI übersetzt. Originalversion auf Englisch lesen →
Die Wurzeln der forensischen Stylometrie im Unabomber-Fall, gezeigt durch Ted Kaczynskis Polizeifoto
🎧 Anhören
Apr 13, 2026
Lesemodus

Im September 1995 veröffentlichte The Washington Post ein 35.000 Wörter umfassendes Manifest mit dem Titel „Industrial Society and Its Future”. Der Autor war unbekannt. Das FBI hatte 17 Jahre und Millionen von Dollar darauf verwendet, die Person zu jagen, die es geschrieben hatte, einen Serienbomber, der drei Menschen getötet und fast zwei Dutzend weitere verletzt hatte. Traditionelle forensische Beweise hatten nichts ergeben: keine Fingerabdrücke, keine DNA, keine nachverfolgbaren Materialien.[s] Was schließlich den Fall aufklärte, war weder ein Haar noch ein chemischer Rückstand. Es war ein Satz: „seinen Kuchen essen und ihn auch haben”.

Das Gebiet, das diesen Durchbruch ermöglichte, ist die forensische StylometrieDie quantitative Analyse des Schreibstils zur Bestimmung der Urheberschaft unter Verwendung statistischer und computergestützter Methoden zur Identifizierung charakteristischer Sprachmuster., die quantitative Untersuchung des Schreibstils, angewandt auf Fragen der Autorenschaft.[s] Jede Person verwendet Sprache auf subtil charakteristische Weise: spezifische Wortwahl, Zeichensetzungsgewohnheiten, Satzstrukturen und unbewusste Präferenzen für bestimmte Präpositionen gegenüber anderen. Linguisten nennen dies einen IdiolektDie einzigartige Art einer Person, Sprache zu verwenden, einschließlich charakteristischer Wortauswahl, Grammatikmuster und unbewusster sprachlicher Vorlieben., eine persönliche Version einer gemeinsamen Sprache.[s] Forensische Stylometrie behandelt diese Muster als Beweis und misst sie mit statistischen und rechnerischen Werkzeugen, um zu bestimmen, wer einen strittigen Text geschrieben hat.

Die Worte des Unabombers

Die Entscheidung des FBI, das Manifest zu veröffentlichen, war ein kalkuliertes Wagnis. Agenten hofften, dass jemand die Schreibweise erkennen würde.[s] In Schenectady, New York, las eine Frau namens Linda Patrik den Essay und dachte, er klänge wie ihr Schwager Ted Kaczynski. Sie zeigte ihn ihrem Ehemann David Kaczynski, der ungewöhnliche Ausdrücke erkannte, die sein entfremdeter Bruder bevorzugte, einschließlich „kaltblütige Logiker”.[s] David wandte sich mit seinen Verdächtigungen an das FBI.

FBI-Supervisory Special Agent James Fitzgerald führte dann einen systematischen sprachlichen Vergleich zwischen Kaczynskis bekannten Schriften und dem Manifest durch. Die Ähnlichkeiten waren auffallend. Beide Texte verwendeten „analyse” anstelle von „analyze”, „licence” anstelle von „license” und „wilfully” anstelle von „willfully”. Beide kehrten die gewöhnliche Redewendung um in „man kann seinen Kuchen nicht essen und ihn auch haben”.[s]

Soziolinguist Roger Shuy identifizierte ein weiteres aufschlussreiches Detail: die ungewöhnlichen Schreibweisen des Manifests, wie „clew” für „clue”, entsprachen Rechtschreibreformen, die The Chicago Tribune in den 1940er und 1950er Jahren gefördert hatte. Diese Reformen wurden nie weit verbreitet übernommen, aber jemand, der mit dem Lesen dieser Zeitung aufgewachsen war, hätte sie absorbiert. Kaczynski war 1942 in Chicago geboren.[s]

Die sprachliche Analyse des FBI, kombiniert mit biografischen Fakten, lieferte die Grundlage für einen Durchsuchungsbefehl.[s] Am 3. April 1996 verhafteten Agenten Kaczynski in seiner Hütte in Montana, wo sie bombenbauende Materialien und eine Kopie des Manifests fanden. Fitzgeralds Arbeit markierte das erste Mal, dass forensische Stylometrie in einem Bundesfall verwendet wurde, um einen Durchsuchungsbefehl zu erhalten.[s]

Forensische Stylometrie wird digital

Der Unabomber-Fall bewies, dass Schreibstil als Beweis funktionieren konnte. In den Jahrzehnten seither haben Computer die forensische Stylometrie von einem mühsamen manuellen Prozess zu einer schnellen, skalierbaren Disziplin verwandelt. Die grundlegende Arbeit geht auf 1964 zurück, als die Statistiker Frederick Mosteller und David Wallace drei Jahre damit verbrachten, FunktionswörterGrammatische Wörter wie Artikel, Präpositionen und Konjunktionen, die eher strukturelle als semantische Zwecke in der Sprache erfüllen. in den Federalist Papers manuell zu analysieren und schließlich zwölf umstrittene Essays James Madison zuschrieben.[s] Moderne Software kann äquivalente Analysen in Sekunden durchführen.

Die öffentlichste Demonstration kam 2013, als Patrick Juola, ein Informatiker an der Duquesne University, sein Java Graphical Authorship Attribution Program (JGAAP) verwendete, um einen Detektivroman namens The Cuckoo’s Calling zu analysieren, der dem Debütautor Robert Galbraith zugeschrieben wurde. Ein Sunday Times-Reporter hatte einen Hinweis erhalten, dass J.K. Rowling die wahre Autorin sei. Juolas Programm verglich den Roman mit Werken von Rowling und drei anderen britischen Krimiautorinnen und verfolgte Wortlängenverteilungen, die 100 häufigsten Wörter, Vier-Charakter-Gramme und Wort-Bigramme.[s]

Rowling war die einzige Autorin, die durchgängig über alle vier Tests hinweg übereinstimmte. Wie Juola erklärte: „Jeder hat eine besondere Art zu schreiben, die fast unmöglich zu verbergen ist”.[s] Mit den Beweisen konfrontiert, gab Rowling zu, dass das Pseudonym ihres war.

Wenn Anonymität eine Frage von Leben und Tod ist

Rowlings Entlarvung war peinlich, aber harmlos. Für Whistleblower, Dissidenten und anonyme Quellen stellt dieselbe Technologie eine viel schwerwiegendere Bedrohung dar. Wenn forensische Stylometrie eine Bestsellerautorin anhand ihrer Präpositionen identifizieren kann, kann sie einen Regierungsangestellten identifizieren, der klassifizierte Dokumente durchsickert, oder einen Aktivisten, der Kritik an einem autoritären Regime veröffentlicht.

Forscher der Drexel University haben beide Seiten dieses Problems erforscht. Ihr Privacy, Security and Automation Lab entwickelte zwei konkurrierende Werkzeuge: JStylo, das Autoren identifiziert, und Anonymouth, das Schriftstellern hilft, ihren Stil zu verschleiern. JStylo kann den korrekten Autor aus einem Pool von 40 Kandidaten mit 80 bis 85 Prozent Genauigkeit auswählen, bei einer Schreibprobe von etwa 6.500 Wörtern.[s]

„Wenn Menschen anonym sprechen wollen, sei es über Menschenrechtsfragen zu berichten, Whistleblowing zu betreiben oder einfach unpopuläre Meinungen zu äußern, müssen sie wissen, wie sie sicher sein können und ob Stylometrie ihre Identität preisgeben könnte”, sagte Rachel Greenstadt, die Direktorin des Labors.[s]

Anonymouth funktioniert, indem es dieselben Analysen wie JStylo durchführt und dann Änderungen vorschlägt, die der Autor vornehmen kann, um seinen Schreibfingerabdruck zu maskieren. Das Werkzeug kodiert nicht den Text; es trainiert Schriftsteller darin, welche Gewohnheiten zu ändern sind. Der Ansatz spiegelt ein wachsendes Teilgebiet namens adversarielle Stylometrie wider, die Praxis, das Schreiben absichtlich zu verändern, um der Autorenerkennung zu entgehen.

Auch Code hat einen Fingerabdruck

Forensische Stylometrie gilt nicht mehr nur für Prosa. Forscher haben gezeigt, dass Programmierer stilistische Signaturen im Quellcode hinterlassen, von Variablenbenennungskonventionen bis zur Struktur ihrer abstrakten Syntaxbäume. Eine Studie von 2024 der Universität Bologna stellte einen Datensatz von 114.400 Code-Schnipseln von 104 Open-Source-Entwicklern zusammen und erreichte 69 bis 71 Prozent Genauigkeit bei der Zuordnung von Code zum korrekten Autor, sogar für Programmierer, die während des Trainings nicht gesehen wurden.[s]

Das ist wichtig, weil anonyme Code-Beiträge in Open-Source-Projekten, Leak-Repositories und Cyberkriminalitätsuntersuchungen üblich sind. Wenn forensische Stylometrie ein Stück Malware oder eine geleakte Codebasis einem spezifischen Programmierer zuordnen kann, sind die Auswirkungen für sowohl Strafverfolgung als auch bürgerliche Freiheiten erheblich.

Die Grenzen linguistischer Beweise

Forensische Stylometrie ist mächtig, aber sie ist kein Fingerabdruck im forensischen Sinne. Juola selbst war vorsichtig zu bemerken, dass seine Analyse von Rowlings Roman die Autorenschaft nicht bewies; sie zeigte, dass Rowling „oder jemand, der überraschend wie Rowling schreibt” der wahrscheinlichste Kandidat war.[s] Die Technik funktioniert am besten als bekräftigender Beweis neben anderen Untersuchungsmethoden.

Autorenzuordnung erfordert auch ein VergleichskorpusEine Sammlung von Texten bekannter Urheberschaft, die als Referenzmaterial in der stylometrischen Analyse zur Identifizierung von Schreibmustern verwendet wird.. Als Miles Taylor sich 2020 als der anonyme „Widerständler” enthüllte, der den New York Times-Meinungsartikel von 2018 schrieb, der die Trump-Administration von innen kritisierte, war forensische Stylometrie nicht in der Lage gewesen, ihn zu identifizieren, weil er nie etwas anderes zum Vergleichen veröffentlicht hatte.[s]

Gerichte behandeln die Zulässigkeit von Beweisen der forensischen Stylometrie mit Vorsicht. Wie Linguisten bemerkt haben, haben viele amerikanische Richter und Anwälte wenig Erfahrung mit linguistischer Expertise, und die Reise von sprachlicher Koinzidenz zu zulässigem Beweis bleibt eine Fall-zu-Fall-Bestimmung.[s]

Die Spannung im Herzen der forensischen Stylometrie wird sich wahrscheinlich nicht auflösen. Dieselbe Wissenschaft, die einen Serienbomber vor Gericht brachte, kann den Schutz von denjenigen entziehen, die der Macht die Wahrheit sagen. Jeder Fortschritt in der Erkennung erzeugt neue Forschung in der Umgehung, und jedes Werkzeug, das zum Schutz der Anonymität gebaut wird, kann auch Kriminelle schützen. Der Schatten des Unabombers fällt in beide Richtungen.

Am 19. September 1995 druckte The Washington Post ein 35.000 Wörter umfassendes Manifest mit dem Titel „Industrial Society and Its Future” auf Verlangen eines unbekannten Serienbombers. Das FBI hatte 17 Jahre damit verbracht, den Fall zu verfolgen, der als UNABOMFBI-Bezeichnung für die Ermittlungen gegen Postbomben an Universitäten und Fluggesellschaften. Steht für UNiversity And Airline BOMbing. für seine Universitäts- und Fluglinien-Bombenanschlagsziele bezeichnet wurde, ohne einen Verdächtigen zu identifizieren. Der Bomber hatte drei Menschen getötet, 23 verletzt und bewusst falsche forensische Hinweise hinterlassen. Er riss die Häute von Batterien ab, um die Verfolgung zu verhindern. Er stellte sein eigenes Epoxid aus geschmolzenen Hirschhufen her, anstatt kommerzielle Klebstoffe zu verwenden.[s] Keine Fingerabdrücke, keine DNA, keine verfolgbaren Materialien blieben an irgendeinem Gerät.[s]

Was der Bomber nicht löschen konnte, war sein Schreibstil. Die Entscheidung, sein Manifest zu veröffentlichen, übergab den Ermittlern die einzige Form von Beweis, die er nicht reinigen konnte: seinen IdiolektDie einzigartige Art einer Person, Sprache zu verwenden, einschließlich charakteristischer Wortauswahl, Grammatikmuster und unbewusster sprachlicher Vorlieben., die einzigartige Konstellation von Vokabular, Syntax und unbewussten sprachlichen Gewohnheiten, die einen persönlichen Fingerabdruck in der Sprache darstellt.[s] Das Feld, das diesen Beweis ausnutzte, ist die forensische StylometrieDie quantitative Analyse des Schreibstils zur Bestimmung der Urheberschaft unter Verwendung statistischer und computergestützter Methoden zur Identifizierung charakteristischer Sprachmuster., die quantitative Analyse des Schreibstils für die Autorenzuordnung.[s]

Forensische Stylometrie in der Unabomber-Untersuchung

Die Veröffentlichung des Manifests produzierte Tausende von Hinweisen. Der entscheidende kam von David Kaczynski, dessen Frau Linda Patrik die Schreibweise als erinnernd an ihren Schwager Ted erkannte. David identifizierte charakteristische Phrasen, einschließlich „kaltblütige Logiker”, ein Begriff, den sein Bruder bevorzugte.[s]

FBI Supervisory Special Agent James Fitzgerald, der später der erste ausgebildete forensische Linguist des Büros wurde, führte einen systematischen Vergleich durch. Er katalogisierte lexikalische, orthographische und syntaktische Parallelen zwischen dem Manifest und Kaczynskis bekannter Korrespondenz. Beide Texte verwendeten britisch beeinflusste Schreibweisen: „analyse” für „analyze”, „licence” für „license”, „wilfully” für „willfully”, „instalment” für „installment”. Beide kehrten die Standard-amerikanische Redewendung um in „man kann seinen Kuchen nicht essen und ihn auch haben”. Beide verwendeten ungewöhnliches Vokabular einschließlich „chimärisch” und „bürgerliche Leere”.[s]

Soziolinguist Roger Shuy trug eine geografische Schlussfolgerung bei. Die Schreibweisen des Manifests, wie „clew” für „clue”, entsprachen Reformen, die The Chicago Tribune von den 1940ern bis zu den 1950ern gefördert hatte. Diese Reformen erlangten nie weite Verbreitung, was bedeutete, dass der Schreiber sie wahrscheinlich während seiner prägenden Jahre in oder nahe Chicago absorbiert hatte. Kaczynski war dort 1942 geboren. Das Manifest verwendete auch „Kinder aufziehen” anstatt „Kinder großziehen”, einen dialektalen Marker, der mit dem Norden der Vereinigten Staaten übereinstimmte, und Slang-Begriffe wie „broad” und „chick”, die einen Mann suggerierten, der in den 1960ern erwachsen geworden war.[s]

Die Durchsuchungsbefehl-Eidesstattliche Erklärung des FBI enthielt detaillierte nebeneinander stehende Textvergleiche. Das FBI erklärte, dass „unsere sprachliche Analyse bestimmte, dass der Autor dieser Papiere und des Manifests fast sicherlich dieselbe Person waren”.[s] Diese Analyse lieferte die rechtliche Grundlage für einen Durchsuchungsbefehl, das erste Mal, dass forensische Stylometrie in einem bundesstaatlichen Kriminalfall für diesen Zweck verwendet wurde.[s] Am 3. April 1996 verhafteten Agenten Kaczynski in seiner Hütte in Montana. Drinnen fanden sie bombenbauende Materialien, 40.000 handgeschriebene Journalseiten und eine Kopie des Manifests.

Ein bemerkenswerter Vorbehalt: Laut der Durchsuchungsbefehl-Eidesstattlichen Erklärung hatte keiner der konsultierten externen akademischen Experten unabhängig Kaczynski als Verdächtigen benannt. Die Identifizierung hing von David Kaczynskis Familienwissen kombiniert mit Fitzgeralds sprachlicher Analyse ab.[s]

Computergestützte forensische Stylometrie

Der Unabomber-Fall beruhte auf manuellem sprachlichem Vergleich. Die rechnerischen Wurzeln der Disziplin gehen auf 1964 zurück, als Frederick Mosteller und David Wallace eine dreijährige statistische Studie der Federalist Papers veröffentlichten. Sie maßen die Häufigkeit von Funktionswörtern, Artikeln, Präpositionen und Konjunktionen in umstrittenen Essays und schrieben schließlich zwölf Papiere James Madison basierend auf Bayesianischer Inferenz zu.[s]

Moderne forensische Stylometrie automatisiert und skaliert diesen Ansatz. Patrick Juolas JGAAP (Java Graphical Authorship Attribution Program) analysiert „buchstäblich Millionen verschiedener Merkmale”, laut Juola, und verfolgt Wortlängenverteilungen, die Häufigkeit der 100 häufigsten Wörter, Vier-Charakter-Gramme (Gruppen von vier benachbarten Charakteren, die Wortstämme und wortübergreifende Muster erfassen) und Wort-Bigramme (Paare benachbarter Wörter).[s]

2013 wandte Juola JGAAP an, um zu bestimmen, ob J.K. Rowling The Cuckoo’s Calling unter dem Pseudonym Robert Galbraith geschrieben hatte. Er verglich den Roman mit Rowlings The Casual Vacancy und Romanen von Ruth Rendell, P.D. James und Val McDermid. Rowling war die einzige Kandidatin, die durchgängig über alle vier unabhängigen Tests hinweg übereinstimmte. Peter Millican an der Universität Oxford führte eine parallele Analyse durch und kam zu derselben Schlussfolgerung.[s] Rowling bestätigte anschließend die Autorenschaft.

Juola betonte die Grenzen der Methode: „Forensische Stylometrie ist viel weniger zuverlässig und genau als DNA. Alles, was wir wirklich wussten, war, dass es entweder von Rowling selbst oder von jemandem war, der in einem sehr ähnlichen Stil wie Rowling schrieb”.[s]

Adversarielle Stylometrie und das Wettrüsten um die Privatsphäre

Dieselben forensischen Stylometrie-Techniken, die Kriminelle identifizieren, können Anonymität von Whistleblowern und Dissidenten entziehen. Das Privacy, Security and Automation Lab der Drexel University, geleitet von Rachel Greenstadt, entwickelte JStylo und Anonymouth, um beide Seiten dieser Gleichung zu behandeln. JStylo ordnet Autorenschaft mit 80 bis 85 Prozent Genauigkeit aus einem Pool von 40 Kandidaten zu, bei einer 6.500-Wörter-Probe. Anonymouth trainiert Schriftsteller darin, ihren Stil zu modifizieren, um der Erkennung zu entgehen.[s]

Das Teilgebiet der adversariellen Stylometrie, die bewusste Änderung des Schreibens zur Verhinderung der Zuordnung, hat zunehmend ausgeklügelte Werkzeuge hervorgebracht. Forscher haben gezeigt, dass manuelle Verschleierung die Genauigkeit der forensischen Stylometrie auf das Niveau zufälliger Vermutung reduzieren kann. Automatisierte Werkzeuge können Text iterativ modifizieren, während sie semantischen Inhalt bewahren, obwohl solche Verschleierung unvollkommen bleibt: veränderte Texte können oft als maschinenmodifiziert erkannt werden, was bedeutet, dass der Akt der Verkleidung selbst Spuren hinterlässt.

Code-Stylometrie

Forensische Stylometrie erstreckt sich jetzt über natürliche Sprache hinaus in Quellcode. Programmierer zeigen charakteristische Muster in der Variablenbenennung, Einrückung, Kommentarstil und den strukturellen Entscheidungen, die sich in abstrakten Syntaxbäumen widerspiegeln. Eine Studie von 2024 an der Universität Bologna stellte 114.400 Code-Schnipsel von 104 Open-Source-Entwicklern zusammen und trainierte einen k-nächste-Nachbarn-Klassifikator auf code2seq-Einbettungen. Das System erreichte 69 bis 71 Prozent Genauigkeit bei der Zuordnung von Code zu einzelnen Autoren, einschließlich Autoren, die im Trainingsset fehlten.[s]

Frühere Arbeit von Aylin Caliskan-Islam und Kollegen an der Drexel University, präsentiert bei USENIX Security 2015, zeigte, dass abstrakte Syntaxbaum-Merkmale besonders widerstandsfähig gegen Verschleierung sind, was Code-Stylometrie robuster als textbasierte Ansätze gegen bewusste Verkleidung macht.[s]

Beweisnormen und Grenzen

Beweise der forensischen Stylometrie stehen vor Prüfung in Gerichten. Ihre Zulässigkeit hängt von Jurisdiktion und Methodologie ab, typischerweise bewertet unter etablierten Standards für wissenschaftliche Zuverlässigkeit.[s] Wie Rechtsgelehrte Peter Tiersma und Lawrence Solan bemerkten: „Die große Mehrheit amerikanischer Anwälte und Richter hat wenig oder keine Erfahrung mit sprachlicher Expertise in einer rechtlichen Angelegenheit”.[s]

Die Technik hat auch strukturelle Beschränkungen. Sie erfordert ein VergleichskorpusEine Sammlung von Texten bekannter Urheberschaft, die als Referenzmaterial in der stylometrischen Analyse zur Identifizierung von Schreibmustern verwendet wird. bekannter Schriften; als Miles Taylor sich 2020 als der anonyme Autor eines New York Times-Meinungsartikels und Buchs enthüllte, das die Trump-Administration kritisierte, war forensische Stylometrie daran gescheitert, ihn zu identifizieren, weil er keine vorherigen Veröffentlichungen hatte.[s] Kurze Texte bleiben schwierig zuverlässig zu analysieren. Und Autorenzuordnung in mehrsprachigen oder kollaborativen Schreibkontexten führt zusätzliche Komplikationen ein, die aktuelle Modelle schlecht handhaben.

Das Feld entwickelt sich weiter. Maschinenlernmodelle haben die Genauigkeit in kontrollierten Einstellungen mit bekannten Autorenpools weiter verbessert. Aber die grundlegende Spannung besteht fort: jede Verbesserung in der forensischen Stylometrie, die hilft, einen Bomber zu fangen, verengt auch den Raum, in dem ein Whistleblower sicher sprechen kann. Der Schatten des Unabombers, geworfen von 35.000 Wörtern im Jahr 1995, fällt immer noch auf beide Seiten dieser Linie.

Wie hat Ihnen dieser Artikel gefallen?
Artikel teilen

Fehler gefunden? Melden Sie ihn

Quellen