Verkohlte Schriftrollen: KI macht das Unlesbare lesbar
Es sind Bilder, die die Forschung an alten Handschriften für immer verändern könnten. Fachleute um den Computerwissenschaftler Brent Seales von der University of Kentucky veröffentlichten bei einer Pressekonferenz am 12. Oktober 2023 CT-Aufnahmen von verkohlten Schriftrollen aus dem antiken Herculaneum: Auf den Bildern sind nicht nur einzelne Buchstaben, sondern ganze Wörter, Zeilen und Textkolumnen zu erkennen. Derart viel Text sichtbar zu machen, der im Inneren geschlossener Papyrusrollen steckt, galt lange als kaum lösbares Unterfangen. Doch im Rahmen eines Wettbewerbs ist dies nun Luke Farritor und Youssef Nader, zwei Studenten der Computerwissenschaften, gelungen. Mit Hilfe einer künstlichen Intelligenz werteten sie röntgentomografische Aufnahmen von einer verkohlten Schriftrolle aus Herculaneum aus. Dabei bauten sie auf den Ergebnissen einer großen Online-Community auf, die sich an dem von Sponsoren ausgeschriebenen Wettbewerb »The Vesuvius Challenge« beteiligte.
Auf den hoch aufgelösten CT-Scans, die Seales und sein Team zuvor mit einem Teilchenbeschleuniger aufgezeichnet hatten, arbeitete Farritor auf einer winzigen Fläche mehrere Buchstaben und ein vollständiges Wort heraus. Nader, ein Robotikstudent aus Ägypten, der zurzeit an der Freien Universität Berlin studiert, entzifferte bald danach dieselbe Stelle und bestätigte Farritors Ergebnis: Neben einzelnen Buchstaben wurde ein altgriechisches Wort sichtbar, das »purpurfarben«, »purpurfarbene Kleidung« oder »Purpurfarbstoff« bedeuten könnte. Auf einer Pressekonferenz stellte Seales' Team zudem eine weitere, noch umfangreichere Entdeckung von Nader vor: In derselben Buchrolle entzifferte er einen Ausschnitt von mindestens vier Textspalten, die sich jeweils über sechs Zeilen erstrecken.
»Das ist der Wahnsinn«, erklärte eine sichtlich begeisterte Federica Nicolardi, Papyrologin an der Università degli Studi di Napoli Federico II in Neapel, während der Pressekonferenz. Sie und weitere Fachkollegen befassten sich bereits mit dem Ausschnitt. Dabei waren ihnen spezielle Zeichen zur Interpunktion aufgefallen: Der oder die Schreiber hatten sie gesetzt, um womöglich »Pausen im Text zu kennzeichnen«, so Nicolardi.
Den gesamten Textkontext habe man noch nicht erfasst, doch nach dem, was man bislang über die Bibliothek in Herculaneum weiß, dürfte es sich um eine philosophische Schrift aus der Schule der Epikureer handeln. In vielerlei Hinsicht sind die Zeilen laut Nicolardi aber »komplett neu«. Das Besondere sei zudem, dass der vorliegende Text direkt aus der Antike stamme. Denn die fast 2000 Jahre alte Handschrift ist nicht wie die allermeisten antiken Schriften das Ergebnis eines jahrhundertelangen Kopierprozesses, in dem Gelehrte und Mönche die Texte immer wieder abschrieben und teils auch editierten.
Verkohlt und verbacken
Die gescannte Schriftrolle, die sich heute am Institut de recherche et d'histoire des textes in Paris befindet, stammt ursprünglich aus der Bibliothek der so genannten Villa dei Papiri, eines antiken Anwesens in Herculaneum am Fuß des Vesuv. Beim Ausbruch des Vulkans im Jahr 79 n. Chr. wurde der Ort verschüttet, zusammen mit dem benachbarten Pompeji. Sehr nah am Berg gelegen, wurde Herculaneum aber nicht nur unter Vulkangeröll begraben, sondern auch von heißen Schlammlawinen überrollt. Davon umschlossen, verkohlten die Buchrollen und wurden von der später zu Stein gewordenen Vulkanmasse konserviert.
Nachdem Arbeiter um 1750 beim Bau eines Brunnenschachts auf einen Mosaikboden der Villa gestoßen waren, ließ König Karl VII. von Neapel und Sizilien Tunnel durch das Gebäude graben – in der Hoffnung, antike Kunstwerke für seine königliche Sammlung zu finden. Dabei entdeckten die Ausgräber auch hunderte Buchrollen, die fast alle verkohlt und deren »Seiten« miteinander verbacken waren. Ihre Bedeutung erkannten Gelehrte erst einige Jahre später.
Als einzige Bibliothek, die unberührt seit der Antike erhalten geblieben ist, bieten die Herculaneum-Papyri einen beispiellosen Zugang zur Vorstellungswelt der vorchristlichen Antike. Und seit dies klar war, hielten die Nachrichten aus Herculaneum das gebildete Europa in Atem.
Allerdings haben die Versuche, die karbonisierten und mehr als zehn Meter langen Papyrusrollen zu zerlegen, gut die Hälfte von zirka 800 Buchrollen in Bruchstücke verwandelt. Auf den verbliebenen Fragmenten Worte und Sätze zu rekonstruieren, ist seither die Arbeit der Papyrologinnen und Papyrologen in der Nationalbibliothek in Neapel. Auf den Fetzen einen fortlaufenden Text zu entdecken oder gar den Stil eines Autors zu identifizieren, erwartete dort bislang niemand.
Auch die Buchrollen, die nie geöffnet wurden, liegen heute in den Regalen der Officina dei Papiri in Neapel. Der Gedanke, in ihnen mit Hilfe der Röntgentechnik nach Texten zu suchen, kam allerdings nie auf – bis 2002.
Schwarze Schrift auf schwarzem Grund
Damals begannen mehrere Forschungsgruppen, mit moderner Röntgenbildgebung Exemplare zu untersuchen, doch letztlich immer erfolglos. Das Problem: Die Tinte, die im Wesentlichen aus Kohlenstoffpigment besteht, produziert auf dem verkohlten Papyrus keinen erkennbaren »Schatten« aus absorbierter Röntgenstrahlung. Mutmaßlich erhaltene Schrift zeichnet sich also schlicht nicht ab. Brent Seales, Leiter des EduceLab an der University of Kentucky, hat gut 20 Jahre mit diesem Problem gekämpft. Mit der rasanten Entwicklung selbstlernender Algorithmen in den vergangenen Jahren rückte für seine Forschungsgruppe aber eine Lösung in greifbare Nähe. Könnte in den tomografischen Aufnahmen, jedenfalls in den hoch aufgelösten, nicht doch ein Signal der Tinte enthalten sein? Wonach er suchte, was aber vorerst noch unentdeckt blieb, nannte Seales den »morphologischen Kontrast«: dass sich die Buchstaben auf der Papyrusoberfläche also morphologisch, etwa durch dreidimensionale Strukturen, abzeichnen, die von der Tinte herrühren und vom Scan erfasst wurden.
2019 präsentierte Seales dann auf einer Konferenz in Malibu zum ersten Mal die Aufnahme eines Buchstabens, der in der zweiten Lage eines Papyrusfragments verborgen liegt. Noch im selben Jahr konnte das Team aus Kentucky zwei vollständige herculanische Papyrusrollen am Diamond Light Source, einem Teilchenbeschleuniger im englischen Oxfordshire, durchleuchten lassen. Für den Transport der Rollen, die im Institut de recherche et d'histoire des textes in Paris aufbewahrt werden, musste eine Genehmigung eingeholt werden, der – bisher jedenfalls – ein jahrelanger bürokratischer Prozess vorausging. Das Scan-Ergebnis schuf jedoch die Grundlage für den jetzigen Forschungserfolg: Das Synchrotron produzierte hoch aufgelöste Bilder von bislang unerreichter Qualität.
Zugleich konnte Seales' Team seine selbstlernenden Algorithmen Schritt für Schritt weiterentwickeln. Was bislang jedoch fehlte, war ein echter Durchbruch.
Ein Wettbewerb beschleunigte die Forschung
Im März 2023 wurde daher die Vesuvius Challenge ausgerufen – ein Wettbewerb, finanziert von zwei Unternehmern aus der Tech-Branche und organisiert von Seales' EduceLab. Für neue Erkenntnisse lobten die Gründer mehrere Geldprämien aus. Dieses Format erwies sich als unerwarteter Forschungsmotor – plötzlich gab es im Monatstakt neue Ergebnisse, wo jahrelang Stillstand herrschte.
Seit Beginn des Wettbewerbs haben die Sponsoren bereits vielfach kleine Preisgelder vergeben – vor allem für Fortschritte, die den Werkzeugkasten der Papyruserkennung erweiterten. Der Hauptpreis von 700 000 US-Dollar ist für den ersten Teilnehmenden vorgesehen, der noch innerhalb 2023 vier Passagen von je 140 Buchstaben in den Rollen lesbar machen kann. Rund 100 Teams tauschen sich derzeit in Foren untereinander aus, um Fortschritte zu erzielen.
So beschäftigen sich Gruppen von »Segmentierern« damit, die gescannte Schriftrolle am Computer in einzelne Schichten zu zerlegen. Das schuf die Grundlage, den »morphologischen Kontrast« zu entdecken. Der Physiker und Unternehmer Casey Handmer stieß als Erster darauf: Er hatte sich stundenlang durch Aufnahmen geklickt und Stellen herangezoomt, bis ihm schwache Hinweise auf Buchstaben auffielen. Auf der Papyrusoberfläche machte er ein »crackle pattern« aus – Stellen, an denen sich Risse gebildet hatten, wie in Schlamm, der in der Sonne trocknet. Und jene aufgerauten Flächen ergaben die Form von Buchstaben.
Mehrere Teilnehmende arbeiteten an Handmers Beobachtung weiter – am erfolgreichsten der 21-jährige Luke Farritor, der an der University of Nebraska–Lincoln studiert und zeitweise als Praktikant beim privaten Raumfahrtunternehmen SpaceX tätig war. Er trainierte seinen Algorithmus auf ebendieses Muster.
Als das Segmentierteam den Teilnehmern eine Papyrusfläche zur Verfügung stellte, die besonders viele »crackle pattern« enthielt, produzierte Farritors Verfahren genügend altgriechische Buchstaben, um ein ganzes Wort abzubilden, das sich auch lesen ließ: »πορφύ̣ρ̣ας̣« oder »πορφυ̣ρ̣ᾶς̣«, was übersetzt »purpurfarben«, »purpurfarbene Kleidung« oder »Purpurfarbstoff« bedeuten könnte. Da der inhaltliche Kontext noch unklar ist, könnte dort aber auch »πορφύ̣ρ̣α σκ[---« oder »πορφυ̣ρ̣ᾶ σκ[---« stehen, wie das Expertenteam erklärt.
40 000 US-Dollar für die ersten zehn Buchstaben
Etwas einfacher als der Hauptpreis der Vesuvius Challenge war damit der Preis zu erreichen, der für die ersten zehn entzifferten Buchstaben auf einer Fläche von vier Quadratzentimetern vergeben wurde. Dieser Fund setzte aber Farritors methodischen Durchbruch voraus. Und so gewann der Student 30 000 des ursprünglich mit 40 000 US-Dollar dotierten Preises. Youssef Nader, der seine Lösung etwas später einreichte, erhielt dafür immerhin noch 10 000 US-Dollar. Er hat allerdings durch den Abschnitt mit mindestens vier Textkolumnen, der die Papyrologen in Atem halten wird, gezeigt, dass es sehr wohl möglich ist, eine weitaus größere Zahl an Zeilen und Spalten sichtbar zu machen.
Naders Verfahren beruht auf einem Wettbewerb im Wettbewerb. Er zielte auf die algorithmische Erkennung der Tinte ab und eröffnete eine »challenge« auf der Plattform Kaggle. Mit den Röntgenaufnahmen von kleinen Papyrusfragmenten, auf denen die Tinte noch zu erkennen war, trainierten die Teilnehmenden dort ihre Software auf eine Tinte, die das »crackle pattern« nicht aufwies. Wenn sich dieses Verfahren bestätigt – und alles spricht dafür –, wird die Entdeckung der Bibliothek von Herculaneum, die mehr als 250 Jahre lang unvollendet geblieben ist, vielleicht bald gelingen.
Auch Fachleute, die nicht am Projekt der University of Kentucky beteiligt sind, beurteilen die Bilder aus der Buchrolle als wichtigen Forschungserfolg. »Ich bin sehr beeindruckt«, sagte Jürgen Hammerstaedt von der Universität Köln. Den Papyrologen überraschte vor allem die Geschwindigkeit, mit der die Vesuvius Challenge zu ersten Ergebnissen führte. »Was die Suche nach Texten in geschlossenen Rollen betrifft, ist das der größte Fortschritt bisher.« Ähnlich wie Hammerstaedt äußerte sich Kilian Fleischer, Papyrologe an der Università di Pisa: »Darauf habe ich 15 Jahre gewartet!«, sagt der Experte für die herculanischen Rollen. »Wenn sich das Verfahren bewährt, und danach sieht es aus, werden wir in den nächsten Jahren hunderte neue Texte bekommen. Für uns ist das eine Revolution.«
Diesen Moment sieht wohl auch Fabrizio Diozzi in absehbarer Zukunft kommen. So sagte der ehemalige Direktor der Papyrusabteilung an der Nationalbibliothek in Neapel, nachdem er die neuen Bilder vor der Presseveranstaltung auf einer Fachkonferenz in Kentucky gesehen hatte: »Heute bin ich ein glücklicher Mensch.«
Anmerkung der Redaktion: Wir haben den Beitrag am 13. Oktober 2023 um die Kommentare von Jürgen Hammerstaedt und Kilian Fleischer ergänzt.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.