Künstliche Intelligenz „entschlüsselt“ das Römische Reich, bringt die Wahrheit der tausendjährigen Inschriften wieder ans Licht. Ein neues Modell von DeepMind erscheint erneut in der Zeitschrift Nature.
Im Lied "Love Before the Western Calendar" heißt es: „Wenn die alte Zivilisation nur noch unverständliche Sprachen hinterlässt, werden die Legenden unsterbliche Gedichte.“ Mit dem generativen KI-Tool Aeneas von DeepMind sind Archäologen nun bei der Entschlüsselung alter Inschriften nicht mehr ratlos.
Aeneas war ursprünglich ein wandernder Held aus der griechischen Mythologie.
Der in der Hauptausgabe von Nature am 24. Juli vorgestellte Aeneas ist ein multimodaler generativer neuronaler Netzwerk, der Historikerinnen und Historikern dabei hilft, beschädigte Texte besser zu interpretieren, einzuordnen und zu restaurieren.
Stellen Sie sich vor, Archäologen entdecken in Europa eine Inschrift mit alten Schriftzeichen. Der Text ist unvollständig, einige Zeichen sind verwittert oder absichtlich zerstört.
Es gibt auch keine Kontextinformationen, was es fast unmöglich macht, die Inschrift zu restaurieren, zu datieren und ihren Ursprung zu bestimmen, insbesondere wenn es um ähnliche Inschriften geht.
Denken Sie daran, dass in der römischen Welt Schriftzeichen überall zu finden waren - von Kaiserlichen Denkmälern bis hin zu alltäglichen Gegenständen. Von politischen Graffiti, Liebesgedichten und Grabinschriften bis hin zu Geschäftlichen Transaktionen, Geburtseinladungen und magischen Zaubersprüchen.
Abbildung 1: Eine von Aeneas restaurierte bronzeene militärische Anweisung aus dem Jahr 113/14 n. Chr. von Sardinien, erteilt von Kaiser Trajan an die Seeleute eines Kriegsschiffs
Diese Inschriften bieten modernen Historikerinnen und Historikern reichhaltige Erkenntnisse und enthüllen die Vielfalt des alltäglichen Lebens in der römischen Welt.
Aber sie erhöhen auch die Schwierigkeit der archäologischen Arbeit. Archäologen müssen sich auf ihr Fachwissen verlassen und in ihren eigenen Datenbanken nach ähnlichen Texten suchen - Texte, die in Bezug auf Wortwahl, Syntax, Standardformeln oder Herkunft ähnlich sind.
Aber ist das Suchen nach ähnlichen Informationen und das Bestimmen des Kontexts für einen Artikel nicht genau das, was generative Modelle gut können?
Daher ist Aeneas aufgetaucht. Er kann über Tausende von lateinischen Inschriften hinweg schließen und in wenigen Sekunden Texte und kontextuell ähnliche Texte finden. Diese Beschleunigung befreit Archäologen von der komplexen und zeitaufwändigen Arbeit des Textensuchens.
Jetzt können sie schnell Interpretationen von alten Inschriften erhalten und auf Grundlage der Modellefindungen weitere Forschungen anstellen.
Abbildung 2: Die Benutzeroberfläche von Aeneas
Die vielfältigen Funktionen von Aeneas
Vor der Entstehung von Aeneas hat DeepMind 2022 Ithaca vorgestellt, ein Tool, das auf einem tiefen neuronalen Netzwerk basiert, um die Zeitspanne von griechischen Inschriften vorherzusagen und fehlende Texte zu ergänzen.
Aeneas geht einen Schritt weiter. Er kann Historikerinnen und Historikern helfen, Texte zu interpretieren, indem er Kontextinformationen liefert und isolierte Fragmente Bedeutung verleiht, um reichhaltigere Schlussfolgerungen zu ziehen und ein besseres Verständnis der alten Geschichte zu entwickeln.
Konkret gesucht er in einer riesigen Sammlung von lateinischen Inschriften nach parallelen Texten. Indem er jeden Text in eine Art historische Fingerabdruck umwandelt, kann Aeneas die tiefen Zusammenhänge zwischen Texten erkennen.
Bei der Vorhersage von Zeitspanne und Herkunft kann Aeneas Texte innerhalb eines Zeitraums von 13 Jahren in den Zeitrahmen setzen, den Historikerinnen und Historikern vorgeben, und Inschriften mit einer Genauigkeit von 72 % in eine von 62 alten römischen Provinzen einordnen.
Als erstes Modell, das multimodale Eingaben nutzt, um die geografische Herkunft von Texten zu bestimmen, kann es gleichzeitig Text- und visuelle Informationen analysieren, wie z. B. Bilder von Inschriften.
Im Gegensatz zu Ithaca, das nur einzelne Wörter vorhersagen kann, kann Aeneas fehlende Abschnitte in Texten mit unbekannter Länge restaurieren.
Aeneas kann beschädigte Inschriften mit bis zu zehn fehlenden Zeichen mit einer Genauigkeit von 73 % restaurieren. Wenn die Länge der fehlenden Abschnitte unbekannt ist, beträgt die Genauigkeit immer noch 58 %.
Das macht ihn zu einem universelleren Werkzeug für Historikerinnen und Historiker, die mit stark beschädigten Materialien arbeiten.
Aeneas eignet sich nicht nur für Inschriften, sondern kann auch auf andere alte Sprachen, Schriftzeichen und Medien angepasst werden, von Papyrus bis hin zu Münzen, um seine Funktionen zu erweitern und eine breitere Palette historischer Beweise zu verbinden.
Wer Aeneas ausprobieren möchte, kann sich auf predictingthepast.com anmelden und es interaktiv nutzen.
Als Open-Source-Software können chinesische Archäologen Aeneas auch anpassen, um ihn zur Entschlüsselung von verschollenen chinesischen Schriftzeichen wie der Xixia-Schrift und der Khitan-Schrift zu nutzen.
Funktionsweise und typisches Beispiel
Um Aeneas zu trainieren, haben die Forscher von DeepMind sorgfältig einen riesigen und zuverlässigen Datensatz zusammengestellt, indem sie die Arbeit von Historikerinnen und Historikern über Jahrzehnte hinweg genutzt haben. Dieser Datensatz umfasst Texte und Bilder von Inschriften aus der griechischen und römischen Antike.
Aeneas nutzt den "Kampfriesen" im Bereich der natürlichen Sprachverarbeitung, das Transformer-Modell, um die Eingabe von Inschriftentexten zu verarbeiten und über einen Decoder ähnliche Inschriften zu finden und nach Relevanz zu sortieren.
Für jede Inschrift nutzt Aeneas' Kontextualisierungsmechanismus eine Technik namens Embedding, um eine Reihe von Ähnlichkeiten zu finden - indem er die Text- und Kontextinformationen jeder Inschrift in eine Art historische Fingerabdruck kodiert, der den Textinhalt, die Sprache, die Herkunftszeit und -ort sowie die Beziehung zu anderen Inschriften enthält.
Abbildung 3: Die Architektur von Aeneas, die zeigt, wie das Modell Text- und Bild-Eingaben erhält, um Vorhersagen zu Provinz, Datum und Restaurierung zu generieren
Jetzt sehen wir uns ein typisches Beispiel für die Analyse von alten Texten durch Aeneas an.
Der römische Kaiser Augustus hat sein Selbstzeugnis "Res Gestae Divi Augusti" verfasst, eine berühmte Stele in der römischen Geschichte. Diese Inschrift wurde von Augustus selbst verfasst und ist eine Zusammenfassung seiner selbstverherrlichenden Lebensleistungen.
Im Text gibt es überzogene Beschreibungen des Reiches, irrelevante Daten und falsche geografische Markierungen. Auch über die Zeit der Verfassung besteht in der Wissenschaft Uneinigkeit.
Historikerinnen und Historiker streiten seit langem über die Zeitspanne dieser Inschrift. Aeneas analysiert die unklare Zeitspanne und die Herkunftseigenschaften aller Inschriften im Kontext.
Er erfasst Hinweise in der Rechtschreibung und Vokabeln sowie sprachliche Feinheiten, die auf subtilen politischen Ideologien und Reichszugehörigkeiten hinweisen.
Seine Vorhersage basiert auf den subtilen sprachlichen Merkmalen und historischen Markierungen im Text, wie offiziellen Titeln und Denkmälern.
Indem er das Datierungsproblem in eine Wahrscheinlichkeitsabschätzung auf der Grundlage von sprachlichen und kontextuellen Daten umwandelt.
Interessanterweise sagt Aeneas kein festes Datum voraus, sondern erzeugt eine detaillierte Darstellung einer möglichen Datumsverteilung, wie in Abbildung 4 gezeigt.
Seine Vorhersage zeigt zwei deutliche Spitzen. Eine kleinere Spitze tritt um 10 - 1 v. Chr. auf, eine größere und sichere Spitze zwischen 10 - 20 n. Chr.
Diese Ergebnisse zeigen, dass Aeneas vorsichtig vorhersagt und die Unterschiede in den Meinungen der heutigen Wissenschaftler widerspiegelt.
Das Vorhersagen von zwei möglichen Zeiträumen anstelle eines einzigen Datums zeigt sogar, dass Aeneas eine neue, quantitative Methode für historische Debatten bieten kann.
Abbildung 4: Ein Histogramm der Datumsvorhersage von Aeneas für das "Res Gestae Divi Augusti", das Modell simuliert die akademische Debatte um die Datierung dieser berühmten Inschrift
In letzter Zeit gab es viele Versuche, KI-Technologie in der Archäologie anzuwenden, von der Gesichtserstellung von namenlosen Soldaten bis hin zur Erstellung digitaler virtueller Vertreter von alten Menschen in Museen. Die Anwendung von KI in der Archäologie und Geschichte ist auf jeden Fall bemerkenswert.
Letztes Jahr hat die Fudan-Universität sogar einen Kurs "KI in der Archäologie" eröffnet. Das Labor für Deep Learning und Visuelle Berechnung der South China University of Technology (SCUT - DLVCLab) hat auch ein großes Modell namens Tonggu entwickelt, das sich auf die Verarbeitung von klassischen chinesischen Texten konzentriert.
Angesichts der unzähligen alten chinesischen Bücher und Inschriften werden zukünftige Archäologen vielleicht noch mehr auf Werkzeuge wie Aeneas angewiesen sein, um aus den riesigen Datenmengen Gold zu schürfen.
Quellen
https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/
https://www.nature.com/articles/d41586-025-02335-x
https://blog.google/technology/google-deepmind/aeneas/
Dieser Artikel stammt aus dem WeChat - Account "New Intelligence Yuan", Autor: peter Dong Yingzhi, veröffentlicht von 36Kr mit Genehmigung.