首页文章详情

Aufzeichnungen eines Nobelpreisträgers über die Katastrophengefahr für die Menschheit: Über den "37. Schritt" der KI und die Kardashev-Typ-I-Zivilisation

36氪的朋友们2025-07-25 12:15
Alphas Go's "göttlicher Zug" weist auf die kritische Schwelle der AGI hin, Hassabis warnt vor der Endzeit-Risiken.

Im Duell zwischen AlphaGo und dem Go-Weltmeister Lee Sedol im Jahr 2016 spielte AlphaGo in der zweiten Partie einen unerwarteten Zug, den 37. Zug. Obwohl dieser Zug zunächst als unkonventionell und sogar von damaligen Go-Kommentatoren als Fehler angesehen wurde, erwies er sich schließlich als ein äußerst weitreichender und präziser Zug, der AlphaGo den Sieg verschaffte. Dieser Zug wurde als " Göttlicher Zug " gefeiert.

Der "37. Zug" wurde später zu einem wichtigen Symbol im Bereich der Künstlichen Intelligenz. Er repräsentiert die plötzlichen, innovativen und übermenschlichen Intuition hinausgehenden Durchbrüche, die KI in komplexen Entscheidungen erzielen kann.

Kürzlich nahm der Nobelpreisträger für Chemie und Chefexecutive von Google DeepMind, Demis Hassabis, an der bekannten Podcast-Sendung des AI-Experten Lex Fridman teil.

Bei diesem Gespräch wurde eingehend über allgemeine Künstliche Intelligenz (AGI), die Modellierung natürlicher Systeme, wissenschaftliche Kreativität und die zukünftigen Aussichten der menschlichen Zivilisation diskutiert.

All diese Diskussionen führen zu einem nachdenklichen Thema: Hat die KI bereits den "37. Zug" erreicht? AlphaGo spielte diesen subversiven 37. Zug, bevor die Menschen die Gesamtlage erkannten. Steht die heutige KI nun auch kurz davor, einen technologischen Wendepunkt zu erreichen?

Darüber hinaus warnte Hassabis davor, dass obwohl die KI ein enormes Potenzial für Veränderungen birgt, sie auch mit unvorhersehbaren Risiken verbunden ist. Er betonte, dass der Fortschritt der KI "Endzeitszenarien" auslösen könnte, insbesondere wenn die Technologie außer Kontrolle gerät oder missbraucht wird.

Nachfolgend die Kernaussagen des Gesprächs:

  1. Hassabis ist der Meinung, dass alle natürlichen Modelle, die generiert oder entdeckt werden können, effizient mit klassischen Lernalgorithmen modelliert werden können, insbesondere in Bereichen wie Biologie, Chemie und Physik.
  2. Die Wahrscheinlichkeit, dass bis 2030 eine AGI erreicht wird, liegt bei etwa 50 %. Er hat auch markante Kriterien für die Prüfung einer AGI vorgeschlagen, wie das Formulieren neuer wissenschaftlicher Vermutungen oder das Erfinden komplexer Spiele wie Go.
  3. Der Evolutionsprozess in der Natur gibt Systemen eine Struktur, die von KI gelernt und für die Modellierung genutzt werden kann. Beispielsweise lösen AlphaGo und AlphaFold komplexe Probleme durch intelligente Suchverfahren.
  4. Zwar wurde früher angenommen, dass das Verständnis physikalischer Gesetze eine eingebettete KI erfordert, aber Veo 3 hat durch das Beobachten von Videos eine ähnliche Verständnisfähigkeit gezeigt, was diese Ansicht in Frage stellt.
  5. Hassabis hat in der Vergangenheit mit Elon Musk über die Zusammenarbeit bei der Entwicklung von Spielen gesprochen. Bis heute hofft er, dass es noch eine Gelegenheit für eine Zusammenarbeit auf diesem Gebiet geben wird.
  6. In Zukunft kann KI für Spieler maßgeschneiderte Spielwelten schaffen. KI kann auf Basis der Entscheidungen der Spieler automatisch Handlungsabläufe generieren, was die Immersion und Flexibilität von Spielen erhöht.
  7. Fusion und Sonnenenergie werden die Hauptenergien der Zukunft sein. Die Lösung des Energieproblems könnte den Menschen den Sprung zur Kardashev-Typ-I-Zivilisation ermöglichen.
  8. Hassabis hält die Strategie von Meta, Mitarbeiter mit hohen Gehältern zu gewinnen, für sinnvoll, da Meta derzeit in der Spitze der KI-Forschung hinterherhinkt. Die Gehälter von Praktikanten übersteigen inzwischen die gesamte Anfangsinvestition von DeepMind.
  9. Hassabis meint, dass wir in die Zeit der "KI-generierten Benutzeroberflächen" eintreten werden – Oberflächen, die auf die individuellen Bedürfnisse der Benutzer zugeschnitten sind, ihre Ästhetik, Gewohnheiten und Denkweise berücksichtigen und von KI dynamisch für die jeweilige Aufgabe generiert werden.
  10. Hassabis ist der Ansicht, dass obwohl die "Endzeitwahrscheinlichkeit" nicht quantifiziert werden kann, die Risiken und Unsicherheiten der KI-Technologie nicht vernachlässigt werden dürfen. Wir müssen eine vorsichtig optimistische Haltung einnehmen.

Demis Hassabis, Chefexecutive von Google DeepMind

Nachfolgend die Zusammenfassung des Interviews:

01. Wie KI die natürliche Evolution imitiert

Fridman: In deiner Nobelpreis-Rede hast du eine sehr interessante These aufgestellt: " Alle Modelle, die in der Natur generiert oder entdeckt werden können, können effizient mit klassischen Lernalgorithmen entdeckt und modelliert werden. " Welche Bereiche denkst du, könnten hierfür in Frage kommen? Biologie, Chemie, Physik oder Kosmologie, Neurowissenschaften?

Hassabis: Ich denke, es ist eine Tradition bei Nobelpreis-Reden, etwas Provokatives zu sagen. Also habe ich auch so etwas in die Runde geworfen.

Wenn man sich unsere Arbeiten ansieht, insbesondere die Projekte der "Alpha-Serie" – etwa AlphaGo (das KI-System, das den Go-Weltmeister besiegte) und AlphaFold (das KI-System, das die dreidimensionale Struktur von Proteinen vorhersagt) – wird man feststellen, dass diese Systeme eigentlich Modelle für sehr komplexe kombinatorische Räume erstellen. Wenn man versuchen würde, den besten Zug im Go oder die genaue Struktur eines Proteins durch brute-force-Berechnungen zu finden, würde man die Zeit des gesamten Universums vergeuden.

Deshalb müssen wir klüger vorgehen. In beiden Projekten haben wir intelligente Modelle für diese Umgebungen erstellt und dadurch die Suche so geführt, dass das Problem lösbar wurde. Nehmen wir das Proteinfaltungsproblem. Dies ist ein natürlicher Prozess, den die Physik erklärt hat. Proteine falten sich in unseren Körpern in wenigen Millisekunden, was bedeutet, dass die Physik hier ein Problem gelöst hat, und wir haben es nun auch rechnerisch geschafft, diesen Prozess zu simulieren.

Ich denke, diese Möglichkeit besteht, weil natürliche Systeme eine eigene Struktur haben. Diese Systeme haben sich im Laufe einer langen Evolutionszeit entwickelt und haben daher gewisse "Muster". Wenn diese Strukturierung stimmt, können wir vielleicht etwas daraus lernen.

Fridman: Du hast gerade gesagt, dass alles, was sich entwickeln kann, effizient modelliert werden kann. Wie viel stimmt da drin?

Hassabis: Manchmal benutze ich den Begriff "Überleben des Stabilsten", um das zu erklären.

Ja, es gibt die Evolution von Lebewesen, aber auf geologischer Zeitskala wird die Form von Bergen durch Millionen von Jahren der Erosion geprägt; selbst in der Kosmologie haben Planetenbahnen, die Form von Asteroiden usw. einem gewissen "Überlebensprozess" unterworfen.

Wenn dies stimmt, sollte es ein rückwärts lernbares Modell geben, eine Art Mannigfaltigkeit, die uns hilft, effizient die richtige Lösung und die richtige Form zu finden und vorherzusagen – denn es handelt sich nicht um ein zufälliges Modell.

Für künstliche oder abstrakte Dinge, wie etwa eine Zersetzung, mag dies nicht funktionieren. Wenn es im digitalen Raum keine Modelle gibt oder wenn diese gleichmäßig verteilt sind, gibt es nichts zu lernen, keine Modelle, die die Suche unterstützen können, und man muss auf brute-force-Berechnungen zurückgreifen.

In einem solchen Fall braucht man vielleicht ein Werkzeug wie einen Quantencomputer. Die meisten natürlichen Dinge, die uns interessieren, sind aber nicht so. Ihre Struktur hat sich aus einem Grund entwickelt und hat die Zeit überdauert. Wenn das so ist, denke ich, dass neuronale Netze diese Strukturen lernen können. Diese Systeme können effizient neu entdeckt oder rekonstruiert werden, weil die Natur nicht zufällig ist. Alles um uns herum, einschließlich der stabileren Elemente, unterliegt einem Auswahlprozess.

02. Google Veo 3 und das Verständnis der Realität

Fridman: Ich finde das Video-Generierungsmodell Veo 3 wirklich erstaunlich. Viele Leute sagen, dass die generierten Videos lustig und mit vielen Memes gefüllt sind, wie lustige Kurzfilme oder Memevideos. Aber ich finde, das Wichtigste ist, dass es die menschlichen Bewegungen sehr natürlich darstellt und die Bilder sehr realistisch aussehen. Mit der Einbeziehung der Originalstimmen wirkt das Ganze sehr "menschlich". Aber das Wichtigste, was du auch schon erwähnt hast, ist, dass es anscheinend die physikalischen Gesetze " versteht ".

Hassabis: Ja, genau.

Fridman: Veo 3 ist noch nicht perfekt, aber es ist schon sehr gut. Die Frage ist, wie gut muss es die Welt verstehen, um das zu können? Manche Leute meinen, dass AI-Systeme wie Diffusionsmodelle überhaupt kein "Verständnis" haben. Ich sehe das anders. Wenn es gar nichts verstehen würde, wie könnte es diese Videos erstellen? Das bringt eigentlich die Definition des Begriffs "Verständnis" auf den Prüfstand. Wie gut denkst du, versteht Veo 3 die Welt?

Hassabis: Ich denke, es hat auf jeden Fall ein gewisses "Verständnis". Zumindest kann es die nacheinanderfolgenden Bilder in einem Video vorhersagen, und das ist schon keine leichte Aufgabe. Natürlich ist sein Verständnis nicht so tiefgründig wie das der Menschen, nicht so wie wir es in der Philosophie verstehen. Aber man kann sagen, dass es die Funktionsweise der Welt sehr gut simuliert. Beispielsweise kann es ein achtsekundiges Video generieren, das sehr natürlich aussieht und kaum zu beanstanden ist. Der Fortschritt ist unglaublich schnell.

Alle mögen die Videos von Talkshowhosts, die es generiert. Es imitiert die Rede und Bewegungen von Menschen sehr realistisch. Aber was mich persönlich am meisten beeindruckt, ist seine Fähigkeit, physikalische Effekte wie Licht, Materialien und Flüssigkeiten in der realen Welt zu simulieren. Das ist wirklich erstaunlich.

Es scheint eine Art "Intuitive Physik" zu verstehen. So wie ein Kind weiß, dass Wasser aus einem umgestürzten Becher fließt oder dass ein Ball, wenn er herunterrollt, herunterfällt – ein intuitives Verständnis der Funktionsweise der Welt, nicht das Wissen aus der Wissenschaft, das man durch Formeln erlernt. Es ist eher ein Gefühl, eine eher intuitive physikalische Einsicht.

Fridman: Ja, es versteht tatsächlich etwas. Das hat viele Leute überrascht und mich auch sehr beeindruckt. Ich hätte nie gedacht, dass man so realistische Inhalte generieren kann, ohne etwas zu verstehen. Es gibt die Ansicht, dass man nur durch ein eingebettetes KI-System (ein intelligentes System, das über einen physischen Träger mit der Umwelt interagiert, wahrnimmt, Entscheidungen trifft und Aufgaben ausführt) ein Verständnis der physikalischen Welt aufbauen kann. Aber Veo 3 scheint diese Ansicht direkt in Frage zu stellen. Es scheint, dass man nur durch das Anschauen von Videos lernen kann.

Hassabis: Ja, das hat mich wirklich überrascht. Selbst vor fünf bis zehn Jahren hätte ich gesagt, dass KI, um etwas wie "Intuitive Physik" zu verstehen, wahrscheinlich einen eigenen Körper braucht und handeln können muss.

Wenn ich beispielsweise einen Becher von einem Tisch stöße und Wasser herausspritzt und der Becher bricht, lernen wir das aus unseren Lebenserfahrungen. In der Neurowissenschaft gibt es Theorien, die sagen, dass man, um die Welt wirklich "wahrnehmen" zu können, daran teilnehmen und handeln muss, um tiefer zu lernen.

Also habe ich früher auch gedacht, dass KI, um das zu verstehen, zumindest "in Bewegung" sein muss, sei es, dass man ihm einen Körper gibt oder dass es in einer virtuellen Umgebung handeln lernt. Aber jetzt scheint Veo 3 nur durch das Anschauen von Videos ein gewisses Verständnis zu entwickeln. Das hat mich wirklich überrascht.

Das zeigt auch, dass die reale Welt, in der wir leben, wahrscheinlich viele "lernbare" Strukturen enthält, und dass KI durch das Beobachten dieser Strukturen auch viel lernen kann. Es geht nicht nur darum, ein cooles Video zu generieren.

In Zukunft könnte der nächste Schritt sein, dass diese Videos "interaktiv" werden, dass man beispielsweise in die Videoszene hineingehen und sich umsehen oder sogar daran teilnehmen kann. Das klingt schon spannend.

Dann wären wir wirklich nah an einem "Weltmodell". Dann könnte KI die Funktionsweise, Regeln und Details der ganzen Welt in ihrem Kopf simulieren. Das ist ein notwendiger Schritt für die Entwicklung einer echten allgemeinen Künstlichen Intelligenz.

03. Die zukünftigen Spielewelt mit KI

Fridman: Wie werden die Spiele in den nächsten fünf bis zehn Jahren aussehen?

Hassabis: In meiner Jugend war mein erstes professionelles Projekt die Entwicklung von KI für Spiele. Ich habe immer gewollt, dass ich eines Tages wieder an diesem Interesse arbeiten könnte. Ich stelle mir vor, was ich gemacht hätte, wenn ich in den 90er Jahren über die heutigen KI-Systeme verfügt hätte. Ich denke, man könnte absolut atemberaubende Spiele entwickeln.

Mein Lieblingsspieltyp ist immer der offene Spielwelttyp gewesen, und die meisten Spiele, die ich entwickelt habe, waren in diese Richtung. Aber wie du weißt, ist die Entwicklung von Spielen mit offener Welt wirklich schwierig. Denn die Spieler können in jede Richtung gehen, und man muss sicherstellen, dass jede Wahl spannend ist. Oft benutzen wir Systeme wie zelluläre Automaten, um "emergentes Verhalten" zu erzeugen, aber diese Systeme sind oft instabil und die generierten Inhalte sind begrenzt.

Jetzt ist die Situation anders. Ich denke, in den nächsten fünf bis zehn Jahren haben wir die Chance, mit KI echte Spielsysteme zu entwickeln, die sich um die Vorstellungskraft der Spieler drehen. Beispielsweise kann KI auf Basis jeder deiner Entscheidungen automatisch Handlungsabläufe generieren und den gesamten Stoff spannender und filmreifer gestalten. Diese Fähigkeiten zeigen sich bereits.

Stell dir vor, wenn es eine interaktive Version von Veo gäbe, oder sogar eine noch stärkere Version. In den nächsten Jahren könnten wir wirklich Spiele entwickeln, bei denen man sich vorstellen kann, wo etwas sein soll, und das Spiel es dann auch dort erstellt.

Fridman: Du sagst, dass der Kern der offenen Welt darin besteht, dass "die Wahl die Welt definiert", aber bei manchen Spielen ist die Wahl nur eine Illusion. Frühe Spiele wie "The Elder Scrolls: Daggerfall" haben die Offenheit durch zufällige Generierung erzeugt. Genügt das?

Hassabis: Nein. Die zufällige Generierung oder voreingestellte Optionen reichen nicht aus, um eine echte offene Welt zu schaffen. Das Ideal wäre, dass die Spieler wirklich alles tun können, ohne eingeschränkt zu werden. Dafür braucht man ein starkes, Echtzeit-generierendes System, das auf jede Entscheidung des Spielers sofort reagieren kann.

Außerdem ist die Entwicklungskosten sehr hoch. Die Entwicklung eines 3A-Spiels erfordert bereits viele Ressourcen, und die Realisierung einer wirklich dynamischen offenen Welt ist noch schwieriger. In meinem frühen Projekt "Black & White"