StartseiteArtikel

10.000-Wort-Interview mit Ultraman: Enthüllung der Schwierigkeiten hinter GPT-5 und Ankündigung des Vorabends des Superintspekts

36氪的朋友们2025-08-08 19:23
Bis 2027 könnte die Künstliche Intelligenz möglicherweise einen anerkannten bedeutenden wissenschaftlichen Durchbruch erleben.

Wichtige Punkte:

Die Programmier- und Schreibfähigkeiten von GPT - 5 haben einen Sprung gemacht. Es kann komplexe Programmierung in 7 Sekunden erledigen, und seine Texte klingen natürlicher. Es wird zum markanten Werkzeug für die "sofortige Erstellung von maßgeschneiderten Software".

Sam Altman geht davon aus, dass innerhalb der nächsten zwei Jahre ein anerkannter bedeutender wissenschaftlicher Durchbruch auftreten könnte. Derzeit müssen wir die kognitive Fähigkeit des Modells verbessern.

Die Entwicklung von KI wird von vier Kernengpässen eingeschränkt: Rechenleistung, Daten, Algorithmusdesign und klare Produktziele. Diese Faktoren bestimmen gemeinsam die Evolutionsgeschwindigkeit und die Umsetzungserfolg von KI.

Für diejenigen, die bereit sind, "kognitive Belastungszeit" zu investieren, ist KI ein Multiplikator. In Zukunft könnte eine einzelne Person möglicherweise ein Milliarden - Dollar - Unternehmen gründen. Die Schwelle für Kreativität und Durchsetzungsvermögen wird deutlich gesenkt.

Am 8. August wurde berichtet, dass nach der Veröffentlichung von GPT - 5 der CEO von OpenAI, Sam Altman, im Interview "Huge Conversations" von der bekannten YouTube - Moderatorin Cleo Abram ausführlich über die zukünftige Entwicklung von Künstlicher Intelligenz (KI) und ihre tiefgreifenden Auswirkungen auf die Gesellschaft gesprochen hat. Während er sich an die Zeit seiner 11. Lebensjahre erinnerte, als er mit Schwierigkeiten das Spiel "Schlange" auf einem Taschenrechner programmierte, hat er gezeigt, wie GPT - 5 dasselbe Spiel in nur 7 Sekunden erstellt. Dies war nicht nur eine technische Demonstration, sondern eher eine Ankündigung: Die Zeit der Superintelligenz ist angebrochen.

In diesem über 10.000 - Wort - Gespräch hat er erstmals über die Runden und Überraschungen bei der Entwicklung von GPT - 5 gesprochen, die "vier Engpässe" der KI - Entwicklung offen zugegeben und gewagt gesagt, dass bis 2027 ein wissenschaftlicher Durchbruch auftreten wird, der das menschliche Verständnis verändern wird.

Im Folgenden der gesamte Text des Interviews:

01. Altman erinnert sich an seine Kindheitstraum vom Programmieren, GPT - 5 erstellt "Schlange" in sieben Sekunden

Abram: OpenAI hat gerade GPT - 5 veröffentlicht, und hier sitzt auch der CEO von OpenAI, Sam Altman. OpenAI verändert die Branche. Sie versuchen, eine Superintelligenz zu entwickeln, die in fast allen Bereichen die Menschen übertrifft, und haben gerade das bisher stärkste Modell veröffentlicht.

Wir erleben einen tiefgreifenden Moment. Die meisten Menschen haben in ihrem Leben noch nie eine so große technologische Veränderung erlebt, aber sie passiert um uns herum. In diesem Gespräch möchte ich mit Altman eine "Zeitreise" machen und die Zukunft erkunden, die er zu schaffen versucht, damit wir beide wirklich verstehen, was bevorsteht. Hallo, Altman, vielen Dank für die Teilnahme an diesem Interview.

Altman: Natürlich, ich bin froh, teilnehmen zu können.

Abram: Bevor wir beginnen, möchte ich mein Ziel klarstellen. Ich werde keine Fragen zu Bewertungen, KI - Talentkonkurrenzen oder Finanzierungen stellen, da diese an anderen Stellen bereits ausführlich berichtet wurden.

Altman: Das scheint tatsächlich der Fall zu sein.

Abram: Das Ziel unseres Programms ist es, zu untersuchen, wie wir Wissenschaft und Technologie nutzen können, um die Zukunft besser zu gestalten. Wir glauben, dass wenn die Menschen eine bessere Zukunft vor sich sehen können, sie helfen können, sie zu schaffen. Daher ist mein Ziel, soweit wie möglich mit Ihnen eine Zeitreise zu machen und in verschiedene Momente der Zukunft zu gelangen, die Sie zu schaffen versuchen, und zu verstehen, wie es dort aussieht.

Altman: Das ist großartig, sehr gut.

Abram: Sie haben kürzlich erwähnt, dass GPT - 4 das "dümmste" Modell ist, das wir nutzen.

Abram: GPT - 4 kann bereits in Prüfungen wie SAT, LSAT, GRE über 90 % der Menschen übertreffen und auch Programmierprüfungen, Prüfungen für Sommeliers und ärztliche Zulassungsprüfungen bestehen. Jetzt haben Sie gerade GPT - 5 veröffentlicht. Was kann GPT - 5, was GPT - 4 nicht kann?

Altman: Zunächst einmal ist es wichtig zu verstehen, dass Sie ein KI - System haben können, das in diesen Prüfungen hervorragend abschneidet, aber es offensichtlich nicht in der Lage ist, viele Fähigkeiten zu replizieren, in denen Menschen gut sind. Dies zeigt die Grenzen von Prüfungen wie SAT auf.

Denken Sie an die Veröffentlichung von GPT - 4. Wenn wir Ihnen damals von seinen Fähigkeiten erzählt hätten, hätten Sie vielleicht gesagt: "Dies wird viele Jobs und das Verhalten der Menschen stark beeinflussen, vielleicht auch negativ." Aber einige der von Ihnen vorhergesagten positiven Auswirkungen sind nicht vollständig eingetreten. Die Bereiche, in denen diese Modelle gut sind, decken nicht alle Dinge ab, die wir von Menschen erwarten oder die wir von Menschen schätzen.

Ich denke, dass es auch bei GPT - 5 so sein wird. Die Menschen werden von seinen Fähigkeiten beeindruckt sein, es ist in vielen Bereichen sehr gut, aber es hat auch noch Grenzen. Die Menschen werden es für all die erstaunlichen Dinge nutzen, es wird das Wissensträgerschaft, das Lernverhalten und die Schaffensweise verändern, aber die menschliche Gesellschaft wird sich gemeinsam mit ihm entwickeln und nach noch besseren Werkzeugen streben.

Also, GPT - 5 ist in vielen Bereichen ausgezeichnet, aber es gibt auch in einigen Aspekten noch Grenzen. Es kann wie Ihr Mobiltelefonassistent oder Ihr tragbares Gerät jederzeit abgerufen werden und in wenigen Minuten oder einer Stunde Aufgaben erledigen, die selbst für Experten schwierig sind. Dies ist beispiellos in der menschlichen Geschichte, die technologische Entwicklung ist so schnell. Wir gewöhnen uns allmählich an, aber wenn wir vor fünf oder zehn Jahren den Menschen sagen würden, dass diese Technologie bald kommen wird, würden sie es für unglaublich halten.

Abram: Was macht Sie bei GPT - 5 am meisten aufregen? Welche Funktionen mögen nicht den Erwartungen entsprechen?

Altman: Am meisten aufregt mich, dass es das erste Mal ist, dass ich ein Modell habe, an das ich beliebige komplexe wissenschaftliche oder technische Fragen stellen kann und ein ziemlich gutes Ergebnis bekomme. Nehmen wir ein interessantes Beispiel: In der neunten Klasse hatte ich einen TI - 83 - Grafikrechner und habe lange gebraucht, um das Spiel "Schlange" zu programmieren. Es war in der Schule ziemlich beliebt. Aber das Programmieren für den TI - 83 war sehr mühsam, es dauerte lange und war schwer zu debuggen. Später hatte ich die Idee, mit einer frühen Version von GPT - 5 zu experimentieren und zu sehen, ob es ein "Schlange" - Spiel im Stil des TI - 83 erstellen kann. Und tatsächlich hat es es in nur 7 Sekunden perfekt erledigt.

Ich war drei Sekunden lang starr, und ich habe mir gefragt, ob mein 11 - jähriges Ich das cool finden würde oder ob es etwas vermissen würde. Dann habe ich gemerkt, dass ich das Spiel selbst vermisse. Also habe ich ihm eine neue Funktionsidee gegeben, und es hat sie sofort umgesetzt, und das Spiel wurde sofort aktualisiert. Ich habe es auch gefragt, das Aussehen zu ändern und Funktionen hinzuzufügen, und diese Programmiererfahrung hat mich an meine 11. Lebensjahre zurückversetzt - ich konnte meine Ideen schnell ausdrücken, neue Dinge ausprobieren und sofort mit dem Spiel anfangen.

Ich hatte befürchtet, dass die Kinder, die nicht die "Steinzeit" des Programmierens wie ich erlebt haben, etwas verpassen würden, aber jetzt bin ich für sie begeistert, denn die neuen Werkzeuge ermöglichen es den Menschen, ihre Ideen schnell in die Realität umzusetzen. Das ist unglaublich. GPT - 5 kann nicht nur komplexe Fragen beantworten, sondern auch fast sofort maßgeschneiderte Software erstellen. Dies ist ein markantes Merkmal der GPT - 5 - Ära und etwas, was GPT - 4 nicht kann.

Abram: Ich habe GPT - 5 noch nicht viel genutzt, aber ich habe gehört, dass es sich besser in den Alltag integrieren kann, beispielsweise mit Gmail und Kalendern zusammenarbeiten kann. Meine Interaktion mit GPT - 4 hat sich immer wie isoliert angefühlt. Wie wird sich die Beziehung zu GPT - 5 ändern?

Altman: Es wird sich natürlicher in Ihren Alltag einfügen, mit Kalendern und Gmail verbunden werden und aktiver werden. Beispielsweise könnte es Ihnen am Morgen sagen: "Gestern Nacht gab es diese neuen Entwicklungen, ich habe bemerkt, dass Sie Ihren Kalender geändert haben, und ich habe über die Frage, die Sie gestern gestellt haben, neue Ideen."

In Zukunft werden wir auch Verbraucherelektronikgeräte einführen, die möglicherweise neben Ihnen während eines Interviews still sitzen und nach dem Ende sagen: "Das Gespräch war gut, aber beim nächsten Mal könnten Sie mich vielleicht um diese Frage bitten, denn ich habe die letzte Frage nicht so gut beantwortet." Es wird wie ein Begleiter sein, der Ihren ganzen Tag begleitet.

02. Rückblick auf die GPT - Evolutionsgeschichte: Das Spiel des Vorhersagens des nächsten Wortes wird zur KI - Revolution

Abram: Für diejenigen, die nicht verstehen, wie die Algorithmusgestaltung die Benutzererfahrung verbessert, können Sie bitte kurz zusammenfassen, wie die gegenwärtige Situation ist? Warum finden Sie diese Frage interessant?

Altman: Wir können mit der Geschichte beginnen.

Als wir GPT - 1 entwickelten, hatten wir eine Idee, die von den Experten gelacht wurde - wir trainierten das Modell, ein "Spiel" zu spielen: Wir gaben ihm eine Wortfolge und ließen es das nächste Wort vorhersagen. Dies ist die sogenannte unüberwachte Lernmethode. Wir sagen ihm nicht direkt: "Das ist eine Katze", "Das ist ein Hund", sondern lassen es anhand der Wortfolgen selbst ableiten, welches das nächste mögliche Wort sein könnte. Es klingt absurd, aber es hat sich gezeigt, dass auf diese Weise das Modell komplexe Konzepte wie Physik, Mathematik und Programmierung lernen kann, ohne dass es explizit unterrichtet wird. Tatsächlich ist der Lernprozess von menschlichen Babys beim Erlernen der Sprache ähnlich.

Später haben wir festgestellt, dass die Effektivität des Modells eng mit seiner Größe zusammenhängt und dass es einen signifikanten Anstieg über mehrere Größenordnungen geben muss, um eine Verbesserung zu erzielen. GPT - 1 hat nicht gut funktioniert, viele Experten haben damals gesagt, dass dieser Weg nicht erfolgreich sein würde. Aber wir haben die sogenannte "Größenregel" gefunden - mit der Erhöhung der Rechenleistung, des Speichers und der Datenmenge verbessert sich die Effektivität des Modells in einem vorhersagbaren Trend. Also haben wir entschieden, in diese Richtung fortzufahren und die Größe des Modells zu erweitern, und wir haben überraschend gute Ergebnisse erzielt.

Wir haben auch verstärktes Lernen eingeführt, indem wir dem Modell sagen, welche Antworten gut und welche schlecht sind, um seine logischen Fähigkeiten zu verbessern. Diese Methode wurde zunächst als zu einfach angesehen und es wurde vermutet, dass sie keine grundlegende Verbesserung bringen würde, aber es hat sich gezeigt, dass sie zu den Sprüngen von O1, O3 und GPT - 5 geführt hat. Jetzt forschen wir an Videomodellen, um die Fähigkeiten des Modells mithilfe neuer Daten und Interaktionsumgebungen weiter zu erweitern. Wir erwarten, dass die Fortschritte in der Algorithmusgestaltung in den nächsten Jahren stabil und stark bleiben werden.

Abram: Die Öffentlichkeit könnte meinen, dass der Übergang von GPT - 1 zu GPT - 5 eine glatte Aufstiegskurve war, aber hinter den Kulissen muss es komplizierter gewesen sein. Können Sie bitte einige interessante Probleme teilen, die vor der Veröffentlichung von GPT - 5 aufgetreten sind?

Altman: Einmal haben wir ein Modell namens Orion entwickelt, das später als GPT - 4.5 veröffentlicht wurde. Es war sehr groß und hatte coole Funktionen, aber die Benutzererfahrung war nicht gut. Dies hat uns bewusst gemacht, dass die Forschung nicht nur nach "Größe" streben sollte, sondern auch verschiedene "Formen" von Modellarchitekturen erkunden sollte.

Wir haben ursprünglich immer der Größenregel gefolgt und dachten, dass je größer das Modell, desto besser die Ergebnisse. Aber später haben wir festgestellt, dass es in Bezug auf die logischen Fähigkeiten eine steilere "Größenkurve" gibt, und wenn wir in diese Richtung gehen, können wir höhere Renditen erzielen. Dies war eine Umleitung in der Forschung, aber Umwege bringen oft neue Entdeckungen.

Beim Datensatz haben wir auch Probleme gehabt. Das Modell braucht eine riesige Menge an hochwertigen Daten, um zu lernen, aber manchmal sind wir durch die Qualität oder die Abdeckung der Daten eingeschränkt. Jeder Tag bringt Fortschritte, aber auch Hürden. Beispielsweise hat ein Versuch einer Architektur am Ende nicht funktioniert, aber die allgemeine Tendenz ist immer noch vorwärtsgerichtet.

Abram: GPT - 5 ist veröffentlicht, Sie denken sicherlich jetzt an die Zukunft. Wenn ich Sie in einem Jahr wieder interviewen würde, was denken Sie, über welche Fragen würden Sie dann nachdenken?

Altman: Vielleicht würden Sie mich fragen: "Was bedeutet es, wenn KI neue wissenschaftliche Entdeckungen macht? Wie wird die Welt die wissenschaftlichen Ergebnisse von GPT - 6 bewerten?"

Vielleicht werden diese Ergebnisse bis dahin noch nicht vollständig realisiert sein, aber es wird so aussehen, als wären sie in greifbarer Nähe. Wenn es tatsächlich geschieht, wird der gute Teil aufregend sein, wie die Heilung von Krankheiten, der schlechte Teil könnte besorgniserregend sein, wie die Verwendung für biologische Sicherheitsbedrohungen, und es gibt auch einige seltsame neue Phänomene, die am Anfang unangenehm sind, aber bald normal werden.

Die Geschwindigkeit der Veränderung der Welt wird uns benommen machen, die Wirtschaft könnte schnell wachsen, aber die Menschen haben eine starke Anpassungsfähigkeit, und es wird nicht lange dauern