StartseiteArtikel

ChatGPT verwandelt sich in ein Lebensbetriebssystem: Altman kündigt die nächste Generation der Spitzen-KI an.

量子位2025-06-30 15:42
Das extrem leistungsstarke Open-Source-Modell von OpenAI wartet darauf, freigeschaltet zu werden.

OpenAI plant, ein sehr leistungsstarkes Open-Source-Modell zu veröffentlichen.

Es wird den Menschen ermöglichen, extrem leistungsstarke Modelle lokal auszuführen und die Möglichkeiten der "lokalen Bereitstellung" neu zu entdecken.

Bei einem Gespräch an der AI-Startup-Schule in San Francisco gab Altman diese Nachricht bekannt. Das Gespräch wurde von Garry Tan, dem CEO von Y Combinator, moderiert.

Währenddessen diskutierten sie auch über den Entwicklungsprozess von OpenAI, die zukünftige Richtung, den Ursprung von ChatGPT und den Aufbau von AI-Hardware.

Altman sagte, die Betriebskosten des o3-Modells waren letzte Woche das Fünffache der Kosten dieser Woche. Der Preisverfall setzt sich fort, und die Kosten der API werden weiterhin stark sinken. Das Open-Source-Modell wird sehr gut sein. Die Gedächtnisfunktion von ChatGPT ist nicht nur ein kleines Hardwareelement, sondern eher wie ein AI-Kompanion.

In Zukunft werden GPT-5 und verschiedene Inferenzmodelle in Richtung eines integrierten Modells entwickelt und mit AI-Smartgeräten und Robotern verbunden, um zum Lebensbetriebssystem der Menschen zu werden.

Er sagte auch, wenn Benutzer sich für das höchste Abonnement-Level von ChatGPT anmelden, werden wir ihnen einen Roboter kostenlos geben.

Ohne die ursprüngliche Bedeutung zu verändern, wurde hier Folgendes zusammengefasst.

Die Zukunft der GPT-Inferenzmodelle

Tan: Was hat Sie am neuesten o3-Modell am meisten überrascht? Welche neuen Verhaltensweisen oder Anwendungsfälle haben Sie beeindruckt?

Altman: Ich denke, wir befinden uns in einer sehr interessanten Zeit. Zwar haben wir bisher noch keine Inferenzmodellprodukte gesehen, die ein neues Niveau an Innovation erreichen, aber die Modellfähigkeiten der Welt haben ein neues Gebiet betreten. Wir haben noch eine Menge Neues zu erschaffen.

Wir werden bald ein Open-Source-Modell vorstellen, das Sie überraschen wird. Ich denke, es wird viel besser sein, als Sie erwarten. Sie können lokal sehr leistungsstarke Modelle ausführen. Gleichzeitig werden die Kosten der API weiterhin stark sinken, und das Open-Source-Modell wird sehr gut sein.

Tan: Für mich fühlt sich das Gedächtnis sogar wie ein Gespräch mit jemandem an, der mich kennt. Das ist interessant.

Altman: Ja, das Gedächtnis ist die Funktion, die ich am liebsten von den Produkten, die wir dieses Jahr herausgebracht haben.

Ich denke, das zeigt die Richtung, in die wir unsere Produkte entwickeln möchten. Sie werden ein Entity haben, das Sie versteht, mit all Ihren Dingen verbunden ist und Ihnen aktiv hilft.

Es wird nicht so sein, dass Sie eine Nachricht senden und es Ihnen dann eine Nachricht zurücksendet. Es wird ständig laufen, Ihre Dinge überprüfen, wissen, wann es Ihnen eine Nachricht senden soll und wann es etwas für Sie tun soll.

Sie werden besondere neue Geräte haben, die in jeden Dienst integriert sind, den Sie nutzen, und die Ihnen Ihr ganzes Leben lang zur Seite stehen.

Wenn dieses System im Hintergrund ständig läuft und Ihnen kontinuierlich Inhalte zusendet, wird die Interaktionszone reichhaltiger. Und wenn wir das erste neue Gerät auf den Markt bringen, werden hier noch mehr Funktionen oder Inhalte hinzugefügt.

Ich denke, der Schlüssel liegt nicht in dem kleinen Hardwareelement. Dieses Ding hat sich so weit entwickelt, dass es im Hintergrund laufen kann und sich wie ein künstlicher Intelligenz-Kompanion anfühlt.

Tan: Ich denke, wir sehen die starken Funktionen der Integration von LMS mit echten Daten. Ich habe gehört, dass MCP bald bei OpenAI ankommen wird. Was war an der tatsächlichen Integration überraschend? Sie wissen, dass wir bei YC tatsächlich über eine interne Agent-Infrastruktur verfügen und diese ständig nutzen.

Altman: Die Menschen beginnen zweifellos, ChatGPT als Betriebssystem zu nutzen und ihr ganzes Leben hineinzufügen.

Die Integration so vieler Datenquellen wie möglich sowie von Geräten, die ständig bei Ihnen sind, wie z. B. einem neuen Webbrowser, der Verbindung zu allen Datenquellen, dem Speicher und dem laufenden Modell - wenn Sie all dies zusammenbringen, wird es ein sehr starkes Ganzes sein.

Tan: Glauben Sie, dass es in Zukunft in der Cloud, auf unseren Desktops oder beides geben wird?

Altman: Es wird eine Mischung aus all diesen Dingen sein. Die Menschen werden sicherlich für bestimmte Dinge lokale Modelle ausführen. Wenn wir die Hälfte der Chat-Arbeitslast auf lokale Geräte verlagern können, werden wir uns nicht freuen können. Was die Cloud betrifft, ich denke, wir werden bald die teuerste und größte Infrastruktur der Welt betreiben. Tan: Überrascht Sie die Schwierigkeit der Berechnung in der Cloud? Altman: Wir sind gut darin, von Grund auf aufzubauen. So hatten wir vor zweieinhalb Jahren noch keine ChatGPT.com, jetzt ist es die fünftgrößte Website der Welt.

Die Vision von GPT-5 und multimodalen Supermodellen

Tan: Was passiert, wenn die Entwicklung der o3- und o4mini-Inferenzmodelle parallel zu der von multimodalen Modellen wie 4o verläuft und diese beiden Threads zusammenkommen? Was ist die Vision für GPT-5 und darüber hinaus?

Altman: Wir können mit GPT-5 nicht alle Ziele erreichen, aber wir wollen letztendlich ein integriertes Modell haben, das bei Bedarf inferieren und bei Bedarf Echtzeitvideos generieren kann.

Wenn Sie eine Frage stellen, können Sie sich vorstellen, dass es sehr intensiv nachdenkt, etwas recherchiert und eine Menge Code schreibt, wie eine brandneue App für Sie. Ich denke, das ist eine Art neuer Computerinterface. KI hat dies in gewisser Weise bereits erreicht, aber wenn wir ein wirklich komplettes multimodales Modell haben, wie perfekte Videos, perfektes Coding und alle tiefgreifenden Inferenzen, wird es sehr stark sein.

Tan: Das scheint ein Schritt in Richtung Konkretisierung zu sein. Sie wissen, dass Roboter mit Seh-, Sprach- und Inferenzfähigkeiten ein Sprung in die Richtung der Roboter sind, die wir wollen.

Altman: Unsere Strategie ist es, zunächst dieses Problem zu lösen und dann sicherzustellen, dass wir es mit Robotern verbinden können.

Aber die Zeit der Roboter kommt bald. Ich denke, wenn Sie sich für das höchste Abonnement-Level von ChatGPT anmelden, werden wir Ihnen einen Roboter kostenlos geben.

Tan: Eine Welt mit Robotern, die in der realen Welt praktische Arbeit verrichten, ist eine so verrückte Zukunft.

Altman: Ich denke, wir sind nicht mehr weit von unserem Ziel entfernt. Zwar ist die Maschinenbauweise von Robotern sehr komplex und die kognitive Fähigkeit der KI ebenfalls herausfordernd, aber insgesamt werden wir diese Schlüsselprobleme langsam in den Griff bekommen.

Ich denke, in ein paar Jahren können Roboter sehr nützliche Dinge tun, aber es wird noch einige Zeit dauern, bis es eine Milliarde Roboter gibt. Ich weiß auch nicht, wie viele Roboter benötigt werden, um die automatische Lieferkette zu betreiben und ob sie die gesamte Lieferkette steuern können, z. B. Bergbaugeräte oder Containerschiffe.

Tan: Wenn wir über dreistufige AGI und AI-Agenten sprechen, hat Greg Brockman gesagt, dass dies das Jahr der Agenten sei. Mit Tools wie dem Operator-Code-Interpreter, welche Arten von Arbeitsabläufen glauben Sie, werden verschwinden oder auftauchen, auf die wir uns noch nicht vorbereitet haben?

Altman: Seit langem war ChatGPT wie eine erweiterte Suchfunktion von Google, immer noch wie ein Ersatz.

Aber jetzt können Sie tatsächlich eine Aufgabe an Codeex geben, um eine tiefergehende Recherche durchzuführen. Es kann relevante Vorschläge geben, was wie ein junger Mitarbeiter ist, der in kurzer Zeit eine Aufgabe erledigen kann.

Ich denke, das kann man bereits mit dem aktuellen o3 tun, ganz zu schweigen von unserem nächsten Modell. Sie können viele solche Erfahrungen machen.

Tan: Wie sehen Sie die Zukunft der Mensch-Maschine-Interaktion und der Benutzeroberflächen? Welche Einschränkungen dieser Oberflächen haben Sie dazu gebracht, so zu denken?

Altman: Wie die Sprachschnittstelle heute, ich denke, sie ist etwas schlecht, weil die Ergebnisse nicht so gut sind.

Wenn Sie Ihrem Computer sagen können: "Das ist genau, was ich heute erledigen möchte. Wenn ich aufgehalten werde oder etwas sich ändert, vertraue ich darauf, dass Sie alles tun, ohne mich zu stören."

Außer es ist ein supermenschlicher Assistent, sonst wird die Schnittstelle verschwinden. Ich hoffe, dass wir den Menschen eine andere Art des Computergebrauchs zeigen können.

AI for Science: Sams persönlicher Wetteinsatz

Tan: Was macht Sie in den nächsten zehn bis zwanzig Jahren persönlich am meisten aufregen? Was sollten die Menschen jetzt bauen, um diese Zukunft zu erreichen? Altman: Dies ist eine Welt der unfassbaren Superintelligenz. Ich freue mich darauf, ihre Entwicklung zu sehen, anstatt eine vage Antwort zu geben. Ich denke, die Anwendung von KI in der Wissenschaft macht mich persönlich am meisten aufregen.

Ich glaube, dass das gesamte langfristige nachhaltige Wirtschaftswachstum der Welt, wie alle Dinge, die das Leben der Menschen verbessern können, im Wesentlichen darauf beruht, neue Wissenschaft zu entdecken und über eine ziemlich gute Regierungsstruktur zu verfügen, damit diese Wissenschaft entwickelt und mit der Welt geteilt werden kann.

Wenn wir die Geschwindigkeit der KI in der wissenschaftlichen Erforschung erheblich steigern können, glaube ich, dass wir für jeden Menschen Verbesserungen und Wunder bringen können.

Entwicklung von OpenAI: Talentgewinnung und Wettbewerbsfähigkeit

Tan: Sind Sie einer der besten in der Welt, um die klügsten Menschen zusammenzubringen? Was war die härteste Lektion, die Sie beim Recruiting gelernt haben?

Altman: Die Einstellung von wirklich intelligenten, motivierten und effizienten Teammitgliedern bringt 90 % des Erfolgs. Es überrascht mich immer wieder, wie sehr die Menschen bei der Einstellung auf andere Dinge achten.

Die Einstellung von Personen, die eine gute Leistungshistorie haben, neugierig sind, sich aktiv in die Arbeit einbringen und mit der Unternehmensvision übereinstimmen, funktioniert gut.

Tan: Bedeutet eine gute Leistungshistorie, dass es jemand ist, der zwanzig Jahre lang in einer Spitzenorganisation als Manager gearbeitet hat und einen Spitzenr Ruf hat? Altman: Zu Beginn eines Start - Ups empfehle ich nicht, solche Personen einzustellen. Ehrlich gesagt haben wir bei YC zu Beginn eines Start - Ups solche Personen mit viel Managementerfahrung eingestellt, aber es hat nicht gut funktioniert.

Wir entscheiden uns stattdessen für junge, dynamische Menschen, die Aufgaben erledigen können, anstatt für Personen mit einer extrem glänzenden Karriere. Ich frage: Was war das beeindruckendste, was Sie je gemacht haben?

Tan: Was war insgesamt die härteste Lektion, die Sie als CEO von OpenAI gelernt haben?

Altman: Wir müssen gleichzeitig viele Dinge tun, und es gibt viele große Unternehmen, die uns auf verschiedene Weise herausfordern. Wir müssen mehr Energie darauf verwenden, diese Probleme zu lösen, und wir müssen von einer Art von wichtigen Entscheidungen zu einer völlig anderen, aber ebenso wichtigen Entscheidungsart wechseln, um diese zu bewältigen.

Tan: Für viele Softwareingenieure, die B2B - oder SAS - Produkte erstellen möchten, wie können sie eine komplizierte und schwierige Aufgabe jetzt erledigen?

Altman: Jetzt ist die beste Zeit in der Geschichte der Technologie, um ein Start - Up zu gründen. Der Erfolg liegt darin, dass Start - Ups leichter und kostengünstiger iterieren können als andere große Unternehmen. Große Unternehmen haben viele Vorteile, aber ihre Iterationsgeschwindigkeit ist sehr langsam. Aber billige Dinge können auch leicht ersetzt werden, also gibt es viele Perspektiven, um dieses Problem zu betrachten.

Ich empfehle, es so zu betrachten: Jeder wird mit denselben Herausforderungen und Chancen konfrontiert, aber wenn sich die Branchenzyklen so stark ändern, sind Start - Ups fast immer die Sieger. Wir haben vielleicht noch nie so große Veränderungen gesehen.

Wenn Sie in diese Richtung handeln, glaube ich, dass Sie sich in einer sehr günstigen Position befinden. Vielleicht können Sie mich einladen, darüber zu sprechen, wie Sie im Laufe der Zeit defensive Bereiche aufbauen können. Ich denke, das ist ein inneres Problem.

Tan: Was würden Sie sich selbst in der Schulzeit sagen?

Altman: Ich wünschte, jemand hätte mir Leidenschaft und Ausdauer beigebracht. Viele Menschen geben nach einem Misserfolg auf. Zu lernen, wie man durchhält, ist wirklich wichtig.

Vertrauen Sie auf Ihre Intuition und verbessern Sie Ihre Entscheidungsfindung und Intuition im Laufe der Zeit, um dieses Vertrauen zu stärken. Der gute Teil ist wirklich viel besser, als Sie denken, und der schwierige Teil lässt sich nicht in einer Weise beschreiben, die Sie verstehen können. Sie müssen durchhalten.

Eine weitere Sache

Zufällig wurde eine öffentliche Abstimmung gestartet, die fragte, in welchem Jahr ein Modell auf o3-mini-Niveau auf Mobiltelefonen laufen kann?

Bis zum Abschluss dieses Artikels waren mehr als 40 % der abstimmenden Internetnutzer der Meinung, dass dieses Modell bereits 2025 auf Mobiltelefonen laufen kann.

Nun gut, wir warten einfach darauf (Doge).

Referenzlinks:

https://www.youtube.com/watch?v=V979Wd1gmTU

https://x.com/WesRothMoney