Die neueste kühne Vorhersage von Greg Brockman, Präsident von OpenAI: Nach der Integration von ChatGPT und Agent werden alle Schnittstellen verschwinden
Greg Brockman, der Präsident von OpenAI hat in einem kürzlich durchgeführten ausführlichen Interview den großen Plan von OpenAI zur Verschmelzung von dialogfähiger KI mit autonomen Agenten dargelegt. Vom Entstehen von ChatGPT über die Entwicklung von Codex bis hin zum endgültigen Vision von "verschwindenden Schnittstellen" hat er einen klaren Weg skizziert.
1. Vom "Super-App" zum "Schnittstellenlos"
Als gefragt wurde, was die Produktrichtung von OpenAI sei, befand Brockman, dass das Konzept des "Super-App" nicht zutreffend sei.
"Wenn man es aus einer breiteren Perspektive betrachtet, ist das, was wir wirklich bauen möchten, Teil der AGI. Denken Sie mal darüber nach, was die Menschen seit der Entstehung von ChatGPT benutzen - es ist ein Sprachmodell. Sie führen ein Gespräch, es antwortet, das ist toll. Aber als es 2022 eingeführt wurde, hatte es keine Gedächtnisfunktion, war mit keinem Tool verbunden und hatte keinen Kontext."
"Also ist es nur ein Gespräch. Intelligenz ist nur ein Teil davon. Was die Menschen wirklich brauchen, ist die Fähigkeit, Aufgaben zu erledigen und Ziele zu erreichen."
Seine zentrale These lautet: Am Ende will man fast keine Schnittstelle.
"Sie brauchen kein Produkt - wie möchten Sie, dass es aussieht? Was ist die Schnittstelle? Sie und ich können kontinuierlich miteinander sprechen, und eine Art Begleiter-Entität kann Ihre Ziele verwirklichen."
"Die Schnittstelle wird verschwinden." Dies ist eine kühne Vorhersage: Die zukünftige KI-Interaktion wird keine Buttons, Menüs oder Schalter mehr erfordern - nur natürliche Gespräche, und dann versteht das System Ihre Absicht und führt sie aus.
2. Codex: Vom Code-Tool zur Plattform für allgemeine Agenten
Codex wurde ursprünglich als Software-Engineering-Tool entwickelt, aber seine Anwendungsgebiete gehen weit über die Programmierung hinaus.
"Die nicht-softwarebezogene Arbeit, die mit Codex durchgeführt wird, wächst exponentiell. Innerhalb von OpenAI ist unsere Benutzerpenetration jetzt im Wesentlichen gleich der von Slack."
Brockman gab ein lebhaftes Beispiel: Ein Mitglied des Kommunikationsteams von OpenAI organisierte ein Event. Nachdem sie mit ChatGPT gesprochen hatte, fragte das System alle Fragen zum Event - Teilnehmer, Ernährungswünsche - und erstellte dann automatisch die Sitzordnung und erledigte im Wesentlichen alle damit verbundenen Aufgaben.
"So kann sie sich auf den Teil konzentrieren, an dem sie wirklich interessiert ist - über die Vision nachdenken, die sie verwirklichen möchte. Ich denke, dass diese Situation allgemein auftreten wird."
Das Wichtige ist, dass Codex es auch nicht-technischen Benutzern ermöglicht, Agenten zu erstellen. Benutzer müssen nicht mehr Code schreiben, sondern nur Tools - Gmail, Kalender, Dateisystem - verbinden und dann der KI mitteilen, was sie tun soll, indem sie natürliche Sprache verwenden.
3. Vertrauen ist die wichtigste Produkt-Eigenschaft
Wenn die KI beginnt, in Ihrem Namen Handlungen durchzuführen, wird Vertrauen zum Kernproblem.
"Ein Aspekt der Agenten-Zeit ist das Vertrauen. Wir müssen wirklich verstehen, wie wir Vertrauen in diese Systeme aufbauen können, ihre Stärken und Schwächen kennen und herausfinden, welche Aufgaben wir ihnen übertragen möchten."
Brockman beschrieb die Entwicklung des Vertrauens vom "Entwurf" zum "Senden":
"Nehmen Sie an, Sie haben einen Connector, der möglicherweise keine E-Mails direkt versendet. Er wird sagen: 'Ich habe den Entwurf fertiggestellt, Sie müssen es an sie senden.' In einer anderen Welt haben Sie genug Vertrauen in das System aufgebaut, und es wird anzeigen: 'E-Mail wurde entworfen und gesendet.'"
Er ist der Meinung, dass Vertrauen nicht "erteilt" werden kann, sondern "verdient" werden muss, indem man eine Vielzahl von Tools, Kontroll- und Überwachungsmechanismen bereitstellt.
"Wir denken, dass dies eine sehr wichtige Sache sein wird - eine entscheidende Produkt-Eigenschaft und ein Differenzierungsfaktor."
4. Die Misserfolge von 2023: Das Modell war noch nicht bereit
Es ist erwähnenswert, dass OpenAI bereits 2023 versucht hatte, ChatGPT mit Tools zu verbinden - damals wurde ein Plug-In-System veröffentlicht.
"Das hat überhaupt nicht funktioniert, weil das Modell noch nicht bereit war. Wir konnten dem Modell nur drei verschiedene Connectoren gleichzeitig präsentieren, sonst würde es sie vergessen. Damals hatten wir nur etwa 2.000 bis 4.000 Token im Kontextfenster."
Brockman verglich diese Zeit mit den "frühen Computern": "Es ist wie in den sechziger und siebziger Jahren, als Ihr Computer nur sehr wenig Speicher hatte. Heute ist Ihr Handy stärker als jeder Supercomputer aus dieser Zeit."
Jetzt beträgt das Kontextfenster 52 Millionen Token, und das Modell kann sich mit Hunderten verschiedener Tools verbinden und sogar auf das gesamte Dateisystem zugreifen.
"Sie können fast die gesamte Macht des Internets nutzen, und fast jede Anwendung, die Sie möchten, ist griffbereit."
5. Die Evolution des Modells: Keine Engpässe, nur Durchbrüche
Was die Frage "Haben die LLMs einen Engpass erreicht?" angeht, gab Brockman eine klare Antwort: Nein.
"Ich hatte unrecht. Jedes Mal, wenn wir das Gefühl hatten, dass wir einen Engpass erreicht hätten - 'Oh, das scheint nicht den Skalierungsvorhersagen zu entsprechen' - war es in der Regel so, dass wir auf einen Fehler stießen oder dass unsere Implementierung nicht mit den mathematischen Berechnungen übereinstimmte."
Er zitierte die Geschichte der Neuronalen Netze: Die erste Hardware-Implementierung des Perzeptrons war 1959. "Seit über 70 Jahren sagen die Leute, dass diese Dinge nie funktionieren werden, nie skalierbar sein werden, und es scheint, als würde man an eine Wand stoßen. Es gibt noch keinen Engpass, und man sieht noch keine Wand."
Er ist der Meinung, dass die Grundlagenwissenschaft einen kontinuierlichen Fortschritt ermöglicht. "Wir bauen riesige Supercomputer. Das ist schwierig und teuer. Wir haben Teams, die sehr hart daran arbeiten, diese unglaublich schwierigen technischen Probleme zu lösen - wir entwickeln unsere eigenen Netzwerkprotokolle, und es gibt Leute, die sich um die seltsamen Schwankungen jeder einzelnen Ebene im Stack kümmern."
"Wenn Sie ein passendes Team zusammenstellen können, die richtige Mission vor Augen haben und anhalten - dann hat sich gezeigt, dass es sich lohnt und möglich ist."
6. Die Kommerzialisierung der Intelligenz? Nein, es gibt viel Raum für Differenzierung
Als gefragt wurde, ob die Modelle zu Waren werden, befand Brockman, dass dies die falsche Frage sei.
"Intelligenz ist keine dimensionslose Sache."
Selbst wenn zwei Modelle ein ähnliches Niveau an allgemeiner Intelligenz haben, können sie in bestimmten Bereichen völlig unterschiedliche Tiefen aufweisen. "Wenn Sie noch nie mit einer Tabellenkalkulation gearbeitet haben, können Sie keine komplexen Modellierungsaufgaben erfolgreich erledigen."
Das bedeutet, dass es viel Raum für Differenzierung gibt. Verschiedene Unternehmen und verschiedene Modelle werden in verschiedenen Bereichen Vorteile erzielen. "Wir können nicht gleichzeitig in allen Bereichen hervorragend sein."
Er sprach auch über den Wert der "Tiefe": "Denken Sie an den 37. Zug von AlphaGo - er hat die Menschens Vorstellung von Go verändert. Heute gibt es mehr Go-Spieler als je zuvor. Diese Tiefe wird niemals aufhören zu wachsen. Wenn man ein Rätsel löst, werden etwa zehn neue Rätsel freigeschaltet."
7. Die Rechenzeit: Der Bedarf übersteigt immer das Angebot
"Wir gehen in eine von der Rechenleistung dominierte Wirtschaftszeit ein", sagte Brockman.
Er ist der Meinung, dass die Rechenleistung immer knapp sein wird. "Aus Sicht des Geschäftsmodells sind die Rechenressourcen aller Anbieter bereits ausverkauft. Die Anzahl der Benutzer, die diese Agenten nutzen, könnte auf 10 oder 20 Millionen steigen - wir haben noch nicht die planetarische Skala erreicht. Wir haben eine Milliarde Benutzer, aber wir haben noch nicht genug Agenten, noch nicht genug Strom."
Als gefragt wurde, ob OpenAI alle Rechenressourcen kaufen sollte, sagte er direkt: "Die Antwort ist immer ja."
Aber er gab auch zu, dass die Preise für die Modelle kontinuierlich fallen werden. "Spitzenintelligenz ist immer am teuersten. Aber in einem Jahr wird dieses Intelligenzniveau ziemlich gewöhnlich und billiger sein. Dann wird es etwas Neues und Besseres geben."
8. Die spannendsten Anwendungen der KI: Gesundheitswesen
Brockman teilte einige persönliche Geschichten über die Anwendung der KI im Gesundheitswesen.
Er erwähnte die Geschichte von Sid Sijbrandij, dem CEO von GitLab - er hat seine Krebs-Diagnosedaten in ChatGPT eingegeben und mit Hilfe der KI den Krebs besiegt. Und es gibt noch einen Hund namens Rosie - der Besitzer hat AlphaFold verwendet, um die Tumor-Mutationen zu analysieren, ein mRNA-Impfstoff entwickelt und den Tumor erfolgreich verkleinert.
"Das ist absolut die Standardpraxis. Ich persönlich habe auch viele Freunde, die ähnliches getan haben - die richtigen Gesundheits-Diagnosedaten erhalten, Codex richtig nutzen und diese Modelle verwenden, um Einsichten zu gewinnen."
Er gab eine erstaunliche Statistik preis: Jede Woche verwenden mehr als 230 Millionen Menschen ChatGPT, um Fragen zum Gesundheitswesen zu stellen.
"Ich denke, dass wir in einer Welt leben, in der Patienten keine Selbstständigkeit haben. Patienten müssen ihre eigenen Ärzte werden - Sie sind der Endentscheider und tragen die Verantwortung. Ärzte können auch Fehler machen, und Sie müssen dafür bezahlen."
Seine Frau leidet an mehreren Krankheiten. "Ich weiß nicht einmal, wie wir ohne ChatGPT mit vielen ihrer Krankheiten umgehen könnten. Wir stehen erst am Anfang dieser Reise."
"Wenn Sie wirklich Krankheiten vorbeugen und potenzielle Gesundheitsprobleme im Vorfeld lösen können, können Sie Ärzten und Krankenschwestern die Last abnehmen. Sie sind jetzt alle ausgebrannt. Die KI kann helfen, all diese Probleme zu lösen."
In Brockmans Vision ist die KI nicht nur ein Chat-Tool und auch nicht nur ein Code-Helfer. Sie ist ein echter Begleiter, der Sie versteht und für Sie handelt. Vom Gespräch zur Handlung, von der Schnittstelle zur Schnittstellenlosigkeit - dies ist die "Agenten-Zeit", die OpenAI gerade aufbaut.
Dieser Artikel stammt aus dem WeChat-Account "AIGC-Index", Autor: Mark, veröffentlicht von 36Kr mit Genehmigung.