Von 2,5 Milliarden Abfragen zum KI-Browser: Kann die "langsame Revolution" von ChatGPT Agent Google stürzen?
„Hast du heute schon ChatGPT gefragt?“ Wenn diese Frage so alltäglich wird wie „Hast du schon gegessen?“, hat OpenAI still und leise eine Zahlenreihe veröffentlicht, die jeden Produktmanager ins Schlaflossein treiben würde: ChatGPT erhält täglich 2,5 Milliarden Benutzerbefehle, was auf 912,5 Milliarden pro Jahr hinausläuft, also etwa 2.900 Mal pro Sekunde ein „Klingeln“. Wenn man jede Frage als eine Suche ansieht, hat ChatGPT bereits 18 % der jährlichen Suchanzahl von Google (5 Billionen) erreicht, und diese Kluft schrumpft mit bloßem Auge zu erkennen.
Was noch interessanter ist, hat OpenAI am gleichen Tag, an dem es die Daten veröffentlichte, eine neue Funktion namens ChatGPT Agent den Pro-Benutzern vorgestellt – es kann nicht nur antworten, sondern auch „handeln“. So hat ein heimlicher Kampf um die „Übersetzung von Antworten in Handlungen“ begonnen.
Hinter 2,5 Milliarden Fragen: Die Zeit der „Strom-, Wasser- und Gasversorgung“ der KI
Was bedeutet 2,5 Milliarden Fragen pro Tag? Es hat die wöchentliche Aktivität von ChatGPT innerhalb von sechs Monaten von 300 Millionen auf 500 Millionen gesteigert, eine Wachstumsrate, die mit der des rasantesten Wachstumsjahres von TikTok (2018) vergleichbar ist. Die amerikanischen Benutzer liefern 13 % der Fragen, tragen aber zu über 60 % der Bezahlungseinnahmen von OpenAI bei – das feine Gleichgewicht zwischen Bezahlungsmauer und kostenfreier Nutzung liegt nun offen auf der Hand. Im Vergleich zu den durchschnittlichen 14 Milliarden täglichen Suchanfragen bei Google sind die Fragen an ChatGPT „schwerer“: Die durchschnittliche Anzahl der Dialogrunden beträgt 3,7, die Verweildauer 4 Minuten und 12 Sekunden, während die durchschnittliche Suchdauer bei Google nur 26 Sekunden beträgt. Mit anderen Worten, die Benutzer „unterhalten“ sich, statt zu „suchen“.
Wenn das Stellen von Fragen zur Gewohnheit wird, ist der nächste Schritt natürlich, „die KI machen zu lassen, was ich will“. Dies ist der Hintergrund für den Auftritt von Agent.
ChatGPT Agent: Der Praktikant am ersten Tag oder der zukünftige Superassistent?
Ein Reporter von The Verge hat 200 Dollar für das Pro-Abo ausgegeben und Agent sofort in die „Einsatzsituation“ gebracht:
1. Einen japanisch-retro Lampen unter 200 Dollar kaufen. Agent hat 50 Minuten gebraucht, um auf Etsy zu suchen, Preise zu vergleichen, auszuwählen und in den Warenkorb zu legen, hat aber schließlich die Ware nur in einen „virtuellen“ Warenkorb gelegt – als der Reporter selbst eingeloggt war, war der Warenkorb leer.
2. Ein Blumenbukett für einen Freund in Colorado bestellen. Agent hat vier lokale Blumenläden gefunden und sogar die Option „bis Samstag liefern“ angeboten, hat aber im letzten Schritt gesagt: „Entschuldigung, ich kann die Bestellung nicht direkt aufgeben.“
3. Agent anweisen, sich bei der Bank anzumelden und eine automatische Überweisung einzurichten. Es kam direkt eine rote Fehlermeldung: „Entschuldigung, ich kann Ihnen bei solchen Aufgaben nicht helfen.“
Yash Kumar, der Produktverantwortliche bei OpenAI, räumt dies nicht aus dem Weg: „Wir optimieren derzeit die Aufgabenabwicklung, nicht die Wartezeit.“ Isa Fulford, die Leiterin der Forschung, fügt hinzu: „Selbst wenn es eine halbe Stunde dauert, ist es immer noch schneller als wenn Sie es selbst tun.“ Mit diesen Worten wird Agent als „Praktikant im Hintergrund“ positioniert: Sie können sich eine Kaffee holen, während es langsam durch den Prozess geht, und wenn Sie zurückkommen, gibt es einen Bericht, der möglicherweise nicht 100 % brauchbar ist.
Aber verzichten Sie nicht zu schnell auf die Lachanfälle. Die Google-Suche von 2004 lieferte oft 404-Fehler, und Siri wurde 2011 als „künstliche Dummheit“ kritisiert. Der Anfang jedes Infrastrukturprodukts ist immer schwierig. Das Wichtige ist, welche „Möglichkeiten“ Agent eröffnet: Es hat erstmals Operator (Webseitenklicks) und Deep Research (Mehrschrittschlussfolgerungen) in einem einzigen Modell vereint, kann Bilder betrachten, Seiten durchblättern, Code schreiben und Skripte auf dem Terminal ausführen; es läuft in einem cloudbasierten isolierten Container, und der lokale Computer dient nur als „Bildschirmprojektor“, was bedeutet, dass Agent auch nach dem Ausschalten Ihres Computers über Nacht 100 Seiten von Bilanzkommentaren für Sie auswerten kann; OpenAI hat schon eine „Überwachungsfunktion“ und eine „Bestätigung für irreversible Aktionen“ eingebaut, um Finanz-, Medizin- und Rechtsaufgaben mit hohem Risiko zunächst abzuschirmen – zuerst Sicherheit, dann Geschwindigkeit.
Der Browserkrieg: Die KI soll die neue „Adressleiste“ werden
Nach einem Bericht der Reuters wird OpenAI in den „nächsten Wochen“ einen auf Chromium basierenden KI-Browser veröffentlichen. Was würde passieren, wenn man Agent in die Adressleiste einbauen würde?
Wenn Sie eingeben: „Buch mir einen Tisch für zwei Personen in einem italienischen Restaurant am Freitagabend um 19 Uhr“, springt der Browser nicht auf zehn verschiedene Seiten, sondern zeigt direkt die Liste der verfügbaren Tischreservierungen auf OpenTable an und markiert die Bewertungen, die Entfernung und die Allergieinformationen.
Wenn Sie eine PDF-Datei einer Bilanz öffnen, hat Agent bereits die wichtigen Daten in Excel übertragen und ein Vergleichsdiagramm erstellt. Wenn Sie auf Reddit lesen: „Bitte empfehlen Sie mir ein weißes Gehäuse für einen PC mit Meerblick unter 5.000 Yuan“, vergleicht Agent automatisch die Preise auf JD.com und Taobao und erstellt eine Zeitachse mit den bisherigen Niedrigstpreisen, Gutscheinen und heutigen Schnäppchen.
Radikaler noch: Wenn die Standard-Homepage des Browsers nicht mehr Google.com, sondern ChatGPT.com wäre, würde das Werbe-Modell von Google ins Wanken geraten. Die Schutzmauer von Chrome ist die „Provision für die Standard-Suchmaschine“. Sobald Agent die Suche umgehen und direkt zum Ergebnis kommen kann, fehlt Google eine Zahnradstufe an seinem Geldverdunstelermaschinen.
Drei Rätsel der langsamen Revolution
1. Die Zuverlässigkeitslücke: Der Erfolgsquote von Agent liegt derzeit bei etwa 75 %. Das ist für Szenarien wie das „Blumenbestellen“ mit hoher Fehlertoleranz noch akzeptabel. Bei Finanz-, Medizin- und Rechtsfragen kann ein einziger Fehler aber zu Gerichtsverfahren führen. OpenAI muss ein neues Pareto-Optimum zwischen Schutz und Funktionalität finden.
2. Die Ökonomie der Rechenleistung: Die 2,5 Milliarden täglichen Fragen kosten OpenAI bereits 4 Milliarden US-Dollar pro Jahr an Rechenleistungskosten. Wenn Agent die durchschnittliche Dauer einer Aufgabe auf 30 Minuten verlängert, wird die Anzahl der zu verarbeitenden Token exponentiell steigen – es sei denn, die Effizienz des Modells wird um eine Größenordnung verbessert, sonst muss die Abonnementgebühr erhöht werden.
3. Die Neuverteilung der Macht: Fidji Simo, die CEO von Instacart, wird bald bei OpenAI anheuern und die Abteilung für „Anwendungen“ leiten. Ihre Aufgabe ist es, die „tödlichen Anwendungsfälle“ für Agent zu finden, damit die KI nicht nur ein Spielzeug für Tech-Geeks wird, sondern ein Massenbedürfnis wie Lieferdienste oder Taxiapplikationen. Mit anderen Worten, wer das Interaktionsparadigma des „Superassistenten“ definieren kann, der hält den Eintrittsschein für die nächste Dekade in der Hand.
Wird das nächste „Google mal“ verschwinden?
Im Jahr 2004, kurz vor der Börsengang von Google, glaubte niemand, dass die Suchleiste die Portale ersetzen könnte. Im Jahr 2012, als WeChat die Offiziellen Accounts einführen, glaubte niemand, dass das Chatten die Browser ersetzen könnte. Heute ist ChatGPT Agent noch ungeschickt, langsam und sogar ein bisschen süß, aber es hat erstmals den Weg von der Frage zur Handlung auf eine einfache Aussage verkürzt.
Vielleicht werden wir in fünf Jahren so wie damals das „Dial-up-Internetzugang“ vermissen, wenn wir uns an die Zeit erinnern, als wir zehn verschiedene Browser-Tabs öffnen mussten, um Preise zu vergleichen. Und wenn die Kinder fragen: „Was ist ein Suchmaschine?“, werden wir nur mit den Schultern zucken:
„Oh, das war die Zeit, als die KI noch nicht selbst handeln konnte.“
Dieser Artikel stammt aus dem WeChat-Account „Shanzii“, Autor: Rayking629, veröffentlicht von 36Kr mit Genehmigung.