Neuester Interview mit dem Google-CEO: Google führt in der multimodalen Fähigkeit an, aber bei der Codierung liegt es tatsächlich hinterher.
Nach der Google I/O-Konferenz wurde Google-Chef Sundar Pichai in einem renommierten Tech-Podcast namens Hard Fork interviewt.
Was die von der Öffentlichkeit am meisten beachtete Fähigkeit von Googles Large Language Models (LLMs) angeht, sagte Pichai, dass Googles Modelle im Bereich der Gesamtintelligenz wettbewerbsfähig seien, aber in Bezug auf agentisches Coding und die Bearbeitung langfristiger Aufgaben hinter dem Branchenvorderstand zurückbleiben würden. Das neu veröffentlichte Gemini 3.5 Flash-Modell habe Probleme mit Artefakten und Leistungseinbußen, und das Team arbeite an einer schnellen Reparatur durch Nachtraining.
Wir haben die Kerninformationen dieses Interviews zusammengefasst. Hier sind die wichtigsten Punkte:
1. Googles Modelle sind führend in der Multimodalität, aber hinterher in Coding und langfristigen Aufgaben
Angesichts der Öffentlichkeitsinteresse an Googles LLMs sagte Pichai, dass Googles Modelle in den Dimensionen der Gesamtintelligenz wie Textverarbeitung, Multimodalitätseingabe, Sprach- und Audiobehandlung sowie allgemeiner Inferenz auf einem wettbewerbsfähigen Vorderstand der Branche stünden. Doch in Bezug auf agentisches Coding, Befehlsausführung und die Bearbeitung langfristiger Aufgaben sei Google derzeit etwas zurückgeblieben. Langfristige Aufgaben, die von erfahrenen Entwicklern in komplexen Code-Bibliotheken ausgeführt werden, seien ein wichtiges Feld, in dem Google sich bemühen müsse, aufzuholen.
Darüber hinaus sagte Pichai, dass die Leistungseinbußen und das abnorme Verhalten des gerade veröffentlichten Gemini 3.5 Flash-Modells ein übliches Phänomen bei der Erkundung neuer Gebiete seien. Das Team werde diese Probleme schnell durch Nachtraining beheben und allmählich die Nutzungsbeschränkungen lockern, die zur Vermeidung von Serviceausfällen gesetzt wurden.
2. Google wird die Suche nicht radikal in den Voll-AI-Modus umstellen, Quellen und Links werden langfristig bestehen bleiben
Google werde die Suche nicht radikal in den Voll-AI-Modus umstellen. Pichai sagte, es sei wichtig, die Benutzer bei der technologischen Veränderung zu begleiten und sicherzustellen, dass das Produkt den Erwartungen der Benutzer entspräche. Obwohl Google die AI umfassend vorantrieb, brauchten die Benutzer weiterhin die Möglichkeit, schnell über Suchknoten Verbindungen herzustellen. Daher würden Quellen und Links immer ein Teil der Suche bleiben.
Im Hinblick auf das Geschäftsmodell meinte Pichai, dass der wirtschaftliche Wert immer von der Gesamtmenge des Nutzens abhängen würde, den die Technologie für die Benutzer schaffe. Im AI-Modus würde der Agent für die Benutzer mehr Gesamtnutzen schaffen als in der Vergangenheit. Daher werde Google weiterhin ein Geschäftsmodell kombinieren, das aus Abonnements und Werbung besteht. Diese Geschäftsregel würde sich auch in der neuen Technologieperiode nicht ändern.
3. Google wird die Produkte der Agenten schrittweise einführen, um das Vertrauen der Benutzer zu gewinnen und Hackerangriffe abzuwehren
Das neueste Agentenprodukt von Google, Spark, soll diesen Sommer veröffentlicht werden. Pichai teilte seine persönlichen Testerfahrungen mit: Spark könne die Besprechungspläne selbständig lesen und direkt im Kalender nach Kategorien farbkodieren, um verschiedene Besprechungskategorien und Arbeitszeiten klar zu markieren.
Beim Thema der Einführungstrategie für Agenten sagte Pichai, dass der Schlüssel zum Gewinnen des Vertrauens der Benutzer in einem schrittweisen Vorgehen liege, um den Menschen ein Gefühl der Kontrolle und Systemtransparenz zu geben. Wenn die Agenten unerwartetes Verhalten zeigten, würden die Benutzer zurückschrecken. Darüber hinaus bestünde von Sicherheitsgründen die Gefahr, dass das Agentensystem von außen gehackt werden könnte. Daher müsse bei der technologischen Weiterentwicklung sichergestellt werden, dass die Grenzen sicher waren und nicht auf falsche Weise überschritten würden.
4. Google öffnet die TPU-Rechenleistung für Wettbewerber, um die führende Position in der Hardware aufrechtzuerhalten
Um den enormen Rechenleistungserfordernissen für die Modelliteration gerecht zu werden, verkauft Google neben der Versorgung seiner eigenen Modelle weiterhin Zugang zu TPU-Chips an Wettbewerber und externe Unternehmen. Die Bereitstellung der Technologie würde Google in der Spitze halten, das Team dazu bringen, die besten nächsten Generationen von Hardware zu entwickeln und in allen Aspekten Skaleneffekte erzielen. Ohne eine umfangreiche externe Cloud-Geschäftstätigkeit würde das Unternehmen auf keinen Fall eine so hohe Chipproduktion planen.
5. Die Entwicklung der AGI in den letzten ein bis zwei Jahren hat die ursprünglichen Erwartungen übertroffen
Der Fortschritt der zugrunde liegenden Technologie in Richtung auf die künstliche allgemeine Intelligenz (AGI) ist ein unumgänglicher Trend. Obwohl Pichai kein konkretes Zeitfenster für die Realisierung der AGI angegeben hat, gestand er, dass die technologische Entwicklung in den letzten ein bis zwei Jahren die ursprünglichen Erwartungen übertroffen habe und das Ziel näher rücke. Selbst wenn die vollständige Realisierung der AGI noch Zeit in Anspruch nehmen würde, werde die Technologie in drei Jahren viel stärker sein als heute. Daher dürfe die Öffentlichkeit nicht wegen des Gedankens, dass die Realisierung der AGI noch einige Zeit dauern würde, die Vorbereitungen lockern. Die gesamte Gesellschaft müsse sich frühzeitig auf die Internalisierung und Bewältigung dieser Entwicklung vorbereiten.
Hier ist das Transkript des Interviews mit Sundar Pichai:
1. Bewertung von Googles Modellfähigkeiten im AI-Wettlauf
Kevin Roose: Sundar Pichai, willkommen zurück bei Hard Fork.
Sundar Pichai: Vielen Dank für die Einladung. Ich bin froh, hier zu sein.
Kevin Roose: Das letzte Mal haben wir Sie 2023 zu unserem Podcast eingeladen. Damals war Bard gerade veröffentlicht worden, und ich denke, die allgemeine Meinung war damals, dass Google im Bereich der Künstlichen Intelligenz catch-up-Modus war. Wie sehen Sie Ihre Position in diesem Wettlauf jetzt?
Sundar Pichai: Das bringt mich an alte Erinnerungen zurück. Es fühlt sich an, als wäre das schon sehr lange her, und diese drei Jahre fühlen sich wie eine Ewigkeit an. Aber ich denke, es ist erstaunlich, welchen Fortschritt diese Technologie gemacht hat. Auch als Unternehmen haben wir großen Fortschritt gemacht. Ich denke, für die gesamte Branche ist dies ein aufregender Moment.
Unsere Modelle sind in einigen Bereichen auf dem Vorderstand, in anderen Bereichen liegen wir hinterher. Wenn Sie die Gesamtfähigkeiten, einschließlich Text, Multimodalität, Sprache oder Audio sowie die allgemeine Inferenzfähigkeit betrachten, denke ich, dass wir in Bezug auf die Gesamtintelligenz sehr wettbewerbsfähig sind. Wenn es um agentisches Coding in Verbindung mit der Werkzeugnutzung, Befehlsausführung und langfristige Aufgaben geht, denke ich, dass wir derzeit etwas zurückbleiben.
Aber wir arbeiten hart daran. Dieser Bereich ist sehr dynamisch, und alle führenden Labore haben ihre eigenen Pre-Training-Zyklen, daher gibt es unterschiedliche Tempi, die möglicherweise nicht immer übereinstimmen. Der Wettbewerb ist derzeit sehr heftig. Vor drei Monaten sagten die Leute: "Wir sind führend, und niemand kann uns einholen", und jetzt hat sich die Stimmung umgedreht. Aber das ist die Norm, wenn man sich auf dem Vorderstand befindet.
Wir sind das einzige große Unternehmen, das sich wirklich auf diesem Vorderstand befindet. Derzeit haben einige Start-ups erstaunlichen Fortschritt gemacht. Wir beschäftigen uns mit diesem Thema schon seit langem, und ich denke, dass wir mit Gemini 3.5 Flash einen großen Schritt vorwärts gemacht haben. Es löst tatsächlich einige Bereiche, in denen wir zuvor hinterher waren.
Den Einsatz des Tokens habe ich auf der Google I/O-Konferenz geteilt. Ich habe noch nie in unserem Unternehmen so etwas gesehen. Die Nutzung wächst jede Woche exponentiell, und die Leute setzen diese Modelle wirklich in die Praxis um. Das hilft uns, uns stetig zu verbessern. Obwohl der Vorderstand sehr dynamisch ist, bin ich sehr optimistisch und überzeugt, dass wir dort einen Durchbruch erzielen werden.
Casey Newton: Klingt so, als wäre der Bereich, in dem Sie sich noch nicht ganz an der Spitze befinden, das Coding. Stimmt das? Ist das der Bereich, auf den Sie Druck ausüben?
Sundar Pichai: Ich denke, dass das Coding letztendlich die Grundlage für alles sein wird, was wir tun. Es ist also ein wichtiger Bereich, in dem wir uns behaupten müssen. Im Bereich des Codings haben wir immer sehr gut abgeschnitten. Wir sind sehr gut darin, Web-Frontends und ähnliche Inhalte in einem einzigen Schritt zu erstellen. Aber was die langfristigen Aufgaben von erfahrenen Entwicklern in komplexen Code-Bibliotheken angeht, machen wir Fortschritte, aber es besteht immer noch eine Lücke im Vergleich zu anderen, die weiter vorne liegen. Aber wir arbeiten daran, und wir sind uns dessen sehr bewusst und machen Fortschritte in diesem Bereich.
Casey Newton: Gemini 3.5 Flash ist seit einem Tag auf dem Markt. Ich denke, es braucht normalerweise ein paar Tage, um diese Modelle wirklich gründlich zu testen. Aber wir haben auch einige Beschwerden über die Preise und die Qualität des Modells gehört. Ich bin gespannt, was Sie von der Reaktion des Marktes bisher halten.
Sundar Pichai: Ich freue mich darauf, das Interview abzuschließen, damit ich mehr Zeit mit dem Team verbringen kann. Es braucht ein paar Tage, um sich daran zu gewöhnen. Dies ist ein neues Modell in einem neuen Bereich, in dem wir Fortschritte gemacht haben. Es kann zu Leistungseinbußen kommen, aber ich denke, dass wir diese durch Nachtraining sehr schnell beheben können.
Wir haben einige Artefakte und Verhaltensprobleme beobachtet, die leicht zu beheben sind, also werden wir uns darum kümmern. Da wir erst einen Tag zuvor viel Inhalt veröffentlicht haben, haben wir die Nutzungsbeschränkungen verschärft, um Serviceausfälle zu vermeiden. Aber Sie werden bald sehen, wie wir diese Beschränkungen lockern. Wenn man in eine solche Situation gerät, ist es verständlich, frustriert zu sein, und ich teile diese Frustration. Aber dies sind Bereiche, die wir lösen werden, und wir werden bald Fortschritte machen.
Kevin Roose: Es scheint, dass eines der Geheimnisse des Erfolgs einiger AI-Unternehmen die Konzentration ist. Anthropic und OpenAI sind fast fixiert auf den Bereich des Codings, und OpenAI wurde letztes Jahr wegen zu vieler Streuungen in den Investitionen kritisiert, weil sie versuchten, zu viele Dinge gleichzeitig zu tun. Jetzt haben sie sich fokussiert. Fühlen Sie sich, dass Google genug Energie in den Bereich des Codings steckt, oder streuen alle anderen Versuche, die Sie unternehmen, die Ressourcen, Zeit und Aufmerksamkeit, die für den Hauptangriff benötigt werden?
Sundar Pichai: Wir alle haben gesehen, dass sich im Bereich des Codings ein Wendepunkt ereignet hat. Wir alle reagieren darauf, und wir haben in diesem Bereich eine ziemlich ernsthafte Strategie. Ich denke also, dass dies kein Problem sein wird. Wir sind ein großes Unternehmen mit Skalenvorteilen und können uns daher gleichzeitig auf einige wenige verschiedene Bereiche konzentrieren. Ich sehe darin kein grundlegendes Problem, solange wir Fortschritte machen. Ich denke, dass wir in diesem Bereich in einer Phase sind, in der 30 bis 60 Tage wie fünf Jahre dauern.
2. Die Transformation der AI-Suche und die Zukunft des Geschäftsmodells
Kevin Roose: Ein weiteres Thema, das viel Aufmerksamkeit erregt hat, sind die Änderungen, die Sie diese Woche an der Google-Suchleiste vorgenommen haben. Dies ist die größte Veränderung seit 25 Jahren. Ich denke, viele haben erwartet, dass irgendwann die herkömmliche Google-Suchoberfläche verschwinden würde, die 10 blauen Links vielleicht verschwinden würden, und Sie würden direkt den AI-Modus als Standardoption wählen. Aber Sie haben dies bisher nicht getan. Obwohl es viele Integrationen gibt, können die Benutzer immer noch die 10 blauen Links sehen, wenn sie möchten. Glauben Sie, dass diese Situation irgendwann verschwinden wird? Werden Sie es wie ein Pflaster abreißen und direkt in den Voll-AI-Modus gehen?
Sundar Pichai: Es ist wichtig, die Benutzer bei diesem Prozess zu begleiten und sicherzustellen, dass das Produkt ihren Erwartungen entspricht. Also versuche ich, nicht zu hastig zu handeln. Es ist sehr klar, dass die Reaktionen der Menschen auf diese Veränderungen positiv sind. Dies können wir sehr deutlich an den langfristigen Produktindikatoren sehen, also verstehen wir dies.
Aber die Menschen möchten, dass die Suche schnell ist und ihnen die Möglichkeit gibt, schnell mit Inhalten im Internet in Verbindung zu treten. Dies ist für uns wichtig. Sie werden also sehen, wie wir das Produkt stetig und sorgfältig verbessern. Vor einem Jahr hatten wir noch keinen AI-Modus, aber jetzt nutzen viele Menschen ihn, und wir haben den Übergang in diesen Modus nahtloser gemacht. Dies ist ein kontinuierlicher Prozess, Quellen und Links werden immer ein Teil der Suche bleiben.
Kevin Roose: Casey hat mir auf dem Weg hier erzählt, dass er in letzter Zeit fast keine herkömmliche Google-Suche mehr durchgeführt hat und jetzt ausschließlich die AI-Suche nutzt. Wenn Sie das hören, denken Sie "Das ist cool, das ist der Typ von Benutzer, den ich jetzt brauche" oder fühlen Sie eine gewisse Angst, weil der herkömmliche Suchwerbebetrieb für Sie ein ziemlich guter Geschäftszweig ist?
Sundar Pichai: Im Gegenteil, im AI-Modus kann der Agent für Sie mehr tun als vor 10 Jahren. Ich denke, dass der wirtschaftliche Wert immer von der Gesamtmenge des Nutzens abhängt, den Sie für die Benutzer schaffen. Wir alle glauben, dass der Nutzen, den wir für die Benutzer schaffen, im Laufe der Zeit zunimmt, der Wettbewerb intensiver wird und die Auswahl größer wird. Ich bin also mit dem Modell, das Abonnements und Werbung kombiniert, sehr zufrieden. Das richtige Geschäftsmodell wird bestehen bleiben. In dieser neuen Welt ändert sich die Ökonomie von Adam Smith nicht.
3. Die öffentliche Angst vor der Künstlichen Intelligenz und die gesellschaftliche Reaktion
Kevin Roose: Lassen Sie uns über die öffentliche Wahrnehmung der Künstlichen Intelligenz sprechen. Eine Umfrage von The New York Times und CNN in dieser Woche hat ergeben, dass nur etwa 16 % der Menschen die Künstliche Intelligenz als hauptsächlich positiv einstufen, während etwa 35 % sie als hauptsächlich negativ sehen. Wie bewerten Sie die gegenwärtige Ablehnung der Künstlichen Intelligenz? Wie stark glauben Sie, dass Google diese Wahrnehmung verändern kann?
Sundar Pichai: Ich betrachte die Künstliche Intelligenz immer als die tief