Zhou Hongyi: Chinesische Chips haben die Chance, die anderen zu überholen

Die Nachfrage nach Inferenz hat stark zugenommen.

Der Zhou Hongyi, der sich früher in Livestreams und Autoschauern herumtrieb, ist verschwunden.

In den letzten 12 Monaten scheint Zhou Hongyi bewusst die "Trendformeln" zu meiden, was einen deutlichen Kontrast zu seiner früheren Verhaltensweise bildet. Damals gründete er mit Lei Jun auf der Autoschau ein "CP", veranstaltete eine Autoschau vor seinem Firmengebäude und hielt ständig Livestreams und veröffentlichte Videos rund um Künstliche Intelligenz.

Kürzlich trat Zhou Hongyi erneut in einer Veranstaltung vor der Öffentlichkeit auf. Er wirkte etwas "starr" und verspottete sich selbst, indem er sagte, er sei wie ein Roboter. "Ich habe mir eine Augenoperation durchgeführt lassen und die Linse gegen eine künstliche Linse ausgetauscht. Deshalb sehe ich wohl noch mehr wie ein Roboter aus."

Nachdem er sich die künstliche Linse eingesetzt hat und keine Brille mehr trägt, sagte Zhou Hongyi, dies sei, um das "AI-Brille" bequemer tragen zu können.

"Dieser Gegenstand ist ziemlich schwierig herzustellen", sagte Zhou Hongyi. "Bisher habe ich keine besonders gute Anwendungsumgebung gefunden."

Die AI-Brille ist eine der Verbindungen zwischen Zhou Hongyi, der 360-Gruppe und der Künstlichen Intelligenz. Als er zu den dazugehörigen Geschäftsfeldern gefragt wurde, gab Zhou Hongyi umgangssprachlich eine Antwort über den Fortschritt. Er ist der Meinung, dass eine intelligente Brille, um Menschen zum Tragen zu verleiten, leistungsstarke Funktionen haben muss. Doch desto leistungsstärker die Funktionen sind, desto mehr Strom verbraucht die Brille und desto schwerer wird sie. Dies ist ein Widerspruch, der kurzfristig nicht zu lösen ist.

Im Vergleich zu AI-Hardware interessiert Zhou Hongyi sich mehr für die Entwicklung der dahinterliegenden Modelle, Agenten und Rechenleistung. Im Jahr 2026 brachte Zhou Hongyi auf der "Zweiten Nationalversammlung" drei Anträge ein, die sich auf das Gebiet der Künstlichen Intelligenz konzentrieren. Diese drehen sich um die "Doppelbelebung" von Agententechnologie und Fachkräften, die Optimierung der Rechenleistung für Inferenz und die Unterstützung der breiten Anwendung von sicheren Agenten.

Zhou Hongyi sagte: "Anthropic hat viele Probleme in der Sicherheitslösung gelöst, indem es AI-Programmierung und AI-Schadensuche eingesetzt hat. Deshalb habe ich einen Vorschlag gemacht, auf AI-(Sicherheits-)Agenten zu achten."

Der Vorschlag für die Sicherheit steht auch in engem Zusammenhang mit seiner Zusammenfassung der Branche im Jahr 2025. Er sagte: "Wenn Agenten anfangen, zu arbeiten, bedeutet dies auch, dass sie möglicherweise fehlerhafte Arbeit leisten. Gleichzeitig hat die Produktion von AI-Code stark zugenommen, aber AI übernimmt die Fehler der Menschen, und das Problem der Sicherheitslücken wird vervielfacht."

Trotz der vorhandenen Probleme und Risiken betont Zhou Hongyi, dass die AGI stetig voranschreitet.

Bezüglich der tieferen Rechenleistungseinheit meint Zhou Hongyi, dass die Rechenleistung in Trainingsrechenleistung und Inferenzrechenleistung aufgeteilt werden sollte. "Ich denke, dass bei der Entwicklung der Trainingsrechenleistung noch etwas Raum für Wachstum besteht, aber der Entwicklungsprozess der Inferenzrechenleistung hat unbegrenzten Raum."

Bei der Vorhersage der Kerntrends für das Jahr 2026 betont Zhou Hongyi auch den Wert der Inferenzrechenleistung: "Die Inferenzrechenleistung wird zu einem strategischen Schlüsselgebiet."

Zhou Hongyi ist der Meinung, dass im Jahr 2026 die großen Modelle und die Agenten synchron auf zwei Ebenen evolvieren werden. Als der zentrale Träger für die Umsetzung von AI-Fähigkeiten werden Agenten zu digitalen Mitarbeitern von Unternehmen und persönlichen Assistenten von Individuen. Sie werden von "Chatten" zu "Arbeiten" übergehen und Ihnen 7×24 Stunden komplexe Aufgaben erledigen. Diese Evolution wird auch die Interpersonalbeziehungen neu gestalten. Die Menschen werden von der eigenen Arbeit zu der Aufgabe übergehen, Ziele für die Agenten zu setzen, Pläne zu erstellen und die Ergebnisse zu überprüfen.

Diese Veränderung der Interpersonalbeziehungen löst leicht die Diskussion über die "Substitution des Menschen durch AI" aus, aber Zhou Hongyi gibt eine negative Antwort. Er sagt: "Die Anforderungen an die Menschen werden höher. Es werden eine große Anzahl von kombinatorischen Fachkräften benötigt, die sowohl die Geschäftsprozesse verstehen als auch wissen, wie man Agenten verwaltet."

Im Folgenden finden Sie die Transkription der Diskussion mit Zhou Hongyi. Sie wurde unter Beibehaltung der ursprünglichen Bedeutung gekürzt und angepasst:

01 Die chinesischen Chips überholen auf der Kurve

Zhou Hongyi: Hallo, liebe Leute! Ich möchte vorschlagen, dass die Fragen etwas konkreter sein sollten. Ich bin nicht gut darin, auf allgemeine Fragen zu antworten.

Ich habe mir eine Augenoperation durchgeführt lassen, nicht eine Lidspreizoperation, sondern ich habe die Linse gegen eine künstliche Linse ausgetauscht. Deshalb sehe ich wohl noch mehr wie ein Roboter aus.

Frage: Gibt es in diesem Jahr irgendwelche Anträge oder Vorschläge im Zusammenhang mit AI-Technologie? Welche Veränderungen können sie für das Leben der Menschen bewirken?

Zhou Hongyi: Ich interessiere mich für drei Bereiche.

Erstens, wie ich bereits erwähnt habe, ist die AI-Unterstützung für die Sicherheit wichtig. Nehmen wir Anthropic als Beispiel. Durch die AI-Programmierung und die AI-Schadensuche können viele Probleme in der Sicherheit, die früher nicht gelöst werden konnten, nun gelöst werden. Deshalb habe ich einen Vorschlag gemacht, auf AI-Agenten zu achten. Die 360-Gruppe hat bereits etwa einige Dutzend Arten von Tausenden von AI-Sicherheitsagenten entwickelt. Diese Agenten können AI nutzen, um Softwarelücken zu finden, können automatisch funktionieren und können Hackeragenten anderer Länder abwehren. Sie können auch das AI-Sicherheitsproblem lösen. Derzeit nutzen bereits zwei Millionen chinesische Klein- und Mittelunternehmen unsere AI-Agenten kostenlos, um die Sicherheit und den Betrieb ihrer Unternehmen in Echtzeit zu schützen.

Zweitens interessiere ich mich dafür, wie AI in China umgesetzt werden kann. Ich habe ein "Sechskraft"-Modell entwickelt. China hat in der Energie- und Elektrizitätsversorgung hervorragende Leistungen erzielt. Mit der Unterstützung von Energie und Elektrizität kann die Rechenleistung durch die Chips erzeugt werden. Ich schlage vor, die Rechenleistung in Trainingsrechenleistung und Inferenzrechenleistung zu unterteilen. Ich denke, dass bei der Entwicklung der Trainingsrechenleistung noch etwas Raum für Wachstum besteht, aber der Entwicklungsprozess der Inferenzrechenleistung hat unbegrenzten Raum. Deshalb sollten die Regionen bei der Entwicklung der Rechenleistung eher auf die Inferenzrechenleistung setzen.

Drittens interessiere ich mich dafür, wie Unternehmen und Privatpersonen schnell AI nutzen können. OpenClaw hat uns einen Anreiz gegeben, die Dinge zu vereinfachen. Deshalb schlage ich den Begriff einer offenen Agentenplattform vor, um die Infrastruktur der Agenten im Hintergrund zu verstecken. So können normale Unternehmen und Privatpersonen leicht ihre eigenen Agenten erstellen und ihre eigenen Fähigkeiten erlernen.

Viertens möchte ich in diesem Jahr die Schulung von Agenten in ganz China durchführen.

Frage: Sie haben erwähnt, dass die Inferenzrechenleistung in China in Zukunft möglicherweise ein dringender Bedarf sein wird, aber derzeit liegt der Schwerpunkt eher auf der Trainingsrechenleistung. Wie sollte die Anordnung angepasst werden?

Zhou Hongyi: Es war ursprünglich sinnvoll, auf die Trainingsrechenleistung zu setzen, denn vor zwei Jahren war das große Modell noch nicht trainiert und hatte nicht die erforderliche Leistung. Damals war die Anwendung noch nicht möglich, und alle sprachen über das Training. Während des "Hunder-Modell-Kampfes" war die Trainingsrechenleistung sehr wichtig.

Ab dem vergangenen Jahr hat das große Modell die erforderliche Leistung erreicht und kann Inferenz durchführen. Die Fähigkeiten des Basis-Modells sind ausreichend, und es ist nicht mehr notwendig, das Modell erneut zu trainieren. Jetzt können die verschiedenen Branchen und Einheiten ihre Anwendungen entwickeln, ohne dass sie das Branchen-Modell trainieren müssen. Denn die Datenmenge für das Training ist zu klein und hat keine Bedeutung. Es ist besser, die Energie auf die Entwicklung von professionellen Agenten auf Basis des großen Modells zu verwenden.

In diesem Fall verbrauchen die Agenten eine enorme Menge an Rechenleistung. Wie viele Token können Sie beim Chatten verwenden? Bei der Erstellung eines Kurzfilms können leicht Millionen von Token verbraucht werden. Das heißt, wenn die Agenten tatsächlich für Unternehmen arbeiten, verbrauchen sie eine erstaunliche Menge an Energie und Rechenleistung.

Deshalb sagte Huang Renxun, dass die Rechenleistung in der Anwendungszeit um eine Milliarde Mal ansteigen muss.

Warum hat OpenAI später in AMD investiert? Es hofft, die AMD-Chips nicht für das Training, sondern für die Inferenz zu verwenden. Schließlich hat man festgestellt, dass die Anforderungen an die Inferenz-Chips und die Trainings-Chips unterschiedlich sind.

Huang Renxun hat kürzlich 20 Milliarden US-Dollar für ein Unternehmen namens Groq ausgegeben, das Inferenz-Chips herstellt. Dies zeigt, dass auch NVIDIA diesen Weg gehen will. Auch Broadcom hat viele Bestellungen erhalten. Amazon, Microsoft, Google und Facebook entwickeln alle Inferenz-Chips, weil alle den Inferenz-Kosten senken müssen.

Heute ist es für die chinesische Chipindustrie möglich, in kurzer Zeit die Fähigkeit von B200 zu erreichen. Es braucht jedoch einige Zeit, um die CUDA-Ökosystem zu überwinden. Die Herstellung von spezialisierten Transformer-Inferenzalgorithmen, die weniger anspruchsvoll sind als die NVIDIA-GPU, ist jedoch weniger schwierig. Außerdem können diese Chips einige revolutionäre Veränderungen bringen.

Viele Unternehmen benötigen eine private Anordnung. Ihr großes Modell und ihre Agenten sollten in ihrem Unternehmen hinterlegt werden, und ihre Rechenleistung sollte lokalisiert werden. Mit billigen Inferenz-Chips ist die Anordnung für Unternehmen sehr bequem.

In Zukunft müssen viele intelligente Hardwaregeräte an den Endgeräten und am Rand platziert werden. Beispielsweise haben Sie viele Kameras in der intelligenten Stadt installiert. Wenn Sie alle Kameradaten an ein Zentrum übertragen, ist die Bandbreite unzumutbar und der Speicherbedarf sehr hoch. Wenn die Kosten für die Inferenz-Chips sinken, beispielsweise wenn ein 500T- oder 100T-Chip nur einige Zehn Euro kostet, kann jede Kamera eine einfache AI-Verarbeitungsfähigkeit erhalten.

Die Chinesen können alles billig herstellen. Wenn wir Inferenz-Chips herstellen, können Roboter über lokale Rechenleistung verfügen. Komplexe Aufgaben können an die Cloud-Rechenleistung weitergeleitet werden. Dies hat eine sehr große strategische Bedeutung!

Frage: Können Sie mit einigen Schlüsselwörtern die Entwicklung der Künstlichen Intelligenzindustrie im Jahr 2025 zusammenfassen und einige Kerntrends für das Jahr 2026 vorhersagen?

Zur Zusammenfassung der AI-Entwicklung im Jahr 2025 habe ich drei Schlüsselwörter:

Erstens, die AGI wird stetig verwirklicht. Die AI entwickelt sich schnell. Wenn sie mit konkreten Geschäftsprozessen kombiniert wird und zu einem Branchen-Spezialisten gemacht wird, werden Sie feststellen, dass sie viel klüger ist als Sie.

Zweitens, das Jahr der Agenten. Verschiedene vertikale Agenten beginnen aufzutauchen. Insbesondere die Popularität von OpenClaw vor dem Jahranfang hat es den normalen Menschen leichter gemacht, sich vorzustellen, dass Agenten ihre eigenen digitalen Assistenten sind, die auf dem Computer arbeiten können.

Drittens: Neue Herausforderungen in der AI-Sicherheit. Wenn die Agenten anfangen, zu arbeiten, bedeutet dies auch, dass sie möglicherweise fehlerhafte Arbeit leisten. Gleichzeitig hat die Produktion von AI-Code stark zugenommen, aber AI übernimmt die Fehler der Menschen, und das Problem der Sicherheitslücken wird vervielfacht.

Diese neuen Herausforderungen haben sich bereits im Jahr 2025 gezeigt. Wenn wir auf das Jahr 2026 blicken, glaube ich, dass es die folgenden Kerntrends gibt:

Erstens, die Inferenzrechenleistung wird zu einem strategischen Schlüsselgebiet. Mit der Stabilisierung der Trainingsrechenleistung und der Kombination von Agenten und Branchen-Szenarien beginnt der Bedarf an Inferenzrechenleistung zu explodieren. Dies ist eine Chance für die chinesische Chipindustrie, auf der Kurve voranzugehen, und es ist auch der Schlüssel dafür, dass Klein- und Mittelunternehmen und Privatpersonen Agenten nutzen können.

Zweitens, die doppelte Evolution von großen Modellen und Agenten. Während sich die Modelle entwickeln, entwickeln sich auch die Agenten. Als der zentrale Träger für die Umsetzung von AI-Fähigkeiten werden Agenten zu digitalen Mitarbeitern von Unternehmen und persönlichen Assistenten von Individuen. Sie werden von "Chatten" zu "Arbeiten" übergehen und Ihnen 7×24 Stunden komplexe Aufgaben erledigen.

Drittens, die Eskalation des Sicherheitswettbewerbs. Es ist erforderlich, AI mit AI zu bekämpfen. Einerseits beginnen Hacker, mit Agenten Angriffe zu starten. Sie können 7×24 Stunden ununterbrochen angreifen und können sogar temporär Angriffswerkzeuge schreiben. Es ist unmöglich, diese Angriffe mit menschlicher Kraft abzuwehren. Andererseits kann die AI selbst Probleme verursachen - Halluzinationen, Manipulation, falsches Löschen von Dateien und sogar physische Schäden, wenn Roboter gehackt werden. Deshalb muss in 2026 mit sicheren Agenten gegen Hacker-Agenten vorgegangen werden, und AI muss eingesetzt werden, um die neuen Probleme, die durch AI verursacht werden, zu lösen.

Viertens, die Umgestaltung der Mensch-Maschine-Beziehung. Die AI tritt als digitaler Mitarbeiter in den Arbeitsplatz ein. Die Menschen gehen von der eigenen Arbeit zu der Aufgabe über, Ziele für die Agenten zu setzen, Pläne zu erstellen und die Ergebnisse zu überprüfen. Dies erhöht die Anforderungen an die Menschen. Es werden eine große Anzahl von kombinatorischen Fachkräften benötigt, die sowohl die Geschäftsprozesse verstehen als auch wissen, wie man Agenten verwaltet.

02 Das Modell-Krieg und die "Krebse"

Frage: Wie sollten Sie das Modell-Krieg während der Frühlingsfeier betrachten? Warum ist die Iteration der großen Modelle so intensiv?

Zhou Hongyi: Der Kerngrund ist der Erfolg der Open-Source-Strategie.

Domestische Open-Source-Modelle wie DeepSeek und Qianwen haben sich in die internationale Spitzengruppe eingeschlichen. Die Fähigkeiten der Basis-Modelle sind ausreichend, und es ist nicht mehr notwendig, die Modelle erneut zu trainieren. Der Wettbewerb hat sich daher von "Vergleich der Parameter" zu "Vergleich der Umsetzung" und von "Training des Modells" zu "Verwendung des Modells" verschoben.

Der intensive Wettbewerb ist gut, denn er bringt die einzigartigen Stärken der chinesischen AI hervor.

Wir nutzen die "Szenen-Dichte", um die "Chip-Lücke" auszugleichen - Sie haben hochwertige Chips, und wir haben reichhaltige Anwendungs-Szenarien.

Letztendlich ist die intensive Iteration der großen Modelle darauf zurückzuführen, dass alle gesehen haben, dass im zweiten Teil der AI-Entwicklung nicht mehr darum geht, wer das am besten informierte Modell hat, sondern wer die AI tatsächlich einsetzen und umsetzen kann.

Frage: Vor dem Jahranfang war das OpenClaw-"Krebs" sehr beliebt. Können Sie auch über die positiven Auswirkungen auf die Branche und die Probleme und Mängel sprechen? Viele Leute sagen, dass die Token teuer sind, und dass es möglicherweise einige Cent kostet, um "H

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Zhou Hongyi: Ich sehe die Chance, dass die chinesischen Chips die anderen überholen.

01

Die chinesischen Chips überholen auf der Kurve

02

Das Modell-Krieg und die "Krebse"