StartseiteArtikel

Die GPU-Branche ist in Aufruhr, und es gibt eine Umstrukturierung in der Nicht-GPU-Branche.

智东西2025-12-17 16:16
Das Aufstieg der Kräfte außerhalb der GPU-Chip-Branche ist unaufhaltsam.

Xindongxi berichtete am 17. Dezember. Heute hat Shanghai GPU-Riese Muxi Co., Ltd. an der STAR-Marke der Shanghai Börse die Glocke geschlagen. Der Eröffnungskurs betrug 700,00 Yuan pro Aktie. Bis zur Mittagspause stieg der Aktienkurs um 687,79 %. Die Gesamtmarktkapitalisierung belief sich auf 329,882 Milliarden Yuan, was den Wettbewerb in der globalen Rechenleistungindustrie auf ein neues Niveau hebt.

In letzter Zeit befindet sich die globale Rechenleistungindustrie in einer Phase intensiver wichtiger Ereignisse.

Im Ausland hat Google TPU auf dem nicht-GPU-Sektor Milliarden von Bestellungen gewonnen und eine Lücke in dem von GPUs dominierten Rechenleistungsmarkt geschaffen. Letzte Woche hat der CEO von Broadcom mitgeteilt, dass Anthropic einen Gesamtauftrag von 21 Milliarden US-Dollar (etwa 148,6 Milliarden Yuan) an Broadcom gegeben hat, und es gibt auch Kaufabsichten von Techriesen wie Meta. Auf GPU-Ebene hat die USA Nvidia gestattet, den H200 AI-Chip nach China zu verkaufen, aus Angst, den chinesischen Markt zu verlieren.

Im Gegensatz dazu steigt die Hitze der Rechenleistungindustrie in China ebenfalls kontinuierlich. Das aufregende chinesische AI-Chip-Unternehmen Qingwei Intelligence hat eine Finanzierung von über 2 Milliarden Yuan erhalten, hinter der sich eine seltener Investitionskonstellation befindet. Darüber hinaus geben chinesische AI-Chip-Start-ups intensiv Pläne für Fusionen, Übernahmen und Börsengänge bekannt, und die lokale Rechenleistungsekosystem wird beschleunigt ausgebildet.

Die obigen intensiven Bewegungen in der globalen und chinesischen Rechenleistungindustrie weisen gemeinsam auf eine irreversible Branchenveränderung hin: Die Marktmachtstellung, in der der globale Rechenleistungsmarkt lange Zeit von Nvidia GPUs dominiert wurde, wird gelockert.

Zu Beginn der Entwicklung von Large Language Models hat die starke Nachfrage des Marktes nach allgemeiner Rechenleistung Nvidia GPUs schnell in eine absolute dominante Position gebracht, was fast eine Branchenlage von "kein Training ohne GPU" geschaffen hat.

Heute ersetzen auf der einen Seite nicht-GPU-Chips wie Google TPU und Amazon Trainium3 in einigen Szenarien GPUs in großem Maßstab. Im chinesischen Markt betrug der Anteil von nicht-GPU-Rechenleistungskarten im ersten Halbjahr 2025 bereits 30 %. Produkte wie Cambricon MLU, Kunlunxin ASIC und Qingwei Intelligence's rekonfigurierbarer Chip (RPU) haben unterschiedliche Vorteile gebildet.

Auf der anderen Seite wird in der Investmentbranche berichtet, dass Intel plant, den nicht-GPU-AI-Chip-Unicorn SambaNova für 1,6 Milliarden US-Dollar (etwa 11,29 Milliarden Yuan) (inklusive Schulden) zu erwerben, um seine im Zeitalter der KI verlorene Wettbewerbsfähigkeit zu retten. Auch der nicht-GPU-Unicorn Groq hat in zwei Jahren eine Finanzierung von über 3 Milliarden US-Dollar (etwa 21,3 Milliarden Yuan) erhalten.

▲ Zusammenfassung der neuesten Bewegungen von ausländischen Unternehmen auf dem nicht-GPU-Sektor

Man kann sehen, dass der Aufstieg der nicht-GPU-Chip-Macht unaufhaltsam ist.

Vor diesem Hintergrund, wohin wird die globale Rechenleistungindustrie als nächstes gehen? Welchen Marktplatz kann der nicht-GPU-Sektor einnehmen? Wird es im Zukunft eine Vielfalt von Angeboten geben oder wird es eine dominierende Macht geben? Welcher Weg auf dem nicht-GPU-Sektor hat die beste Chance, sich durchzusetzen? Wir versuchen, die Antworten auf diese Fragen zu finden, indem wir die globale Rechenleistungslage und die Technologiewege einiger führender chinesischer Unternehmen analysieren.

01 Die nächste Phase der globalen Rechenleistungindustrie wird von Pfadunterschieden geprägt sein

Aus den drei Kernaspekten der Nachfrageseite, der unteren Technologie und der globalen Rechenleistungsekosystembildung ist die Veränderung der globalen Rechenleistungslage notwendig und dringend.

Zunächst auf der Nachfrageseite: Dieses Jahr wird als das Jahr der Implementierung von Large Language Models bezeichnet. Die Nachfrage nach Rechenleistung in Inferenzszenarien steigt. Das grobe Modell des einfachen Stapels von GPUs kann die gegenwärtigen Bedürfnisse der Massenimplementierung von Large Language Models nicht mehr erfüllen, was Unternehmen dazu zwingt, effizientere Rechenleistungslösungen zu finden.

Gleichzeitig führt die Einbindung von KI in zahlreiche Branchen zu einer Vielzahl von spezifischen und detaillierten Anforderungen. Szenarien wie KI-Videoerzeugung, KI-Medizinische Diagnose und industrielle digitale Zwillinge haben unterschiedliche Anforderungen an die Energieeffizienz und die Anpassungsfähigkeit der Rechenleistung. Zusammen mit der aktiven Risikoverteilung der Lieferkette und der Vermeidung der Abhängigkeit von einem einzigen Hersteller haben nicht-GPU-Rechenleistungsprodukte eine entscheidende Chance, in den Markt einzudringen.

Zweitens auf der Technikseite: Das Problem der getrennten Speicherung und Berechnung in der traditionellen von Neumann-Architektur wird immer deutlicher. Die Entwurfslogik kann die physischen Grenzen der Hardwareleistung nicht mehr überwinden, und eine Architekturinnovation ist erforderlich, um die Engpässe zu überwinden.

Der nicht-GPU-Weg hat in mehreren Punkten Durchbrüche erzielt. Zum Beispiel hat die spezielle Architektur von Google TPU und die dynamische Anpassungsfähigkeit der chinesischen rekonfigurierbaren Chips in bestimmten Szenarien Leistungs- und Kostenvorteile gebildet.

Schließlich auf der Ekosystemebene: Es ist ein Konsens in der Branche, die Monopolstellung eines einzigen Architekturekosystems zu brechen. Chinesische Open-Source-Frameworks bauen schnell ein lokales Ökosystemkooperationssystem auf, indem sie Kompatibilität und Anpassung sowie eigenständige Optimierung gewährleisten.

Daher entwickelt sich die globale Rechenleistungindustrie in Richtung einer Vielzahl von Wegen, indem die Monopolstellung einer einzigen Architektur gebrochen wird.

Kürzlich hat ein Xinhua-Bericht erwähnt: "Im Bereich der AI-Chips hat Beijing eine eigenständige und kontrollierbare 'Chip-Matrix' gebildet. Kunlunxin, Cambricon, Moore Threads, Qingwei Intelligence... Eine Reihe von chinesischen Starprodukten sind führend in der Leistung."

Darunter ist Moore Threads auf dem GPU-Weg, während Kunlunxin und Cambricon auf dem ASIC-Weg und Qingwei Intelligence auf dem Weg der rekonfigurierbaren Architektur für allgemeine Berechnungen liegen. Die Entwicklungstendenzen dieser vier Unternehmen auf unterschiedlichen Technologiewegen bestätigen genau die Voraussicht von Beijing in der vielfältigen Platzierung im AI-Chip-Sektor und der Sicherstellung der Lieferkettensicherheit.

Hinter diesen offensichtlichen Branchentrends können wir auch einige Kerntrends identifizieren, die die Branchenentwicklung antreiben:

Erstens laufen die beiden Technologiewege von GPU und nicht-GPU parallel. Der GPU-Weg wird in Szenarien, die Grafikrendering, wissenschaftliche Berechnungen und AI-Training kombinieren müssen, weiterhin Vorteile nutzen können, dank seiner reifen Ökosystemkompatibilität und allgemeinen Berechnungsfähigkeit. Der nicht-GPU-Weg zeigt dagegen mit der schnellen Entwicklung von Large Language Models zunächst starkes Wachstumspotenzial im Bereich der AI-Inferenz.

Dabei hat die rekonfigurierbare Architektur aufgrund ihrer allgemeinen Berechnungsfähigkeit eine wichtige Position in den Hauptstrom-AI-Szenarien eingenommen.

Zweitens liegt der Schwerpunkt der globalen Rechenleistungindustrie nicht mehr nur auf der Hardwareleistung, sondern entwickelt sich in Richtung eines ganzheitlichen Layouts von Software, Modellen und Szenarienanpassung. Durch kooperative Innovation wird die Rechenleistung voll ausgeschöpft, um die Beschränkung der Rechenleistung zu vermeiden, und die Modelle werden für verschiedene Hardwarearchitekturen komprimiert, quantifiziert und angepasst.

Dieser Trend zielt im Wesentlichen auf die Maximierung der Rechenleistungseffizienz.

Drittens wächst die Macht der chinesischen Hersteller. In einem Markt, der lange Zeit von westlichen Herstellern dominiert wurde, zeigen chinesische Unternehmen auf dem nicht-GPU-Sektor eine beachtliche Wettbewerbsfähigkeit.

Zusammenfassend lässt sich sagen, dass die nächste Phase der globalen Rechenleistungindustrie unweigerlich zu Pfadunterschieden führen wird.

02 Der Markt für den nicht-GPU-Weg wächst stetig, und die Penetration in China ist höher als global

Die weltweit bekannte Marktforchungseinrichtung Gartner schätzt, dass bis 2027 die Nachfrage nach Rechenleistung für AI-Inferenzanwendungen dazu führen wird, dass die Liefermenge von AI-Beschleunigern (meist nicht-GPU AI-Sonderchips) die von GPUs übersteigt.

Zur gleichen Zeit entwickelt sich der nicht-GPU-Weg in der globalen Rechenleistungindustrie schnell zu einer Kernkraft, die mit GPUs gleichwertig ist, und das Muster eines doppelten Systems im Rechenleistungsmarkt beginnt sich abzuzeichnen.

Ein Bericht der weltweit bekannten Marktforchungseinrichtung IDC zeigt, dass sich der chinesische Markt für nicht-GPU-Chips im Bereich der beschleunigten Berechnung im ersten Halbjahr dieses Jahres deutlich entwickelt hat. Im ersten Halbjahr 2025 betrug der Anteil des chinesischen Marktes für nicht-GPU-Server etwa 30 %, und es wird geschätzt, dass der Marktanteil bis 2028 nahezu 50 % erreichen wird.

Die beschleunigte Penetration von KI in zahlreiche Branchen treibt diesen Trend stark voran.

Huang Renxun, Gründer und CEO von Nvidia, hat in einem Interview erwähnt, dass die Entwicklung von KI-Anwendungen in China extrem schnell ist und die Gesellschaft sehr offen für neue Technologien ist. Dies ist ein Bereich, der ihn besorgt, denn letztendlich wird das Ergebnis dieser industriellen Revolution von der Entwicklung auf der Ebene der AI-Anwendungen abhängen und davon, wer die Verbreitung der Technologie anführt.

Im Vergleich zu GPUs passt der nicht-GPU-Technologieweg besser in Bezug auf Kosten, Energieeffizienz und Szenarienanpassung zu den gegenwärtigen Hauptstrom-AI-Anwendungsszenarien.

Die Anschaffungs- und Betriebskosten der Hardware sind niedriger, was besser für kleine und mittlere Unternehmen und die Anforderungen an die Massenverteilung passt. Es kann durch eine maßgeschneiderte Architektur ein Gleichgewicht zwischen niedrigem Energieverbrauch und hoher Genauigkeit erreichen und eine bessere Energieeffizienz erzielen. Es kann die Rechenleistungsanforderungen von Randgeräten wie autonomem Fahren und industriellem Internet der Dinge erfüllen. Gleichzeitig hat es eine stärkere Echtzeitfähigkeit, Stabilität und Flexibilität und kann sich an unterschiedliche AI-Aufgaben anpassen.

Insbesondere in Hauptstrom-AI-Anwendungsszenarien wie intelligenten Rechenzentren, Large Language Model-Bereitstellungen, Cloud Computing, Robotik und autonomem Fahren hat der nicht-GPU-Weg eine hohe Energieeffizienz für spezifische Lasten, niedrigere Gesamtlebenszykluskosten, eine stärkere Eigenständigkeit und Kontrollierbarkeit der chinesischen Lieferkette und kann durch eine maßgeschneiderte Architektur von Grund auf eine hohe Durchsatzrate und geringe Latenz in der Large Language Model-Inferenz erreichen und mehrere Geschäftslasten kompatibel sein.

Für den Milliarden- oder gar Billionenmarkt von KI wird die nicht-GPU-Lösung unweigerlich einen Platz einnehmen.

Objektiv betrachtet ist die Entwicklung von nicht-GPU-Chips noch nicht so reif wie die von GPUs. Die Ökosystemreife der meisten nicht-GPU-Chips ist unzureichend, und es fehlt an einem vollständigen Softwarewerkzeugkasten und einer reichen Unterstützung von Open-Source-Frameworks. Darüber hinaus ist die Entwicklung in der Anfangsphase, was auch eine beträchtliche Herausforderung für die frühen Forschungs- und Entwicklungsinvestitionen von Unternehmen darstellt.

Dies bestätigt auch indirekt, dass die beiden Technologiewege von GPU und nicht-GPU Vor- und Nachteile haben und keine einfache Ersetzungsbeziehung zueinander haben.

03 Die Analyse der Strategien chinesischer führender Chipunternehmen zeigt, dass der rekonfigurierbare Sektor stark wächst

Um die aktuelle Entwicklungslage des nicht-GPU-Sektors in China zu verstehen, können wir uns auf einige Kernunternehmen konzentrieren.

Die AI-Branche in Beijing ist repräsentativ. Im Jahr 2024 erreichte das Volumen der Kern-AI-Branche fast 350 Milliarden Yuan, was fast die Hälfte des nationalen Volumens ausmacht. Die unteren Chipunternehmen, die diese Branche unterstützen, sind noch wichtiger.

Deshalb sind die Kunlunxin, Cambricon, Moore Threads und Qingwei Intelligence, die vier repräsentativen chinesischen Chipunternehmen aus Beijing, die in einem Xinhua-Bericht erwähnt wurden, ein lebendiges Abbild der florierenden Entwicklung der chinesischen AI-Branche. Durch deren Entwicklungspfade können wir die tiefgreifenden Veränderungen in der chinesischen AI-Chip-Industrie besser verstehen.

▲ Die Liefermengen der vier repräsentativen Chipunternehmen aus Beijing im ersten Halbjahr 2025 befanden sich in China unter den Spitzenplätzen

Von diesen vier Unternehmen gehört Moore Threads zur GPU-Camp, während die anderen drei zur nicht-GPU-Camp gehören. Cambricon und Kunlunxin konzentrieren sich auf den ASIC-Weg, während Qingwei Intelligence auf der rekonfigurierbaren Architektur für allgemeine Berechnungen basiert.

Es ist zu beachten, dass dies nicht alle Wege auf dem gegenwärtigen nicht-GPU-Sektor sind, aber diese von der Stadt Beijing anerkannten Unternehmen sind sehr repräsentativ. Sie zeigen sowohl die Strategie der chinesischen nicht-GPU-Unternehmen als auch die starke Unterstützung auf Regierungsseite.

Da die technologischen Vorteile von GPUs in der Branche weit bekannt sind, haben wir hauptsächlich die anderen beiden nicht-GPU-Wege analysiert.

Die ASIC-Architektur ist eine integrierte Schaltung, die für eine bestimmte Anwendung entwickelt wurde. Google TPU ist ein ASIC-Chip. Der wichtigste Vorteil von ASIC ist