首页文章详情

Huawei und DeepSeek gehen Hand in Hand einen großen Schritt vorwärts.

苏建勋2025-09-18 17:55
Aus komplexen Gründen wie der internationalen Politik sagte Xu Zhijun auch auf der Pressekonferenz direkt aus, dass die Rechenleistung eines einzelnen Chips von Huawei der von NVIDIA nicht gleichkommt. "Aber Huawei hat dreißig Jahre Erfahrung in der Verbindungstechnologie gesammelt. Das Superknotencomputer von Huawei kann die weltweit stärkste Rechenleistung erzielen und die enorme Nachfrage der Welt bei der KI-Training und -Inferenz befriedigen."

Am 18. September auf der Huawei Connect Conference (HC Conference) in Shanghai hat Xu Zhijun, der rotierende Vorsitzende von Huawei, direkt nach seinem Auftritt die von DeepSeek zu Beginn des Jahres ausgelöste Volksfeier erwähnt.

„Von Anfang des chinesischen Neujahrs bis zum 30. April dieses Jahres haben mehrere Teams gemeinsam gearbeitet und schließlich die Inferenzfähigkeit der Ascend 910B/910C auf ein Niveau gebracht, das die grundlegenden Anforderungen der Kunden erfüllt.“ sagte Xu Zhijun. Nachdem DeepSeek aufgetaucht ist, haben viele staatliche Institutionen und staatliche Unternehmen umgehend DeepSeek integriert. Als Anbieter von Rechenleistung musste auch Huawei reagieren.

Seit der ersten Veröffentlichung des Ascend 310 - Chips im Jahr 2018 und des Ascend 910 - Chips im Jahr 2019 hat Huawei kontinuierlich in die Forschung und Innovation der künstlichen Intelligenz - Basisrechenleistung investiert. Obwohl das von DeepSeek gegründete Modell die Rechenleistungsanforderungen erheblich reduziert hat, ist Xu Zhijun der Meinung, dass für die Entwicklung hin zu AGI und physikalischer KI die Rechenleistung in der Vergangenheit und auch in Zukunft der Schlüssel für die künstliche Intelligenz bleiben wird.

1. Huawei veröffentlicht mehrere Chip - Produkte, und die Planung reicht bis 2028

Xu Zhijun hat angekündigt, dass Huawei für die Zukunft drei Serien von Ascend - Chips geplant hat, darunter die Serien 950, 960 und 970.

Die Ascend 950 - Serie umfasst zwei Chips: 950PR und 950DT. Der 950PR wird im ersten Quartal 2026 auf den Markt kommen, der 950DT im vierten Quartal 2026.

Der Ascend 960 - Chip wird im vierten Quartal 2027 auf den Markt kommen, der Ascend 970 - Chip voraussichtlich im vierten Quartal 2028.

Planung der Veröffentlichung von Huawei Ascend - Chips; Foto vom Autor aufgenommen

Im Vergleich zur vorherigen Generation hat der Ascend 950 in mehreren Aspekten grundlegende technologische Verbesserungen erzielt: Es wird nun die Unterstützung für niedrigpräzise Datenformate wie FP8/MXFP8/HIF8, MXFP4 hinzugefügt. Die Rechenleistung erreicht 1 PFLOPS und 2 PFLOPS, was die Effizienz von Training und Inferenz erheblich verbessert. Die Vektor - Rechenleistung wird stark verbessert, und ein feinerer Zugriff auf den Arbeitsspeicher wird unterstützt. Die Interkonnektivitätsbandbreite wird um das 2,5 - fache auf 2 TB/s erhöht, und es wird die eigenentwickelte HBM - Technologie HIBL1.0 und HIZQ2.0 eingesetzt.

Im Bereich der universellen Rechnung hat Huawei den Kunpeng 950 und den Kunpeng 960 geplant, die jeweils im vierten Quartal 2026 und im ersten Quartal 2028 auf den Markt kommen werden und sich kontinuierlich um die Unterstützung von Superknoten und mehr Kernen sowie höherer Leistung entwickeln werden.

Darüber hinaus hat Huawei offiziell das Interkonnektivitätsprotokoll Lingqu für Superknoten veröffentlicht und die Technologie - Spezifikation von Lingqu 2.0 freigegeben. Seit 2019 wird an Lingqu geforscht, und Lingqu 1.0 hat die kommerzielle Validierung begonnen. Die Freigabe von Lingqu 2.0 zielt darauf ab, die Branche einzuladen, auf der Grundlage von Lingqu relevante Produkte und Komponenten zu entwickeln und eine offene Lingqu - Ökosystem zu gründen.

2. Veröffentlichung des weltweit leistungsstärksten Superknotens

Aus komplexen Gründen wie der internationalen Politik hat Xu Zhijun auch auf der Pressekonferenz offen gesagt, dass die Rechenleistung eines einzelnen Huawei - Chips hinter der von NVIDIA zurückbleibt. „Aber Huawei hat 30 Jahre Erfahrung in der Verbindungstechnologie. Unser Superknotencomputer kann die weltweit stärkste Rechenleistung bieten und die enorme Nachfrage nach KI - Training und - Inferenz weltweit befriedigen.“

Der Superknoten (SuperPod) ist derzeit ein wichtiger Trend in der Entwicklung der intelligenten Rechnung. Xu Zhijun ist der Meinung, dass ein Superknoten physisch aus mehreren Maschinen besteht, aber logisch wie ein einziges Maschinen - System lernt, denkt und schließt.

In Bezug auf die konkreten Fortschritte bei den Superknoten - Geschäften hat Huawei den Atlas 950 SuperPoD und den Atlas 960 SuperPoD veröffentlicht. Der auf dem Ascend 950 - Chip basierende Atlas 950 - Superknoten unterstützt eine Skala von 8192 Karten, besteht aus 128 Rechenschränken und 32 Interkonnektivitätsschränken, hat eine Grundfläche von etwa 1000 Quadratmetern, eine FP8 - Rechenleistung von 8 EFlops, eine FP4 - Rechenleistung von 16 EFlops und eine Interkonnektivitätsbandbreite von 16 PB, was mehr als das 10 - fache der aktuellen globalen Internet - Gesamtbandbreite entspricht.

Präsentation des von Huawei veröffentlichten Atlas 950 SuperPoD; Foto vom Autor aufgenommen

Der Ascend 950 - Superknoten wird im vierten Quartal 2026 auf den Markt kommen. Xu Zhijun hat betont, dass der Atlas 950 - Superknoten der weltweit leistungsstärkste KI - Superknoten zwischen 2026 und 2028 sein wird.

Der andere Atlas 960 - Superknoten unterstützt 15488 Karten, besteht aus 176 Rechenschränken und 44 Interkonnektivitätsschränken. Seine Rechenleistung, sein Arbeitsspeicher und seine Bandbreite verdoppeln sich gegenüber dem Atlas 950. Er ist für das vierte Quartal 2027 geplant.

Xu Zhijun hat besonders erwähnt, dass der Wert eines Superknotens nicht nur auf traditionelle Geschäftsbereiche wie Herstellung, Kommunikation und Rechnung beschränkt ist. Er spielt auch eine wichtige Rolle bei den in der Internet - Branche weit verbreiteten Empfehlungssystemen. Huawei kann auf der Grundlage des Taishan 950 und des Atlas 950 einen hybriden Superknoten aufbauen und eine neue Architekturrichtung für die nächste Generation von tiefen Empfehlungssystemen eröffnen.

Allerdings, obwohl der groß angelegte Superknoten die Fähigkeiten der intelligenten Rechnung und der universellen Rechnung erheblich verbessert, ist die Interkonnektivitätstechnologie noch nicht ausgereift.

Beispielsweise ist die zuverlässige Interkonnektivität von 8192 Karten oder sogar 15488 Karten ein dringend zu lösendes technisches Problem in der Branche. Viele von der Branche veröffentlichte Superknoten - Lösungen konnten bisher keine Massenimplementierung erreichen. Der Kern der Schwierigkeit liegt nicht am Chip selbst, sondern an der noch unreifen Interkonnektivitätstechnologie, die sich in zwei Herausforderungen zeigt:

Erstens, wie kann man eine lange Distanz und eine hohe Zuverlässigkeit erreichen? Ein groß angelegter Superknoten hat viele Schränke, und die Verbindungsdistanz zwischen den Schränken kann 1000 bis 2000 Meter betragen. Die aktuelle elektrische Interkonnektivitätstechnologie hat bei der Übertragung von Hochgeschwindigkeits - Signalen eine begrenzte Distanz und kann maximal die Interkonnektivität von zwei Schränken unterstützen. Die optische Interkonnektivitätstechnologie kann zwar die Anforderungen an eine lange Distanz erfüllen, aber nicht die hohe Zuverlässigkeit, die von einem einzelnen Computersystem verlangt wird.

Zweitens, wie kann man eine extrem hohe Bandbreite und eine extrem niedrige Latenz erreichen? Derzeit besteht ein Faktor von mehr als 5 zwischen der Interkonnektivitätsbandbreite zwischen Karten über verschiedene Schränke und den Anforderungen eines Superknotens. Die beste erreichbare Latenz beträgt nur etwa 3 Mikrosekunden, was immer noch 24 % von den Designzielen des Atlas 950/960 entfernt ist. Wenn die Latenz sich der physikalischen Grenze nähert, ist jede Verbesserung um 0,1 Mikrosekunde äußerst herausfordernd.

Xu Zhijun hat zwei Lösungsansätze erläutert.

Huaweis technologische Erfahrungen auf der Ebene des Superknotens; Foto vom Autor aufgenommen

Erstens, um das Problem der langen Distanz und der hohen Zuverlässigkeit zu lösen, hat Huawei in jeder Ebene des Interkonnektivitätsprotokolls, wie der physischen Ebene, der Datenlink - Ebene, der Netzwerkebene und der Transportebene, ein hochzuverlässiges System eingeführt. Gleichzeitig hat Huawei in die optische Strecke eine hundertnanosekunden - schnelle Störungsdetektion und Schutzumschaltung eingeführt, sodass die Anwendungen bei einem Ausfall oder einer Störung des optischen Moduls nichts merken. Darüber hinaus hat Huawei optische Bauteile, optische Module und Interkonnektivitätschips neu definiert und entworfen. Diese Innovationen und Entwürfe haben die Zuverlässigkeit der optischen Interkonnektivität um das 100 - fache verbessert und die Interkonnektivitätsdistanz auf über 200 Meter erhöht, was sowohl die Zuverlässigkeit der elektrischen Verbindung als auch die Distanz der optischen Verbindung gewährleistet.

Zweitens, um das Problem der hohen Bandbreite und der niedrigen Latenz zu lösen, hat Huawei die Technologien der Mehrport - Aggregation und der hochdichten Verkapselung sowie die Gleichheitsarchitektur und das einheitliche Protokoll überwunden und eine extrem hohe Bandbreite im TB - Bereich und eine extrem niedrige Latenz von 2,1 Mikrosekunden erreicht.

„Nur dank einer Reihe von systemischen und originellen technologischen Innovationen konnten wir die Superknoten - Interkonnektivitätstechnologie meistern, die Anforderungen an eine hochzuverlässige, volloptische Interkonnektivität, eine hohe Bandbreite und eine niedrige Latenz erfüllen und einen groß angelegten Superknoten möglich machen.“ sagte Xu Zhijun.