Superknoten: Der Revolutionary Motor in der Tiefen Zone der Rechenleistungsentwicklung

Superknoten treiben die "Übertragung von Rechenlasten aus Ost nach West 2.0" voran und verbessern die Effizienz der Rechenleistung.

In letzter Zeit wurde in der „15. Fünfjahresplanung” die Rechenleistung als „Kernfaktor der neuen Produktivkraft in der digitalen Wirtschaftszeit” festgelegt, und es wurde das Ziel formuliert, bis 2030 die Rechenleistungskapazität der intelligenten Rechenzentren weltweit an der Spitze zu platzieren.

Das „Östliche Daten - Westliche Rechnung”-Projekt, das als Kern der chinesischen Rechenleistungskapazitätsverteilung fungiert, hat derzeit ein Rechenleistungskapazitätsnetzwerk aufgebaut, das acht nationale Schlüsselknoten und zehn Datenzentrumskluster abdeckt. Vor diesem Hintergrund ist die „Superknoten”-Architektur als Schlüsseltechnologie für den Sprung der Rechenleistungseffizienz in der 2.0 - Ära des „Östliche Daten - Westliche Rechnung”-Projekts entstanden. Durch die Ultrahochdichte - Berechnung, die Integration heterogener Ressourcen und die vollständige Flüssigkeitskühlungstechnologie löst sie systematisch die Probleme bei der Errichtung von Rechenleistungsknoten. Sie eröffnet neue Wege für Szenarien mit hohem Rechenleistungsbedarf wie KI - Training, Finanzanalyse und industrielle Simulation.

Die Rechenleistungskrevolution tritt in die Tiefe: Der Superknoten entsteht

Derzeit befindet sich die digitale Transformation von Unternehmen in der Phase der „tiefgehenden Nutzung von Daten”. Der Bedarf an KI - Großmodelltraining wächst exponentiell, und die Rechenleistungsschranken der traditionellen Datenzentrumarchitektur werden immer deutlicher. Laut Daten der Ministerium für Industrie und Informationstechnik macht der jährliche Stromverbrauch der chinesischen Datenzentren bereits mehr als 2 % des gesamten sozialen Stromverbrauchs aus. Die Leistungsdichte pro Rack schwankt seit langem im Bereich von 8 - 15 kW und kann die exponentielle Rechenleistungsnachfrage von neuen Szenarien wie KI - Großmodelltraining kaum befriedigen. Vor diesem Hintergrund hat das „Östliche Daten - Westliche Rechnung”-Projekt ausdrücklich die Errichtung eines nationalen integrierten Rechenleistungskapazitätsnetzwerks gefordert und verlangt, dass zwischen den Schlüsselknoten eine effiziente Rechenleistungskapazitätsplanung und ein grüner und kohlenstoffarmer Betrieb möglich sind.

Im Allgemeinen werden die massiven Rechencluster eines integrierten Rechenleistungskapazitätsnetzwerks in zwei Erweiterungsstrategien unterteilt: Scale - Up (vertikale Erweiterung) und Scale - Out (horizontale Erweiterung). Die Superknotentechnologie als innovative und integrierte Datenzentrumarchitektur zielt darauf ab, durch die Scale - Up - Architektur und das Design von Ultrahochdichte - Racks heterogene Rechenressourcen wie CPU, GPU und DPU zu integrieren und in Kombination mit einem vollständigen Tauchflüssigkeitskühlungssystem die PUE - Werte auf unter 1,05 zu senken und damit eine maximale Energieeffizienz zu erreichen. Gleichzeitig bringt sie die Berechnung und die Datenspeicherung an den Netzwerkrand, um Daten schneller zu verarbeiten und die Latenzzeit zu verringern. Die Superknotenarchitektur bietet durch die effiziente Datenverarbeitung und - speicherung in Datenzentren bessere Leistung und Skalierbarkeit für die Anforderungen an Cloud - Computing - Dienste.

Nach einem Bericht von Huibo Investment Research unterstützt Scale - Up dank Technologien wie NVLink und PCle die Tensor - Parallelität und die Expert - Parallelität, wobei die Latenzzeit im Bereich von Hunderten von Nanosekunden liegt. Scale - Out hingegen stützt sich auf Infiniband und Ethernet und unterstützt die Datenparallelität, mit einer Latenzzeit von etwa 10 Mikrosekunden. Der Superknoten als verstärkte Version von Scale - Up verfügt auch über die Fähigkeit der Speichersemantik, wodurch die Komplexität des Netzwerks verringert werden kann.

Beobachtungen zeigen, dass der Superknoten als wichtiger Industriestandard von vielen Serverherstellern in China und im Ausland als nächste Generation von Lösungen gewählt wurde. In praktischen Tests im Zhangbei - Superdatenzentrum von Alibaba Cloud hat die Superknotenarchitektur die Effizienz des KI - Trainings um 40 % gesteigert und gleichzeitig die Gesamtbesitzkosten um 35 % gesenkt.

Die breite Anwendung von Superknoten bietet nicht nur die wesentliche Infrastrukturstütze für das chinesische „Östliche Daten - Westliche Rechnung”-Projekt, sondern ist auch die Lösung für Unternehmen, um mit dem Anstieg der Rechenleistungskosten und dem Problem der Rechenleistungseinzelinseln umzugehen.

Die globale Rechenleistungskapazitätsindustrie: Wachstum und Schmerzen gehen Hand in Hand

Aufgrund des enormen Bedarfs, der durch das Training und die Inferenz von KI - Großmodellen entsteht, hat die globale Verteilung der Rechenleistungskapazität derzeit die Phase des strategischen Wettlaufs betreten. Die Branche prognostiziert, dass das globale Investitionsvolumen in die Rechenleistungskapazitätsinfrastruktur bis 2025 auf über 520 Milliarden US - Dollar steigen wird, was einem Jahr - über - Jahr - Anstieg von 55 % entspricht. Die Vereinigten Staaten expandieren global durch das „Unternehmens - dominiertes + staatliches Enablement”-Modell. China hingegen hat unter der Führung nationaler Strategien wie dem „Östliche Daten - Westliche Rechnung”-Projekt ein „Doppelspur”-Modell mit Internetunternehmen und Telekommunikationsbetreibern entwickelt. Die Vereinigten Staaten behalten die Spitze dank des Chip - Ökosystems, während China bei der Verteilung der intelligenten Rechenleistungskapazität und der regionalen Schlüsselknoten rapide aufsteigt. Hersteller wie Huawei haben ein eigenständiges und kontrollierbares Rechenleistungssystem durch die heterogene Mehrkernarchitektur und die optisch - elektrische Hybridverbindungstechnologie aufgebaut. Hinter dem raschen Wachstum gibt es jedoch auch strukturelle Probleme - die Entwicklung der Rechenleistungskapazitätsindustrie weist deutliche strukturelle Widersprüche wie fehlende Übereinstimmung zwischen Angebot und Nachfrage, geringe Effizienz, hohe Kosten, Energieverbrauchsdruck und Architekturbeschränkungen auf.

Unter der Förderung des „Östliche Daten - Westliche Rechnung”-Projekts hat sich in China der Aggregationseffekt der Rechenleistungskapazitätsschlüsselknoten bereits angezeigt, und das weltweit größte Datenzentrumskluster wurde errichtet. Die bestehenden strukturellen Probleme sind: Ungleichgewicht zwischen Angebot und Nachfrage in Ost und West, die Netzwerklatenz zwischen verschiedenen Schlüsselknoten behindert die Westwärtsverlagerung von Echtzeitservices; die intelligenten Rechenleistungsservices bleiben auf einer groben Ebene der Hardwareanordnung, und der Mangel an Hardware - Software - Synergie führt zu einer geringen Effizienz der Ressourcen; die Massenanwendung grüner Technologien hinkt hinterher, die traditionelle Architektur nähert sich der Energieeffizienzgrenze, und es besteht ständiger Druck in Bezug auf die Ziele der Kohlenstoffneutralität.

Wo es Herausforderungen gibt, gibt es auch Chancen. Der enorme Energieverbrauch der Rechenleistungseinrichtungen ist ein dringend zu lösendes Problem. Grüne Lösungen wie die Flüssigkeitskühlungstechnologie werden beschleunigt verbreitet und haben das Potenzial, die Energieeffizienz (PUE) der Datenzentren auf ein sehr niedriges Niveau zu senken. Die Schwankungen in der globalen Lieferkette veranlassen die Länder, die Eigenständigkeit und Kontrollierbarkeit der Rechenleistungskapazitätsindustrie, insbesondere in Schlüsselbereichen wie KI - Chips, stärker zu beachten.

Daten zeigen, dass in traditionellen Clustern 40 % der Rechenressourcen aufgrund der Kommunikationslatenz ungenutzt bleiben, während der Superknoten durch die vollständige Interkonnektivitätsarchitektur die MFU (effektive Rechenleistungskapazitätsnutzung) um mehr als 50 % erhöhen kann. Chinesische Rechenleistungskapazitätsunternehmen nutzen in der Situation der Einschränkungen bei der Fertigung hochwertiger Chips die heterogene Zusammenarbeit der Superknoten, um die Leistungslücke einzelner Chips auszugleichen.

Der Superknoten rekonstruiert die Branchenökologie: Vom technologischen Durchbruch zur Szenariorevolution

An diesem wichtigen Punkt des „14. Fünfjahresplans” hat die strategische Bedeutung der Superknotentechnologie die reine technologische Innovation übertroffen. Auf Branchenebene löst die Transformation der Rechenleistungskapazitätsressourcen hin zu Pooling und Serviceorientierung die Doppelprobleme des „Chipmangels” und des „Rechenleistungskapazitätsmangels” in China.

Im Mai dieses Jahres wurde der weltweit erste kommerzielle intelligente Rechen - Ascend - Superknoten im Rechenleistungskapazitätscluster des Großraums Guangdong - Hongkong - Macau (Shaoguan) des China Telecom offiziell veröffentlicht und kommerziell eingeführt. Dieser Superknoten passt sich durch die neue Hochgeschwindigkeitsbusarchitektur natürlich der Architektur des gemischten Expert - Modells (MoE) an, wodurch die Effizienz des Großmodelltrainings und die Inferenzleistung erheblich verbessert werden. Als einziger Schlüsselknoten des nationalen integrierten Rechenleistungskapazitätsnetzwerks in Südchina beschleunigt das Shaoguan - Cluster dank des Leitbildcharakters des Ascend - Superknotens die Bildung einer innovativen Ökosystem mit einer koordinierten Interaktion von „Technologie - Produkt - Industrie”.

Eine Studie des Instituts für Informatik der chinesischen Akademie der Wissenschaften zeigt, dass die Verwendung der Superknotenarchitektur die Clusterleistung chinesischer KI - Chips auf über 85 % des internationalen Spitzenniveaus bringen kann und somit eine Schlüsselstütze für die Förderung der chinesischen Rechenleistungskapazitätsökologie bietet.

In der Szenarienanwendung verändert die technologische Überlegenheit des Superknotens die Branchenökologie. Das vom Superknoten geförderte „Rechenleistung als Service” (CaaS) - Modell ermöglicht es kleinen und mittleren Unternehmen, die Rechenleistungskapazität des Superknotens über API - Schnittstellen bedarfsgerecht anzufordern, ohne eigene Datenzentren aufbauen zu müssen. Dies wird zu neuen Veränderungen im Branchenbetriebsmodell führen.

Besonders bemerkenswert ist, dass die Superknotenarchitektur natürlich das „Östliche Daten - Westliche Training” - Modell unterstützt - die Echtzeitrechenleistungskapazitätsanforderungen in Ostchina werden über ein Netzwerk mit ultra - niedriger Latenzzeit mit den Speicher - Rechenleistungskapazitätsressourcen in Westchina verbunden. Die Integration von Superknoten und 5G - Edge - Computing bringt ferner ein neues koordiniertes Ökosystem von „Cloud - Edge - Endgerät” hervor. Das Auftauchen der innovativen Rechenleistungskapazitätsarchitektur ist die Lösung für Unternehmen, um mit dem Anstieg der Rechenleistungskapazitätskosten und dem Problem der Rechenleistungskapazitätsinseln umzugehen.

Derzeit ist die Rechenleistungskapazität zur Produktivkraft der neuen Ära geworden. Mit der Integration von Technologien wie Photonenrechnung und Speicher - Rechnung - Einheit hat der Superknoten in Zukunft das Potenzial, sich hin zu einer Latenzzeit im Nanosekundenbereich und einer Rechenleistungskapazität im EB - Bereich zu entwickeln und als Infrastrukturbasis in der Ära der allgemeinen Künstlichen Intelligenz (AGI) zu fungieren. Diese aus chinesischen Praktiken hervorgegangene technologische Innovation bietet nicht nur eine „chinesische Lösung” für die globale Entwicklung der Rechenleistungskapazitätsindustrie, sondern bildet auch einen neuen strategischen Vorteil in der Welle der digitalen Wirtschaft und wird zum neuen Motor für die Weiterentwicklung der chinesischen Rechenleistungskapazität in der Tiefe.

Dieser Artikel stammt aus dem WeChat - Account „SiCe Think Tank” und wurde von 36Kr mit Genehmigung veröffentlicht.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Superknoten: Der neue Motor in der tiefen Zone der Rechenleistungsentwicklung

Die Rechenleistungskrevolution tritt in die Tiefe: Der Superknoten entsteht

Die globale Rechenleistungskapazitätsindustrie: Wachstum und Schmerzen gehen Hand in Hand

Der Superknoten rekonstruiert die Branchenökologie: Vom technologischen Durchbruch zur Szenariorevolution