36Kr Exklusiv | Lenovo Star und Xianfeng führen gemeinsam die Investition an, Anbieter von Wahrnehmungs- und Effizienzmanagementlösungen für KI-Rechenzentren schließt Angel-Finanzierungsrunde ab
Autor | Qiao Yujie
Redakteur | Yuan Silai
Hard Krueger hat erfahren, dass die Xin Gantong Technology Co., Ltd. (im Folgenden als "Xin Gantong" bezeichnet) kürzlich eine Angel-Runde-Finanzierung im Wert von mehreren Millionen Yuan abgeschlossen hat, die von Lenovo Star und Xianfeng gemeinsam angeführt wurde. Die Finanzierung dieser Runde wird hauptsächlich für die Iteration der Chipentwicklung, die Produktverifizierung und die Markterweiterung verwendet.
Mit der kontinuierlichen Erweiterung des Trainingsumfangs von großen Modellen und der Einrichtung von kommerziellen Dienstleistungen ist die Installation von AI-Rechenleistungsinfrastrukturen dringend auf effiziente Betriebsweise angewiesen. Gleichzeitig hat die Hochleistungs-GPU die Rechenleistung in eine Ära mit hoher Energiedichte und hohem Stromverbrauch gebracht.
Von einigen Dutzend GPUs in einem einzigen Schrank bis hin zu Tausenden von Karten-Clustern werden die Stromversorgung, die Wärmeableitung und die Energieverbrauchsmessung im Inneren von Rechenzentren zu neuen technologischen Engpässen. Gleichzeitig haben aufkommende Richtungen wie Weltraumrechenleistung und Orbital-Rechenzentren höhere Anforderungen an die Systemstabilität und die präzise Wahrnehmungsfähigkeit gestellt. Vor diesem Hintergrund hat Xin Gantong sich entschieden, in einen zunehmend wichtigen Abschnitt der Rechenleistungsinfrastruktur einzusteigen - die Strom- und Raummagnetfeldwahrnehmung.
Im Bereich der Strom- und Leistungsaufnahme haben herkömmliche Hall-Sensoren Probleme wie hohes Rauschen und große Temperaturdrift. In Szenarien mit hoher Dichte und hohem Strom ist es schwierig, sowohl den Messbereich als auch die Auflösung zu berücksichtigen, und die Anforderungen von AI-Servern an die fein granularen Stromversorgungsmanagement können nicht erfüllt werden. Herkömmliche Fluxgate-Sensoren verwenden eine Wicklungsstruktur, haben ein großes Volumen und eine niedrige Integrationsdichte und können gleichzeitig nicht den Anforderungen an Hochfrequenzanwendungen entsprechen.
Zhang Naichuan, Mitbegründer der Firma, hat Hard Krueger mitgeteilt, dass derzeit allgemein ein Schichtüberwachungskonzept eingesetzt wird: Auf der Platinenebene werden Spannungsteilerwiderstände für grobe Detektionen verwendet, auf der Modul-Ebene werden Hall-Sensoren eingesetzt, und auf der Bus-Ebene werden herkömmliche Fluxgate-Sensoren verwendet. Aufgrund der großen Unterschiede in Messbereich, Genauigkeit und Ausgangseigenschaften der drei Sensorarten können die Daten nicht vereinheitlicht werden, und es ist schwierig, eine Echtzeitüberwachungs- und Scheduling-Fähigkeit für das gesamte System zu bilden.
Für heutige AI-Rechenzentren reicht es nicht mehr aus, nur den Systemzustand "zu sehen". Es ist vielmehr erforderlich, ein einheitliches, Echtzeit-fähiges und vorhersagbares Wahrnehmungssystem aufzubauen, um die Energieeffizienzoptimierung und das intelligente Betriebswarten zu unterstützen.
Basierend auf diesem Konzept hat die Firma durch Technologien wie MEMS-Kammstruktur, 3D-Stacking-Packaging, CMOS-Analogfrontend, Hochgeschwindigkeits-ADC und On-Chip-Kalibrierungsalgorithmen eine Chip-Ebene-Lösung entwickelt, die die Halbleiterintegration ermöglicht. Die ursprünglich voluminöse Fluxgate-Technologie wurde auf die Chipgröße reduziert, und es wurde gleichzeitig Digitalisierung und hohe Integrationsdichte erreicht. Laut Informationen hat der Kern-Fluxgate-Chip der Firma die erste Chip-Produktion abgeschlossen und eine Genauigkeit von 1 nT und eine Linearität von 0,5 ‰ erreicht.
Erfolgreiche Chip-Produktion der Xin Gantong PerMAG3001 mit Kammstruktur (Quelle/Firma)
Im Gegensatz zu herkömmlichen Einzelpunkt-Sensoren legt Xin Gantong mehr Wert auf die Fähigkeit der "Fusion mehrerer Technologiestapel". Es wurde ein vierstufiges Technologie-System von Chip, ASIC, System bis hin zum intelligenten AIDC-Rechenleistung- und Effizienz-Management-Platform aufgebaut. Mit demselben Technologie-Architektur können drei Szenarien auf Platinenebene, Schrankebene (Rack) und Systemebene (Inlet) abgedeckt werden, und die einheitliche Erfassung und Verwaltung der Wahrnehmungsdaten auf verschiedenen Ebenen des Rechenzentrums können realisiert werden.
Nachdem diese Daten verbunden sind, kann das System den Zustand der Schranklast und des Modulstromverbrauchs in Echtzeit vorhersagen und die Stromversorgung, die Flüssigkeitskühlung und die GPU-Ressourcen dynamisch anpassen, um eine geschlossene Schleife der Optimierung zu erreichen.
Abgesehen von den derzeitigen AI-Rechenzentren ist diese Lösung auch auf den Bereich der Weltraumrechenleistung anwendbar und löst gleichzeitig die Schlüsselanforderungen an das Volumen, das Gewicht, den Stromverbrauch und die Echtzeitreaktion im Weltraum.
Die Chip-Ebene-Fluxgate-Lösung hat von Natur aus die Vorteile der hohen Integrationsdichte, Miniaturisierung und hohen Zuverlässigkeit und kann die speziellen Anforderungen an das Wahrnehmungssystem in der Weltraumumgebung erfüllen. Derzeit hat die Firma bereits mit Satellitenunternehmen zusammengearbeitet, und die Leistung der relevanten Produkte wurde bereits vorläufig verifiziert. Gemäß dem Plan werden die offiziellen Modulprodukte voraussichtlich im zweiten Halbjahr 2026 eingeführt und in die Kunden-Testphase eintreten.
Was das Team betrifft, haben die Kernmitglieder von Xin Gantong reiche Erfahrungen in der Chip- und intelligenten Wahrnehmungsindustrie.
Der Gründer Niu Yuling war früher Chefingenieur für die Chipmontage und -prüfung des US-amerikanischen Qualcomm Snapdragon-Chips und übernahm später die Position des Generaldirektors des US-amerikanischen Forschungszentrums von Yijing Technology sowie die Leitung der Chipentwicklung, -montage und -prüfung. Zhang Naichuan, Mitbegründer, war verantwortlich für die Entwicklung und Massenproduktion der Robin905-Laser-Lidar-Plattform von Tudatong und war Generaldirektor der Chipentwicklung und -technikverwaltung von Yijing Technology sowie Leiter der Siliziumphotonik-Chip-Technologie von Xifeng Optoelectronics.
Im Folgenden ist ein Auszug aus dem Gespräch zwischen Hard Krueger und dem Gründerteam von Xin Gantong:
Hard Krueger: Warum wird bei der "Chip-Ebene-Fluxgate-Plattform" der Aspekt der "Plattform" betont?
Zhang Naichuan: In herkömmlichen Lösungen werden auf verschiedenen Ebenen verschiedene Arten von Sensoren eingesetzt. Obwohl die Messobjekte Strom und Leistung sind, sind das Ausgabe-Format, die Genauigkeitseigenschaften und die Stabilität der Daten nicht einheitlich. Daher ist es schwierig, ein einheitliches Datensystem zu bilden, und es kann auch nicht die System-Ebene-Optimierung und das AI-Training unterstützen. Darüber hinaus sind die meisten herkömmlichen Sensoren analoge Bauteile, die schwer mit modernen digitalen Kommunikationsprotokollen tiefgehend integriert werden können, und die Integrationskosten sind relativ hoch. Daher gibt es derzeit immer noch starke Informationsinseln zwischen verschiedenen Ebenen im Inneren von Rechenzentren, und es fehlt an einer einheitlichen Scheduling-Fähigkeit.
Der Kernwert unserer "Chip-Ebene-Fluxgate-Plattform" liegt darin, dass dasselbe Technologie-Architektur die drei Ebenen der Platinenebene, der Modul-Ebene und der Schrank-Ebene abdeckt. Das heißt: dieselbe Technologie-Richtung; dasselbe Parametersystem; dieselben Datenmerkmale; durch verschiedene Produktformen wird die gesamte Kette der Überwachung des AIDC (AI-Rechenzentrum)-Stromversorgungssystems realisiert. Nachdem die Daten auf der Platinenebene, der Modul-Ebene und der Schrank-Ebene einheitlich erfasst wurden, hat das Rechenzentrum die System-Ebene-Scheduling-Fähigkeit.
Für das Training von großen Modellen, insbesondere das Training von Basis-Modellen, ist die Dauer lang, die Investitionen groß und die Anforderungen an die Systemstabilität hoch. In der Vergangenheit konnten viele Anomalien erst nach dem Auftreten schwerwiegender Störungen erkannt werden. Wenn jedoch eine Echtzeitüberwachung auf der Platinenebene möglich ist, kann frühzeitig eingegriffen werden, wenn Stromschwankungen auftreten, z. B. die Last reduziert und der Stromverbrauch optimiert werden, um die Ausbreitung von Störungen zu vermeiden und die Stabilität des Modelltrainings zu gewährleisten.
Hard Krueger: Warum ist in Weltraumrechenleistungsszenarien auch eine solche Sensorlösung erforderlich?
Zhang Naichuan: Der ursprüngliche Zielmarkt der Firma war eigentlich das AI-Rechenzentrum. Mit der Entstehung von Konzepten wie Weltraumrechnen und Orbital-Rechenzentren haben wir jedoch festgestellt, dass die Anforderungen an das fein granularen Stromversorgungsmanagement in Weltraum-Szenarien ebenfalls dringend sind.
Es gibt hauptsächlich vier Gründe. Erstens sind die Kühlbedingungen extrem begrenzt. Erdgebundene Rechenzentren können Luftkonvektion, Luftkühlung oder sogar Flüssigkeitskühlsysteme zur Wärmeableitung nutzen, während in der Weltraumumgebung keine Luftkonvektion besteht und nur Wärmeleitung und Strahlungskühlung möglich sind. Daher hat das System fast keine Überkühlungskapazität, und die Anforderungen an das Stromverbrauchsmanagement sind sehr hoch. Zweitens ist das System nicht wartbar. Bei Erdgebundenen Geräten können Störungen repariert oder ausgetauscht werden, während die Wartungskosten eines Satelliten nach dem Eintritt in die Umlaufbahn extrem hoch sind oder sogar unmöglich sind. Daher muss auf ein höheres Niveau der Online-Überwachung und vorausschauenden Wartung zurückgegriffen werden. Drittens ist es sehr empfindlich gegenüber dem Gewicht. Jede zusätzliche Gewichtsbelastung erhöht direkt die Startkosten. Daher erfordern Weltraumrechnungsgeräte, dass die Sensoren so klein wie möglich und hoch integriert sind. Viertens müssen Strahlungsschutz und Langzeitzuverlässigkeit berücksichtigt werden. Herkömmliche Sensoren sind nicht für die Weltraumumgebung entwickelt und haben natürliche Beschränkungen in Bezug auf Zuverlässigkeit, Integrationsdichte und Umgebungsanpassungsfähigkeit.
In Weltraumrechnungs-Szenarien ist diese Art von Sensorlösung bereits zu einer Infrastruktur zur Gewährleistung des normalen Betriebs des Systems geworden und gehört zu den starren Anforderungen. Daher erweitern wir auch unsere Kerntechnologie-Schlüsselkompetenzen schrittweise in Richtung Weltraumrechnen.
Hard Krueger: Wie ist der aktuelle Stand der Implementierung der Produkte?
Zhang Naichuan: Im Weltraumsektor hat die Firma das erste Test-Chip produziert und es durch die Modulverifizierung bestätigt. Die Leistung entspricht den Anforderungen der Partner. Gemäß dem Plan werden im zweiten Halbjahr dieses Jahres offizielle Produktproben eingeführt und an die Kunden zur Testung gesendet. Wenn die Testergebnisse den Erwartungen entsprechen, können die ersten Satellitenpartner mit den Sensor-Chips der Firma für die In-Orbit-Verifizierung ausgestattet werden.
Im Bereich der Rechenzentren konzentriert sich die Firma derzeit auf die Entwicklung von Stromdetektionsprodukten. Da die Einführungszeit für Server und Schränke relativ lang ist, wird dieses Jahr hauptsächlich die Kundenverifizierung und die Einführungsplanung durchgeführt. Es wird vorausgesagt, dass im nächsten Jahr die kleine Serienlieferung beginnen und allmählich ein Geschäftsvolumen aufgebaut wird. Sobald der Rechenzentrummarkt in die Massenproduktionsphase eintritt, wird der potenzielle Marktraum noch größer sein.
Meinungen der Investoren:
Lenovo Star: Xin Gantong setzt sich in einen Schlüsselabschnitt der AI-Rechenleistungsinfrastruktur ein, nachdem diese von der "Bauumfang" zur "Betriebseffizienz" übergegangen ist. Mit der Verbreitung von Tausenden von Karten-Clustern und Hochleistungs-Servern wird die fein granularen Strom- und Leistungsaufnahme zu einer grundlegenden Fähigkeit für die Energieeffizienzmanagement, die Störungswarnung und das stabile Training. Wir sind optimistisch, dass das Team das Wahrnehmungssystem des Rechenzentrums mit der Chip-Ebene-Fluxgate-Lösung neu aufbaut und es auf Weltraumrechenleistungsszenarien mit hoher Zuverlässigkeit ausdehnt.
Xianfeng Changqing: Sowohl die Stromüberwachung und die Energieeffizienzoptimierung in AI-Rechenzentren als auch die Umweltwahrnehmung in zukünftigen Weltraumrechnungen, Meeresforschung und geomagnetischer Navigation erfordern eine hochpräzise, zuverlässige und skalierbare Wahrnehmungsfähigkeit. Hochleistungs-Magnetwahrnehmung hat das Potenzial, zu einer neuen Schlüsselinfrastruktur zu werden.
Xin Gantong hat durch die Chip-Ebene-Fluxgate-Technologie die Fähigkeiten, die ursprünglich auf die Spitzenforschung und die Luft- und Raumfahrt beschränkt waren, auf die industrielle Anwendung erweitert und die Anwendungsgrenzen dieses Technologiepfades erheblich erweitert. Derzeit hat die Firma die Chip-Produktion erfolgreich verifiziert und in mehreren Szenarien die Verifizierung und Einführungs durchgeführt. Das Team hat gleichzeitig Erfahrungen in der Chip-Design, der fortschrittlichen Verpackung, der intelligenten Wahrnehmung und der Massenproduktion komplexer Systeme und verfügt über eine starke Fähigkeit zur Integration von interdisziplinären Technologien. Wir hoffen, dass Xin Gantong zu einem neuen intelligenten Wahrnehmungsplattformunternehmen für Schlüsselbereiche wie Rechenleistung, Weltraumfahrt und Meeresforschung wird.