Fast eine Milliarde Yuan Finanzierungen eingetroffen: MoXin beschleunigt Sparse Computing - geschlossenen kommerziellen Zyklus und bringt Ende des Jahres neue Generation von Beschleunigungskarten auf den Markt

Das Netzwerk der Cloud, am Edge und am Endgerät sowie die Rechenleistung hat bereits viele kommerzielle Aufträge gewonnen.

Zhidongxi berichtete am 28. Mai. Heute kündigte die chinesische KI - Chip - Startup MoXin Artificial Intelligence an, dass sie kürzlich die Serie - C - Finanzierung in Höhe von fast 1 Milliarde Yuan erfolgreich abgeschlossen habe. Dies ist auch die neueste bedeutende Finanzierung eines chinesischen KI - Chip - Unternehmens.

Die Finanzierungsgruppe dieser Runde war vielfältig. Sie umfasste das führende staatliche Venture - Capital - Institut Shenzhen Capital Group sowie industrielle Kapitalgeber und marktorientierte Institutionen wie Yanshan Technology, Greater Bay Area Common Home, Liding Capital und Yunsheng Capital. Alte Aktionäre wie Triumph Venture Capital, Chuangxiang Investment und Shengjing Jiacheng und andere Institutionen setzten ihre Beteiligungen fort.

Zur gleichen Zeit kündigte MoXin auch den Fortschritt bei der Einführung neuer Produkte an. Ende dieses Jahres wird seine neue Generation hochleistungsfähiger universeller KI - Inference - Karten SparsePrime vorgestellt werden.

Als eine der wenigen chinesischen Startups, die den differenzierten Ansatz der Sparse - Berechnung verfolgen, hat MoXin bereits mehrere KI - Rechenkarten auf Basis eigens entwickelter Sparse - Chip hergestellt und ein Zwei - Rad - Antriebsmodell von "eigenständige Technologieentwicklung und Vertiefung + Umsetzung in Kunden - Szenarien" aufgebaut.

Bezüglich der Hardwareleistung hat die MoXin - KI - Beschleunigungskarte dreimal in der weltweit führenden KI - Bewertungsmenge MLPerf gewonnen. Die Rechenleistung der MoXin - S30, S40 - Einzelkarten und der Mehrkarten - Cluster hat die von NVIDIA A100 und H100 übertroffen.

In Bezug auf die kommerzielle Umsetzung hat MoXin bereits viele kommerzielle Aufträge in der Cloud, am Edge und im Rechenleistungssystemnetz gewonnen und in Tausend - Karten - Clustern in mehreren Regionen des Landes die Implementierung abgeschlossen.

Die KI - Rechenleistungswelle wärmt sich stetig auf, und das Kapital fließt konzentriert in chinesische KI - Chip - Startups. Angesichts der Branchentrends der chinesischen Substitution und der beschleunigten kommerziellen Umsetzung hat MoXin bereits frühzeitig ein reifes kommerzielles Closed - Loop - System aufgebaut.

An diesem kritischen Punkt führte Zhidongxi eine eingehende Diskussion mit Wang Shuaiyu, der Unternehmenssekretär und Leiter der Unternehmensentwicklung und des Kapitalmarktdepartements von MoXin, sowie Shang Yong, dem kommerziellen Vizepräsidenten von MoXin, durch, um die Geheimnisse hinter MoXins Durchbruch in der chinesischen differenzierten Rechenleistungslampe zu finden.

01. Vielfältige Kapitalgeber treten ein

Neue Generation von Rechenkarten wird Ende des Jahres eingeführt

Die Dividenden der Rechenleistungsera werden beschleunigt freigesetzt, und das Kapital fließt kontinuierlich in den chinesischen KI - Chip - Markt. Das Tempo der Börsengänge in der Branche beschleunigt sich stetig. In dieser Welle beschleunigt MoXin sowohl bei der Finanzierung als auch bei den Produkten.

Derzeit beschleunigt sich die Umsetzung von KI - Anwendungen, und die Struktur der Rechenleistungsanforderungen in der Branche hat sich grundlegend verändert. Laut Schätzungen mehrerer Brancheninstitute hat die gegenwärtige chinesische Inference - Rechenleistungsanforderung auf das 10 - bis 15 - fache der Trainingsrechenleistungsanforderung gestiegen. Der Inference - Markt ist zur neuen Hauptschlachtfeld der Rechenleistungskonkurrenz geworden. Gleichzeitig beschleunigt sich auch der Aufbau des Rechenleistungssystemnetzes, das die Kernbasis der digitalen Wirtschaft darstellt.

MoXins strategische Planung ist klar, um die gegenwärtigen Rechenleistungsdividenden und den wachsenden Markt anzusprechen.

Wang Shuaiyu gab bekannt, dass das neue Kapital von MoXin ganz der Entwicklung der neuen Generation von KI - Inference - Rechenkarten und der Einrichtung des Rechenleistungssystemnetzes gewidmet werden wird.

Einerseits wird MoXin innerhalb dieses Jahres die neue Generation von SparsePrime - Rechenkarten einführen. Dieses Produkt ist für intelligente Rechenzentren und Datencenter konzipiert und ist eine hochleistungsfähige universelle KI - Inference - Karte, die auf der eigens entwickelten Antoum2.0 - Chip - Architektur basiert und für große Modelle und verschiedene komplexe Inference - Aufgaben optimal angepasst ist.

Das neue Kapital von MoXin wird alle Schritte von der Produktentwicklung, der Massenproduktion bis zur Markteinführung der neuen Generation von Rechenkarten abdecken und ausreichende Kapitalreserven für die nachfolgende Markterweiterung bereitstellen.

SparsePrime ist das neueste Ergebnis von MoXin. Angesichts der gegenwärtigen Anforderungen an die Bereitstellung von großen Modellen ist es für die gängigen Transformer - Modelle geeignet und ermöglicht es den Kunden, ohne zusätzliche Kosten schnell die Sparse - Beschleunigung zu nutzen. Gleichzeitig können Entwickler auf Basis der Modellcodes von PyTorch und TensorFlow sowie effizienter Inference - Frameworks wie vLLM nahezu ohne Codeänderungen die Migration und die direkte Bereitstellung und Ausführung durchführen. Darüber hinaus können Entwickler die Triton - Sprache verwenden, um benutzerdefinierte Operatoren zu entwickeln und die Nutzungsbarriere zu senken.

Andererseits hat MoXin bereits in den Datencentern in den vier Regionen Nordwesten, Südwesten, Ostchina und Nordchina die Implementierung abgeschlossen und in vielen Branchen - Szenarien und Bereichen die massenhafte Anwendung erreicht. Innerhalb der nächsten 1 - 2 Jahre wird MoXin die breitere Rechenleistungssystemnetz - Planung in den östlichen, mittleren und westlichen Teilen Chinas abschließen.

Die Finanzierung und die bevorstehende Einführung der neuen Generation von Rechenkarten sind die konzentrierte Darstellung der vorläufigen Ergebnisse von MoXin.

Zur gleichen Zeit baut MoXin auch eine Sparse - Ökosystem, stärkt die Zusammenarbeit zwischen Industrie, Hochschule und Forschung und gründet eine Entwickler - Community, um den Weg für die Erweiterung seiner Produkte zu ebnen.

Durch die dreifache Strategie von Cloud - Basismodellen, vertikalen Kunden und Rechenleistungssystemnetzen nimmt MoXin eine zentrale Position in der Rechenleistungslampe ein.

02. Die Leistung der KI - Beschleunigungskarte übertrifft die gängigen GPU

Die Validierung und die geschlossene Schleife der Umsetzung in realen Szenarien sind bereits abgeschlossen

Im gesamten Markt beschleunigt sich die Differenzierung und Iteration des KI - Rechenleistungssystems. In der Zukunft wird der Kernwettbewerb von KI - Chips nicht mehr einfach auf die Addition von Rechenleistung und Energieverbrauch beruhen, sondern die Rechenleistungseffizienz wird der eigentliche Kernschutz sein.

Als Repräsentant, der sich durch die Innovation auf der untersten Technologiestufe in der chinesischen KI - Chip - Branche durchsetzt, hat MoXins eigens entwickelte Zwei - Sparse - Berechnungstechnologie die Rechenleistungsschranke gebrochen und eine Rechenleistungslösung mit hoher Rechenleistung, niedrigem Energieverbrauch und hohem Kosteneffizienz geschaffen.

Das Prinzip der Sparse - Berechnung kann mit dem menschlichen Gehirn verglichen werden. Wenn Menschen verschiedene Aufgaben bearbeiten, aktivieren sie die entsprechenden Regionen der Großhirnrinde und müssen nicht das gesamte neuronale Netzwerk aufrufen. Ähnlich wie bei einem Chip wird bei verschiedenen Aufgaben die Sparse - Aktivierung durchgeführt. Einfach ausgedrückt, ist die Sparse - Berechnung die Reduzierung von Redundanzen in neuronalen Netzmodellen durch Innovation auf der untersten Ebene und die kooperative Gestaltung von Hardware und Software, um die Rechenleistung zu verbessern.

MoXins differenzierter Wettbewerbsvorteil liegt darin, dass es nicht einfach die Algorithmen beschnitten, sondern die Sparse - Berechnung von der Perspektive der kooperativen Gestaltung von Hardware und Software in die Rechenkerne des Chips integriert, um die optimale Leistung zu erzielen.

Dadurch hat die MoXin - KI - Beschleunigungskarte drei Mal nacheinander in der weltweit anerkannten KI - Bewertung MLPerf gewonnen. Die Spitzen - Durchsatzleistung der S40 in bestimmten Szenarien ist 2,9 Mal höher als die von A100 und 1,4 Mal höher als die von H100. Die Leistung der Einzelkarte führt. Bei der Mehrkarten - Rechenleistung ist die Leistung von 4 S30 - Karten 1,8 Mal höher als die von 4 H100 - Karten und sogar 1,2 Mal höher als die von 8 A100 - Karten - Clustern.

Heute hat MoXin von den Chips, den Rechenkarten bis zu den Branchenlösungen eine ganzheitliche Eigenentwicklung erreicht, was auch die Grundlage für die differenzierte Wertschöpfung für die Kunden ist.

Allerdings ist die technische Herausforderung nur der erste Schritt. Die schwierigere Aufgabe ist die Einbindung in die Szenarien. Shang Yong erwähnte, dass der Weg, den MoXin geht, nicht nur ein reines technisches Problem ist, sondern auch die wiederholte Validierung und Fehlersuche in verschiedenen Geschäftsszenarien erfordert. Daher ist es im Wesentlichen ein komplexes Problem der technischen Umsetzung.

Er gab ein Beispiel. Im Rechenleistungsklusterprojekt, an dem MoXin im vergangenen Jahr beteiligt war, war der Kunde ein Herstellungsunternehmen außerhalb des KI - Bereichs. Der Kernpunkt des Unternehmens war direkt: eine Rechenleistungslösung mit besserer Energieeffizienz bei begrenztem Budget zu erhalten. Die Forscher von MoXin haben durch die Analyse der gesamten Lösung für das Cluster die Kosten im Vergleich zu den Lösungen auf dem Markt um 30 % - 50 % gesenkt und die spezifischen Szenarienanforderungen des Unternehmens erfüllt.

Nur durch die Vertiefung der Technologie und die Anpassung an die Szenarien kann der Wert der Rechenleistung vollends freigesetzt werden.

Shang Yong fasste MoXins strategische Schwerpunkte als "Zwei - Beine - Parallel - Ansatz" zusammen. Auf der technischen Seite bricht es durch die exklusive Sparse - Berechnungsarchitektur die Rechenleistungsschranke und verbessert die Rechenleistungseffizienz und die Hardwaredichte erheblich. Auf der Marktseite konzentriert es sich auf die goldene Branche der KI - Inference und setzt sich in Zusammenarbeit mit den Kunden die maßgeschneiderte Implementierung und die massenhafte kommerzielle Nutzung der Chips um, um die tiefe Bindung zwischen Technologie und Szenarien zu erreichen.

Heute hat MoXin eine gradierte Rechenleistungslayout wie S4 - S40 aufgebaut, das die Rechenleistungsanforderungen von traditionellen kleinen Modellen über kleine große Modelle bis hin zur Iteration von ultra - großen Modellen erfüllen kann. Das neue Produkt, das es dieses Jahr einführen wird, ist für die potenziellen Rechenleistungsanforderungen von ultra - großen Modellen in den nächsten 3 oder sogar 5 Jahren entwickelt.

Daraus lässt sich erkennen, dass die echte Umgestaltung der Rechenleistungskosten und der Überwindung der Leistungsobergrenze auf der Innovation des Rechenparadigmas auf der untersten Architekturebene basieren sollte.

03. Ziel auf die Notwendigkeit der KI - Kostensenkung

MoXin hat bereits kommerzielle Aufträge in vielen Bereichen gewonnen

Mit der Entwicklung der KI - Branche von der technischen Exploration zur industriellen Verbreitung werden Kostensenkung, Effizienzsteigerung, Anpassung und Gewinn erzielen zu wichtigen Kriterien für die Bewertung des Werts von KI - Chips. MoXin, das mit diesem Trend übereinstimmt, hat bereits die fähigkeit zur kommerziellen Umsetzung in Massen, zum Gewinn erzielen und zur Replikation.

Genauer betrachtet zeigt sich die Effizienzsteigerung bereits in den beiden Siegen der MoXin - Rechenkarte in den gängigen Tests. Bei der Kostensenkung liegt der Schwerpunkt derzeit auf der Kosten pro Token.

Die Daten der Nationalen Datenbehörde zeigen, dass der tägliche Token - Aufruf im März dieses Jahres 140 Billionen überschritten hat, was im Vergleich zum täglichen Aufruf Anfang 2024 um mehr als tausend Mal gestiegen ist. Angesichts der enormen Aufrufbedürfnisse kann die Sparse - Berechnung die Rechenthreads unter der Voraussetzung der unveränderten Modellgenauigkeit vereinfachen. In den tatsächlichen Geschäftsszenarien ist die Betriebskosten pro Token der MoXin - Lösung weit niedriger als die der gängigen GPU - Produkte und hat in einigen bestimmten Szenarien sogar Vorteile.

Basierend auf diesem Hintergrund gab Wang Shuaiyu bekannt, dass MoXin bereits viele kommerzielle Aufträge in der Cloud, am Edge und im Rechenleistungssystemnetz gewonnen hat und erwartet, dass es in den nächsten ein oder zwei Jahren das Break - Even - Punkt erreichen kann.

MoXins rasche Entwicklung entspricht im Wesentlichen dem Kernwandeltrend der KI - Branche. Indem es sich auf die Kernroute der Sparse - Berechnung konzentriert, gewinnt es die Dividenden des Billionen - Marktes.

Einerseits wird der Wert der Sparse - Berechnungstechnologie, auf die MoXin beharrt, freigesetzt. Eine notwendige Bedingung für die Umsetzung von KI - Anwendungen ist die stetige Senkung der Grenzkosten, was mit MoXins Rechenansatz übereinstimmt. Sie setzen auf die kontinuierliche Senkung der Anwendungs Kosten durch technologische Innovation und verfolgen nicht blind andere führende Technologien.

Andererseits verändert sich die Entwicklung der KI - Branche rasch. MoXin muss daher die Iteration der Produktform beschleunigen und ein universelles Produktsystem aufbauen, das die differenzierten Anforderungen verschiedener Kunden und Szenarien erfüllt. Derzeit gibt es unzählige Modelle, und keine Firma kann die Entwicklungstrends genau vorhersagen. Daher sieht Shang Yong, dass MoXin immer vom Kunden ausgeht und sicherstellt, dass das Produkt bereits in der Entwurfsphase die Anforderungen erfüllt.

Im gesamten KI - Bereich ist das kommerzielle Modell der Modellhersteller grundsätzlich fertig. Die Kostensenkung wird zur Notwendigkeit der gesamten Branche. Darüber hinaus wird die Dominanz der GPU allmählich geschwächt, und die chinesischen KI - Chips mit verschiedenen Ansätzen erleben eine kommerzielle Explosion. Die Dividenden der Branche, in der Mo

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Fast eine Milliarde Yuan an Finanzierungen sind eingetroffen. MoXin beschleunigt den geschlossenen kommerziellen Zyklus der Sparse Computing-Technologie und wird Ende des Jahres eine neue Generation von Beschleunigungskarten auf den Markt bringen.

01.

Vielfältige Kapitalgeber treten ein

Neue Generation von Rechenkarten wird Ende des Jahres eingeführt

02.

Die Leistung der KI - Beschleunigungskarte übertrifft die gängigen GPU

Die Validierung und die geschlossene Schleife der Umsetzung in realen Szenarien sind bereits abgeschlossen

03.

Ziel auf die Notwendigkeit der KI - Kostensenkung

MoXin hat bereits kommerzielle Aufträge in vielen Bereichen gewonnen