Unter der Welle der Rechenleistung: Die drahtlose Transformation von KI - intelligenter Bildgebung | 2026 AI Partner · AI + Industrie

Shenmu entwickelt energieeffiziente intelligente Bildverarbeitungschips und ist optimistisch hinsichtlich der Chancen für Start-ups im Bereich der Inferences-Rechnerleistung in China.

Was Shenmu macht, ist nicht, NVIDIA zu verfolgen, sondern im Stromabwärtsbereich der Rechenleistungswelle mit einer extrem stromsparenden Chip-Design-Technologie die Kameras von der Bindung der Stromkabel zu befreien und eine Zukunft mit hunderten von Milliarden intelligenten visuellen Endgeräten zu eröffnen.

Yang Zuoxing hat es mit Shenmu geschafft, einen Durchbruch bei der Reduzierung des Kamerastromverbrauchs um eine Größenordnung zu erzielen – der erste Chip-Generierung hat nur ein Drittel des Stromverbrauchs im Vergleich zur Branche, die zweite Generation nur ein Zehntel. Zum ersten Mal konnte eine rund um die Uhr funktionierende intelligente Kamera mit einer 1-Watt-Solarzelle betrieben werden. Er meint, dass die jährliche Weltauslieferung von Sicherheitskameras derzeit nur 300 bis 400 Millionen Stück beträgt, aber bis 2035 auf 10 Milliarden Stück ansteigen wird und bis 2045 sogar auf 100 Milliarden Stück. Dies liegt daran, dass die Weltgroßmodelle Billionen von Kameras benötigen, um die physische Welt in Echtzeit abzubilden. Im Bereich der Inferenzrechenleistung glaubt Yang Zuoxing, dass chinesischen Start-up-Unternehmen immer noch große Chancen bestehen.

Im Folgenden finden Sie den vollständigen Text des Vortrags, der von 36Kr bearbeitet wurde:

Yang Zuoxing | Vorsitzender des Verwaltungsrates von Hangzhou Yanjimei Microelectronics Co., Ltd. und Gründer der Marke Shenmu

Guten Nachmittag! Ich bin heute sehr glücklich. Letztes Jahr habe ich an der 36Kr AI+-Konferenz in Shanghai teilgenommen, und heute ist es das zweite Mal. Ein Jahr ist vergangen, und die KI hat sich in dieser Zeit enorm verändert. Alle sind außerordentlich aufgeregt. Bei der 36Kr AI+-Konferenz fällt auf, dass es im Vergleich zum vergangenen Jahr große Veränderungen gibt. Hier möchte ich der Veranstalterin 36Kr meinen Dank aussprechen.

Ich bin Yang Zuoxing, Vorsitzender des Verwaltungsrates von Hangzhou Yanjimei Microelectronics Co., Ltd. und Gründer der Marke Shenmu. Die KI ist das Zentrum des Weltsturms. Können wir noch tiefer in dieses Sturmzentrum blicken und herausfinden, was der „Auge“ des Sturms ist? Wir glauben, dass es die neue Qualität der Produktivität ist.

Derzeit ist NVIDIA das Unternehmen mit der höchsten Marktkapitalisierung weltweit. Es hat Apple, Microsoft, Amazon und TSMC überholt, weil es die neue Qualität der Produktivität – die GPU-Rechenleistung – beherrscht.

Welche Chancen hat Shenmu unter der Welle der Rechenleistung?

Wir haben beobachtet, dass Mobiltelefone, Computer und Tablets schon frühzeitig von den Stromkabeln unabhängig geworden sind. Aber die Kameras, die als visuelle Sensoren fungieren, hängen immer noch an Stromkabeln, was die Installationskosten der Kameras erheblich erhöht. Wenn man Kameras im Freien installiert, muss man zunächst einen Mast aufstellen, was zwischen 10.000 und 100.000 Yuan kostet. Dann muss man eine Grube graben und das Kabel verlegen, was weitere 10.000 Yuan kostet. Die Installationszeit beträgt mehr als eine Woche, und die Wartungskosten für die Kameras betragen 3.000 Yuan pro Jahr. Die Wartungskosten für die Kameras im Polizeisystem sind sehr hoch.

Was wir tun, ist es, die Installationskosten, die Betriebskosten und die Wartungskosten der Kameras auf Null zu reduzieren. Um dies zu erreichen, müssen wir den Stromverbrauch der Kameras um eine oder zwei Größenordnungen senken.

Die stromsparende Chip-Design-Technologie erfordert einen methodischen Durchbruch. Wir haben eine vollständig kundenspezifische Chip-Design-Methodik entwickelt, die von unserem Unternehmen initiiert wurde. Sie unterscheidet sich in drei Punkten. Erstens verwenden wir kundenspezifische Zellendesigns. Das traditionelle Branchenkonzept verwendet die Standardzellbibliothek von TSMC oder Samsung. Wenn man in der Schule oder im Unternehmen Chipdesign macht, verwendet man normalerweise statische Doppelflankenspeicher. Dynamische Logik und einfache Flankenspeicher können nicht verwendet werden, weil die EDA-Tools diese nicht gut überprüfen können. Wir machen es anders. Wir verwenden dynamische einfache Flankenspeicher. Ein statischer Doppelflankenspeicher besteht aus 24 Transistoren, während unser dynamischer einfacher Speicher nur 4 Transistoren hat. Die Fläche und der Stromverbrauch sind ein Sechstel im Vergleich zur herkömmlichen Methode. Zweitens verwenden wir handgeschriebene Netlisten. Die herkömmliche Methode verwendet Hochsprachen, um Code zu schreiben. Das Schreiben von Netlisten per Hand ist wie das Schreiben von Code in Assembler durch Softwareingenieure. Einer der Gründe für den großen Durchbruch von DeepSeek ist, dass sie PTX für die Programmierung verwenden, was viel besser ist als bei anderen. Wir haben einen Mehrfachvorteil, wenn wir handgeschriebene Netlisten verwenden. Drittens verwenden wir manuelle Layouts. Die herkömmliche Methode verwendet automatisierte Layouts, deren Nutzungsrate normalerweise zwischen 50% und 60% liegt. Unsere Nutzungsrate beträgt über 95%.

Durch diese Methoden wird das Produkt aus Stromverbrauch und Kosten um eine Größenordnung gesenkt. Diese Methodik wird auch bei den SOC-Chips für Kameras angewendet. Unser erster Chip-Generierung hat nur ein Drittel des Stromverbrauchs im Vergleich zur Branche und wird in den idealen AI-Brillen sowie in unseren eigenen Shenmu-Produktlinien verwendet, wie z. B. der intelligenten Schwenkkamera BC4PRO+, der zweiaugigen Kugelkamera AOR mit Batterie-Schwenkaufsatz PT4 und den Produkten der Bewegungsbildserie, wie dem Lebensaufzeichner V1.

Der zweite Chip-Generierung hat nur ein Zehntel des Stromverbrauchs im Vergleich zur Branche und wird bereits im Shenmu-Intelligent-Parkaufzeichner DC1 eingesetzt. Dies ist das erste Produkt der Branche, das speziell für Park-Szenarien entwickelt wurde. Es hat eine lange Akkulaufzeit, erfordert keine Verkabelung und ist einfach zu installieren. Der zweite Chip wird auch in der Shenmu-Solar-Integrations-Intelligent-Kamera BC7 eingesetzt. Wir verwenden erstmals eine 1-Watt-Solarzelle, um eine 24/7, 365-Tage-Dauerüberwachung zu ermöglichen. Neben dem SOC haben wir auch bei der CIS, PMU, Wi-Fi und 4G stromsparende Designs umgesetzt. Wir möchten, dass das gesamte Produkt-System nur ein Zehntel des Stromverbrauchs hat. Dazu muss jeder Bauteil auf ein Zehntel reduziert werden. Es reicht nicht, nur den SOC auf ein Zehntel zu senken.

Dies ist eine Reihe von Produkten, die auf dem Chip basieren:

Derzeit werden pro Jahr nur 300 bis 400 Millionen Kameras, repräsentiert durch die Sicherheitskameras, ausgeliefert, ohne die Mobiltelefonkameras zu berücksichtigen. Wir glauben, dass bis 2035 die Anzahl auf 10 Milliarden Stück ansteigen wird. Die Anzahl der Mobiltelefonkameras hat bereits über 5 Milliarden Stück erreicht. Ein Mobiltelefon hat drei oder vier Kameras, und es werden jedes Jahr über eine Milliarde Mobiltelefone verkauft. Die Mobiltelefonkameras dienen dem Menschen, während die Kameras im Internet der Dinge für alle Dinge im Universum dienen. Die Anzahl der Kameras im Internet der Dinge wird viel größer sein als die Anzahl der Mobiltelefonkameras. Insbesondere nachdem Shenmu diese kabelfreien Kameras eingeführt hat, schätzen wir, dass bis 2035 die Anzahl auf 10 Milliarden Stück ansteigen wird. Viele denken, dass dies viel ist, aber es reicht, wenn die Anzahl jährlich um 30% wächst.

Wir glauben, dass bis 2045 die Anzahl auf 100 Milliarden Stück ansteigen wird. Wir prognostizieren, dass bis 2040 die vierte industrielle Revolution in der Künstlichen Intelligenz vollständig abgeschlossen sein wird. Am Ende wird die KI den Großteil der gegenwärtigen menschlichen Arbeit ersetzen. Wo werden wir dann hin? Wir werden in der virtuellen Welt arbeiten, sich unterhalten und ein Gefühl der Erfüllung finden. Wir brauchen Weltgroßmodelle. Diese Großmodelle sind sehr komplex. Jeder Mensch sieht verschiedene Szenarien, wenn er einen Schritt macht. Diese Weltgroßmodelle müssen mit der Realität verbunden sein, sonst werden sie unkontrollierbar und produzieren Halluzinationen. Wie können wir diese Verbindung herstellen? Wir brauchen unzählige Kameras, um den aktuellen Zustand der Welt in die Großmodelle einzuführen. Um die Welt vollständig in die Großmodelle abzubilden, benötigen wir 1,2 Billionen Kameras. Wenn wir dies in zehn Jahren erreichen möchten, müssen wir pro Jahr 100 Milliarden Kameras herstellen.

In der Ära der Großmodelle will Shenmu die sogenannte „Gottliche Berechnung“ – die Inferenzrechenleistung der Großmodelle – leisten. Die Rechenleistung ist die neueste Qualität der Produktivität, ohne Zweifel. Derzeit ist NVIDIA der König in diesem Bereich. Haben andere Unternehmen noch Chancen? Dies lässt sich aus zwei Aspekten betrachten:

Erstens die Trainingsrechenleistung. Ingenieure verwenden die Trainingsrechenleistung, um immer bessere Großmodelle zu entwickeln. Zweitens die Inferenzrechenleistung. Die Benutzer stellen täglich Fragen an die Großmodelle, wie z. B. an DeepSeek, und erhalten Antworten. Dies ist die Inferenzrechenleistung. Bei der Trainingsrechenleistung ist es schwierig, NVIDIA zu überholen. Obwohl viele chinesische Unternehmen auch an der Entwicklung von GPUs arbeiten, liegt der Hauptgrund darin, dass die CUDA-Schnittstelle verwendet wird. Alle Großmodell-Frameworks sind auf der Grundlage von CUDA geschrieben. Ich erinnere mich, dass der Chef eines berühmten chinesischen Großmodell-Unternehmens auf der letzten Ökosystemkonferenz sagte, dass sie drei Monate brauchten, um die Huawei-Karte anzupassen. Drei Monate entsprechen in der Welt der Großmodelle einer Generation. Ohne eine sehr enge Freundschaft würde niemand drei Monate Zeit investieren, um die Anpassung vorzunehmen.

Bei der Inferenzrechenleistung gibt es große Chancen, und zwar aus zwei Gründen. Erstens ist die Inferenzrechenleistung unabhängig von der CUDA-Schnittstelle. Zweitens hat jedes Großmodell einen einzigartigen Algorithmus. In Bezug auf die Unterschiede in Algorithmen, Operatoren und Datenpfaden können wir viele kundenspezifische Lösungen entwickeln. Diese kundenspezifischen Chips haben im Vergleich zu den allgemeinen GPU-Chips erhebliche Vorteile in Bezug auf Stromverbrauch und Kosten. Darüber hinaus ist der Bedarf an Inferenzrechenleistung viel größer als der Bedarf an Trainingsrechenleistung. Selbst wenn es weltweit hundert Weltklasse-Großmodell-Teams gibt und jedes Team tausend Karten verwendet, sind das nur eine Million Karten. Die Inferenzrechenleistung wird von 6 Milliarden natürlichen Menschen und in Zukunft von noch mehr Robotern benötigt. Der Bedarf ist also viel größer als der Bedarf an Trainingsrechenleistung. Dies ist auch der Grund, warum NVIDIA 2 Milliarden US-Dollar für die Übernahme von Groq, einem Start-up-Unternehmen für Inferenzrechenleistung, ausgegeben hat.

Wenn wir die Inferenzrechenleistung gut machen, haben unsere Start-up-Unternehmen immer noch die Chance, an der Spitze zu stehen. Wie können wir die Inferenzrechenleistung verbessern? Es gibt drei Schlüsselfaktoren. Erstens, können wir ein ausgezeichnetes Großmodell finden, das zu uns passt, entweder ein Open-Source-Modell oder ein geschlossenes Modell, mit dem wir eine strategische Partnerschaft eingehen können. Zweitens, verfügen wir über fortschrittliche Halbleitertechnologien. Drittens, hat die Chip-Design-Methodik, insbesondere die stromsparende Design-Methodik, etwas Besonderes?

In diesen drei Aspekten sind wir ziemlich gut. Unsere vollständig kundenspezifische Chip-Design-Methodik ermöglicht es uns, den Stromverbrauch auf ein Zehntel im Vergleich zu anderen zu reduzieren. Ein Schritt in der Halbleitertechnologie kann den Stromverbrauch um 30% senken, zwei Schritte um etwa 50%, und vier Schritte können den Stromverbrauch auf ein Achtel reduzieren. Ein Zehntel des Stromverbrauchs entspricht vier bis sechs Schritten in der Halbleitertechnologie. Wir sind derzeit ein Top-Partner von Samsung bei der neuesten Halbleitertechnologie und können die Halbleitertechnologie anpassen.

Obwohl die meisten Token von geschlossenen Modellen stammen, ist der Trend der Open-Source-Modelle sehr gut. Die chinesischen Großmodell-Unternehmen haben zwar noch einen gewissen Abstand zu den weltweit führenden Großmodell-Unternehmen, aber die Überholung ist nur eine Frage der Zeit und unvermeidlich.

Unter Berücksichtigung dieser drei Aspekte haben wir immer noch große Chancen, insbesondere in der Ära des CNN (Convolutional Neural Network). Bei der Entwicklung unserer Shenmu-Eigenentwicklungschips haben wir bereits einen eigenen Compiler auf der Grundlage des CNN entwickelt, um das CNN-Modell auf unseren Chip zu übertragen. Dieser Compiler ist sehr gut. Wir verbessern ihn täglich und haben ihn fünf Jahre lang weiterentwickelt. Er hat den kommerziellen Test bestanden. Darüber hinaus verwenden wir auch Großmodelle für unseren AI-Support und AI-Programmierung, um unseren Shenmu-Kunden AI-Anwendungsdienste anzubieten. Wir verwenden selbst KI, obwohl die Menge noch nicht sehr groß ist. Aber in unserem Unternehmen können wir von den SOC-Chips über die Großmodelle-Chips, Sensor-Chips, Produkte bis hin zu Cloud-Anwendungen einen geschlossenen Kreis bilden und uns intern sehr schnell verbessern. Deshalb sind wir in dieser Hinsicht sehr optimistisch.

Vielen Dank!

Dieser Artikel wurde ursprünglich von「未来一氪」produziert， Für Nachdruck oder Inhaltszusammenarbeit klicken Sie bitte auf Hinweise zum Nachdruck ；Bei unbefugtem Nachdruck wird strafrechtlich verfolgt.

Unter der Welle der Rechenleistung: Die drahtlose Transformation von KI-intelligenter Bildgebung | 2026 AI Partner · AI + Industrie-Konferenz in Yizhuang, Peking