HomeArticle

Yang Zhen von Beidian Digital: "Domestic Computing Power PoC Platform", Finden der optimalen Lösung für Rechenleistung durch Szenariobewertung | WISE2024 Business King Conference

未来一氪2024-12-03 14:51
Die Verbindung von Rechenleistung und Szenario, um das Modell basierend auf inländischen Chips in realen Szenarien zu implementieren, ist die schwierige, aber richtige Aufgabe, die die PoC-Plattform lösen muss.

Am 28. und 29. November fand in Peking die zweitägige WISE2024 Business King Konferenz von 36Kr statt. Als große Festlichkeit im chinesischen Wirtschaftsbereich ist die WISE Konferenz nun schon in ihrer zwölften Ausgabe und zeugt von der Widerstandsfähigkeit und dem Potential der chinesischen Wirtschaft in einer sich ständig wandelnden Zeit.

2024 ist ein Jahr, das eher vage und von Veränderungen geprägt ist als von Stabilität. Im Vergleich zu den letzten zehn Jahren verlangsamen sich die Schritte, und die Entwicklung wird rationaler. Auch ist 2024 ein Jahr, das nach neuen wirtschaftlichen Impulsen sucht, und der Wandel in den Industrien stellt höhere Anforderungen an die Anpassungsfähigkeit jedes Akteurs. Dieses Jahr steht die WISE-Konferenz unter dem Motto "Hard But Right Thing" (Das Richtige tun), und die Frage, was 2024 richtig ist, wird zu einem Thema, das wir intensiver diskutieren möchten.

Yang Zhen, CMO und Verantwortlicher für Strategie und Markt bei Beidian Digital Intelligence

Am selben Tag hielt Yang Zhen, CMO und Verantwortlicher für Strategie und Markt bei Beidian Digital Intelligence, einen Vortrag mit dem Titel "‘Inländische Rechenleistung PoC-Plattform’, die durch Szenariobewertungen die optimale Rechenleistungslösung sucht".

Was als "richtig" gilt, ist im heutigen KI-Bereich eine besonders komplexe Frage geworden. Doch aus der Perspektive der Umsätze in der KI-Industrie im Jahr 2023 betrachtet, ist Künstliche Intelligenz noch weit davon entfernt, in das tatsächliche Leben einzutreten. Die Chipebene erzielt 90 % der Umsätze der Branche, die Modellebene 7 %, aber die Anwendungs- und Werkzeugebene macht nur 3 % aus.

Drei Probleme stehen dem tatsächlichen Einsatz der KI im Weg. Die Rechenkapazität ist die erste Herausforderung, die gelöst werden muss, da die Unternehmen der Branche die Leistung und die Anwendungsgebiete der inländischen Rechenchips nicht kennen und unbewusst dazu neigen, sie nicht zu verwenden. Wie man inländische Rechenleistung gut einsetzt, ist der Schlüssel. Zweitens ist es wichtig, wie man Rechenkapazität mit Szenarien verbindet, damit inländische Chips und Modelle besser zusammenpassen und die Modelleffektivität verbessert wird. Das dritte Problem ist, wie inländische Chips im Verbund arbeiten, um den Clustereffekt zu nutzen und die Rechenleistungsvorteile der verschiedenen inländischen Chips voll auszuschöpfen.

Beidian Digital Intelligence hat die landesweit erste inländische Rechenleistung-PoC-Plattform eingeführt. Diese durchbricht die Produktionskettenkluft zwischen Angebot und Nachfrage von inländischer Rechenleistung, indem sie vertikale Szenariobewertungen, Anpassungs- und Verifizierungsdienste anbietet, während sie Unternehmen aus verschiedenen AI-Anwendungsfeldern wie AIGC Audio-Visual, Finanzen, Verwaltung, Industrie, Medizin, Verkörperte Intelligenz und Verkehr verschiedene Experimentiermöglichkeiten zur Leistungsanpassung bietet, um die Anpassung von inländischen Rechen-Chips und Szenarien voranzutreiben, die inländischen Chips in Betrieb zu nehmen und das Zeitalter der künstlichen Intelligenz zu fördern.

Folgendes ist eine Abschrift des Vortrags von Yang Zhen, CMO und Verantwortlicher für Strategie und Markt bei Beidian Digital Intelligence:

Yang Zhen: Heute glaube ich, dass jedes Unternehmen aufgrund dieses Themas hierhergekommen ist – Das Schwierige, aber Richtige tun. Künstliche Intelligenz ist das heißeste Thema der Gegenwart, und die Frage, wie Rechenleistung genutzt werden kann, ist eine schwierige, aber richtige Sache. Das passt sehr gut zu unserem heutigen Thema. Warum ist es so schwierig?

Allgemeine Technologie verändert die Produktivität: Schwierige und langwierige Aufgaben

Künstliche Intelligenz ist eine Erfindung neuer allgemeiner Technologien, die mit jeder neuen allgemeinen Technologie in der Menschheitsgeschichte industrielle, sektorale und persönliche Veränderungen mit sich bringt und die menschliche Zivilisation immer weiter vorantreibt. Die vorhergehenden drei industriellen Revolutionen sind nicht so tiefgreifend wie die Veränderungen, die die KI-Revolution bringt, die wahrscheinlich einen qualitativen Sprung in der gesamten menschlichen Zivilisation darstellt.

Aber kommt dieser Sprung einfach? Sehr schwierig. Im Fall von Elektrizität: Vor der Erfindung von Strom war die Dampfenergie das Hauptantriebsmittel, und es gab bereits Fabriken, die von Dampfkraft betrieben wurden; es dauerte 50 Jahre, bis Elektrizität wirklich in Fabriken als Antriebsquelle genutzt wurde und alle Fabriken auf Strom umstellt wurden. Man kann sich vorstellen, wie schwierig das war. Es ist nicht nur der Austausch der Antriebsquelle, sondern auch der Austausch neuer Produktionswerkzeuge, Produktionslinien, vollständige Produktionssysteme. Es ist nicht nur eine technologische Veränderung, sondern auch ein Wandel von Prozessen, Organisationen, Systemen und der Ideologie jedes Einzelnen.

Dieses Jahr gab es weiterhin AI-Telefone und AIPC. Personal Computer wurden in den siebziger und achtziger Jahren des letzten Jahrhunderts erfunden, aber es dauerte bis zum neuen Jahrhundert, bis PC vollständig in Unternehmen integriert waren, bis Werkzeuge wie ERP, CRM etc. den vollen Nutzen von Computern nutzbar machten und Unternehmen qualitative Veränderungen brachten, was letztendlich zu ihrer Verbreitung führte.

Zurück zur künstlichen Intelligenz: Künstliche Intelligenz existierte bereits in den 1950er Jahren, aber erst mit dem Aufkommen des Deep Learning im Jahr 2006 erregte sie ernsthaftes Interesse. In den 50er Jahren existierten schon Theorien wie Entscheidungsvektoren; damals prognostizierte die New York Times, dass AI in zehn Jahren alltäglich sein würde und Maschinen Aufgaben für Menschen übernehmen könnten, doch es dauerte 50 Jahre, bis es Realität wurde. Maschinenlernen trat erst im neuen Jahrhundert auf und erst 2021 erlangte das neuronale Netzwerk Anerkennung, als es in Wettbewerben Erfolge erzielte. Erst dann wurde das Konzept von neuronalen Netzwerken richtig bekannt. Auch das Verständnis von generativer KI kam erst mit dem Erscheinen von GPT-3.5 auf, was ein ganz neues Verständnis brachte. Vorher gab es Deep Blue im Schach und AlphaGo im Go-Spiel, doch die Menschen erlebten die wirkliche Intelligenz dieser Maschinen nicht wirklich.

KI umsetzen: Den Mut, die Fähigkeit und die richtige Nutzung inländischer Rechenleistung

An dieser Stelle entsteht ein neues Problem: Wie weit ist KI noch davon entfernt, alle Zweige der Industrie zu betreten und das Leben jedes Einzelnen zu beeinflussen? Die Umsatzdaten zeigen deutlich, dass die drei wesentlichen Elemente der künstlichen Intelligenz, Rechenleistung, Algorithmus und Daten, gegenwärtig immer noch diejenigen sind, die mit dem Verkauf von Werkzeugen Geld verdienen. Im Jahr 2023 machen die Chipebene 90 % des Umsatzes der gesamten KI-Industrie aus, die Modellebene trägt 7 % bei, und die Anwendungsebene nur 3 %. Diese Zahlen zeigen, dass KI noch weit davon entfernt ist, im Alltag aller Menschen anzukommen.

Warum ist es noch so weit entfernt? Allgemeintechnologien brechen oft zuerst auf der B2B-Seite durch, bevor sie in Industrien und die Gesellschaft eindringen. Möglicherweise verwenden Sie bereits Roboter, um Artikel zu schreiben oder Informationen zu suchen, aber wenn KI in Unternehmen integriert werden soll, reicht ein Chatbot allein nicht aus; es braucht ein ganzes System.

Für Unternehmen, insbesondere für chinesische Unternehmen, ist der Aufbau dieses Systems nicht einfach. Rechenleistung ist tatsächlich die erste Herausforderung, die bewältigt werden muss. In China gibt es fast 30 GPU-Anbieter, aber wie gut sind inländische KI-Chips? Welche Szenarien können sie unterstützen? Viele Menschen wissen es nicht, daher neigen sie unbewusst dazu, unbekannte Technologie abzulehnen und importierte Chips zu bevorzugen. Wie man inländische Rechenleistung nutzen und gut einsetzen kann, ist wirklich eine entscheidende Sache. Gleichzeitig, aufgrund der Branchenstruktur in unserem Land, gibt es 30 Unternehmen auf Chipebene und Hunderte von Modellen, der gesamte KI-Industriebereich ist immer noch relativ fragmentiert, sodass es komplizierter und für Unternehmen schwieriger wird, eine Entscheidung zu treffen, wessen Chips und Modelle verwendet werden sollen und wie man eine intelligente Plattform aufbaut, um Unternehmensanwendungen und Arbeitsabläufe zu implementieren – all dies beschäftigt die Unternehmen.

Verbindung von Rechenleistung und Szenarien: PoC-Plattform beschleunigt das KI-Zeitalter

Heute sprechen wir über die PoC-Plattform für inländische Rechenleistung, weshalb benötigen wir eine PoC-Plattform für inländische Rechenleistung? Der Generalsekretär sagt oft, wir müssen die Realität erkennen, Unterschiede erkennen, Wege finden und Probleme lösen. Die inländische Rechenleistung liegt etwa zwei Generationen hinter der internationalen Spitzentechnologie zurück, aber insgesamt sind inländische Rechenleistungen tatsächlich nutzbar, auch wenn die Benutzer nicht wissen, wo sie gut einzusetzen sind und wie man es angeht.

Aufgrund dieser Umstände fehlt es der Rechenleistungsanbieter-Seite, wenn sie keine Szenarien bekommen, an einem Übungsfeld; die bereitgestellten Daten sind meist nur theoretische Einzeldaten, es ist schwer, Clusterdaten zu erhalten.

Insgesamt ist die Produktionskapazität inländischer Chips immer noch eingeschränkt, die Gesamtproduktion einzelner inländischer Chips ist unzureichend und kann die Nachfrage nur schwer befriedigen. Auch die Nutzer von Rechenleistung berichten oft, dass sie inländische Rechenleistung verwenden möchten, aber diese reicht nicht aus. Sie haben Szenarien und Modelle, aber die Modellaufgaben stehen ständig in der Warteschlange. Dies ist ein reales Problem, mit dem wir konfrontiert sind.

Hierbei stellt sich die Frage: Warum können inländische Chips nicht im Verbund arbeiten? Vielleicht haben Sie schon gehört, dass jeder Chip sein eigenes Ökosystem hat, das seinen eigenen kommerziellen Kreislauf bildet. Doch die Zusammenarbeit zwischen verschiedenen Ökosystemen ist problematisch. In vielen Rechenzentren, auch in einem einzigen Rechenzentrum, gibt es unterschiedliche Cluster, jedes als eigenständiges Rechenleistungssilo, das es schwierig macht, gemeinsam zu arbeiten. Nutzer wissen nicht, welche Wahl am besten ist, und die totale Menge an bestellten Einzellösungen ist unzureichend, was ein großes Problem darstellt.

Unser PoC-Plattformversuch umfasst viele Szenarien wie Finanzen, industrielle Fertigung und AIGC-Audio-Visualisierung. In diesen Szenarien können die Anwender experimentieren, wie inländische Rechenleistung in den jeweiligen Szenarien funktioniert und ob sie geeignet ist. Durch diese Plattform möchten wir sicherstellen, dass die Nutzer ein korrektes Verständnis dafür entwickeln, in welchem Umfang inländische Rechenleistung effektiv in tatsächlichen Szenarien eingesetzt werden kann.

Es gibt viele schwierige und richtige Dinge, die getan werden müssen, um inländische Chips im Verbund arbeiten zu lassen. Es gibt viele mühsame Aufgaben, die erledigt werden müssen. Die Adaption zwischen Chips und Modellen erfordert Anpassung, um die beste Leistung von Chips und Modellen zu garantieren. Ein hybrides Cluster ist, wenn unterschiedliche Rechenclustern aufgebrochen werden und einen großen virtuellen Rechenleistungspool bilden, der externe Unterstützung und Dienste basierend auf den tatsächlichen Erfordernissen bereitstellt.

Wir haben mehr als 10 Arten von inländischen Rechenleistungsclustern umgesetzt, die für mehr als 20 Arten von Basisgroßmodellen adaptierbar sind. Um die gängigen Basisgroßmodelle zu unterstützen, haben wir operative Ergänzungen und automatische Optimierung vorgenommen, um alle gängigen Chips und Basisgroßmodelle untereinander adaptierbar zu machen. Wenn zwei Rechencluster zusammenarbeiten, kann es hilfreich sein, einige Patches anzubringen, aber um das koordinierte Arbeiten aller verwalteten Rechenleistungscluster und ihre Zusammenarbeit zu ermöglichen, ist das Patchen nicht der richtige Weg. Wir haben eine einheitliche Kommunikationsbibliothek entwickelt, mit der verschiedene Rechencluster über unsere Kommunikationsbibliothek miteinander kommunizieren können.

Wir haben auch untersucht, ob Algorithmen eine Gelegenheit bieten, Hardware zu definieren oder die Inlandschips zu beschleunigen. Wir haben viele Dinge zur Hardwarebeschleunigung durch Software getan, wie zum Beispiel Zeitkompression und Compiler-Optimierung.

Da wir ein großer virtueller Rechenleistungspool sind und externe Rechenkapazitätsdienste anbieten, benötigen wir eine starke und flexible Steuerungsstrategie, die wir durch mehrere angepasste Steuerungsstrategien umgesetzt haben, um unterschiedliche Aufgaben effektiv und präzise den verschiedenen Rechenleistungseinheiten innerhalb des Pools zuzuteilen und damit die verschiedenen Aufgaben zu unterstützen. Wir sind weiterhin dabei, Steuerungsmethoden zu erforschen, damit Rechenleistung wie Strom genutzt werden kann, wodurch Lastspitzen auseinandergezogen werden können, um eine koordinierte Nutzung verschiedener Cluster zu ermöglichen und einheitlichen Service anzubieten.

Bisher wurden diese Dienste meist durch Miete bereitgestellt, bezogen auf Geräte oder Miet-Cluster. Mit diesem technischen Fortschritt ist Abrechnung basierend auf Verbrauch möglich, also gemäß des Durchsatzes abzurechnen; Gebühren fallen nur dann an, wenn Rechenleistung genutzt wird, nicht aber während ungenutzter Zeiten, sodass viele kleine und mittelständische Unternehmen, Entwicklergruppen oder sogar einzelne Entwickler Zugang zu qualitativ hochwertiger Rechenleistung haben.

Nachdem die grundlegende Arbeit abgeschlossen ist, stellen wir effektive Unterstützung für Szenarien in der Verwaltung, im medizinischen Bereich und anderen Bereichen bereit. Wenn wir das sagen, müssen wir auch herausfordernde Probleme ansprechen. Die Anpassung der Rechenleistung bedarf einer Unterscheidung der zugrundeliegenden atomaren Szenarien, um relevante Parameter und Kenngrößen in den einzelnen Chips anzusprechen.

Unsere PoC-Plattform wurde bereits im Beijing Digital Economy Rechenzentrum implementiert und bietet externe Dienste an. Letzte Woche berichteten Xinhua News Agency, People's Daily und andere darüber. Wir möchten eine Plattform schaffen, die sowohl für Anwender als auch für Anbieter inländischer Rechenleistungen eine gegenseitige Annäherung ermöglicht, um die Nutzung inländischer Rechenleistungen wie Strom zu fördern und die Beschleunigung des KI-Zeitalters voranzutreiben.

Eine kurze Einführung, wer wir sind: Wir sind ein Unternehmen im Besitz der Beijing Electronics Holding, das am 1. August letzten Jahres gegründet wurde. Wir sind nun im 16. Monat. Unsere junge Unternehmung deutet darauf hin, dass wir ein staatliches Unternehmen im Bereich der künstlichen Intelligenz sind. Wir verpflichten uns zu den Anforderungen des Generalsekretärs an Technologieunternehmen für Originalität, Disruption und Führungskraft. Seit Gründung der Volksrepublik China war Jiuxianqiao einst die Wiege der Elektronikindustrie des neuen China. Das Beijing Digital Economy Rechenzentrum und die heimische PoC-Plattform befinden sich etwa einen Kilometer von hier entfernt, und wir hoffen, dass Jiuxianqiao im KI-Zeitalter zu einer neuen Hochburg der künstlichen Intelligenz wird und die vierte industrielle Revolution in China beschleunigt.