StartseiteArtikel

AI-Chips mit neuer Architektur, wie AI ein hervorragendes Preis-Leistungs-Verhältnis schafft.

36氪品牌2025-01-17 16:48
Spezialchips, die für generative KI maßgeschneidert sind, werden bald zu einem Billionen-Markt. Hohe Leistung und kostengünstige Rechenkapazität für Inferenz werden die Kernanforderungen der Nutzer sein.

Im Zeitalter der großen Modelle drängt das AI-Unternehmertum in alle Branchen, wobei der Bereich der Rechenleistung als eine der besten Chancen für AI-Startups gilt.

Mit der rasanten Entwicklung großer Modelle wird Rechenleistung zum Kerntreiber im Bereich der künstlichen Intelligenz. Von GPT-4 bis zu den neuesten großskaligen Modellen steigen die Trainings- und Inferenzanforderungen in beispiellosem Tempo. Der Bedarf an Rechenleistung treibt direkt die Entwicklung spezialisierter AI-Chips voran, was wiederum das Unternehmertum im Chipbereich befeuert.

In China fliesst weiterhin Kapital in den Chipmarkt, viele AI-Chip-Startups entstehen. RuruAI ist ein Startup, das sich auf die Entwicklung von Inferenz-Chips für große Modelle konzentriert und aufgrund seines technisch starken Teams bereits viel Aufmerksamkeit auf sich gezogen hat.

Bei der kürzlich stattgefundenen „Lenovo New Business Innovation Eco Roadshow“ Saison zwei wurde RuruAI als ein Top 10-Projekt ausgewählt und ist ein neuer Stern im Lenovo-Ecosystem geworden. Das Einzug von RuruAI unterstreicht sowohl die eigene technische Stärke als auch Lenovos langjähriges Engagement für Startups innerhalb der SME Business Group: mit umfassendem, hochwertigem und One-Stop-Service das Wachstum innovativer Unternehmen zu begleiten. Die Lenovo SME Business Group ist bereit, mit Kunden zusammenzuarbeiten, um ihren Erfolg zu bezeugen.

"Das Zeitalter der großen Modelle wird alles verändern", sagt Huang Xiaoyu, Gründer von RuruAI, "spezialisierte Chips, die für generative AI maßgeschneidert sind, werden bald ein billionenschwerer Wachstumsmarkt sein. Hochleistungsfähige, kostengünstige Inferenzrechenleistung wird der Kernanspruch der Benutzer sein."

Neue Architektur, extrem gutes Preis-Leistungs-Verhältnis

Vor dem Hintergrund eines zunehmend verschärften globalen AI-Wettbewerbs beschleunigt China den Aufbau der Recheninfrastruktur, um seine Wettbewerbsfähigkeit im Zeitalter der großen Modelle zu stärken. Branchenexperten sind der Ansicht, dass die aktive Unterstützung der Regierung und die Neigung der relevanten Politik die Kosten für Rechenleistung weiter senken und die FuE-Effizienz von AI-Unternehmen verbessern werden. Das unternehmerische Engagement für inländische Chips geschieht jedoch nicht über Nacht und sieht sich mit Schwierigkeiten konfrontiert, darunter:

Erstens sind die technischen Hürden hoch, die Entwicklungszyklen lang. Inferenz-Chips müssen ein Gleichgewicht zwischen Leistung, Energieverbrauch und Kosten finden, und innovative Chiparchitekturen erfordern oft Jahre der Forschung und Entwicklung. Im Vergleich zum Ausland bestehen bei inländischen Startups Unterschiede in der technischen Akkumulation. Darüber hinaus ist der lokale Soft- und Hardware-Ökoaufbau unzureichend und macht es schwierig, Entwickler anzuziehen.

Zweitens ist der Markt wettbewerbsintensiv und muss mit Finanzierungs- und Ressourcenbelastungen rechnen. Einige Großkonzerne dominieren den AI-Chip-Markt, inländische Startups haben Schwierigkeiten, direkt mit ihnen zu konkurrieren. Die Chipentwicklung erfordert kontinuierliche Kapitalinvestitionen, vom Design über Tape-Out bis zur Massenproduktion, jeder einzelne Schritt kann Millionen bis Milliarden verschlingen. Da Startups in ihrer Finanzierungsfähigkeit begrenzt sind, können sie langfristige FuE nicht unterstützen.

Drittens unstabile geopolitische Faktoren. Einige der für die Chipentwicklung wesentlichen Ressourcen sind im Ausland beschränkt, was sich direkt auf den Fortschritt bei der Chipentwicklung und -produktion auswirkt.

Trotz der zahlreichen Herausforderungen kann RuruAI sein FuE-Rhythmus beibehalten und stetig weiter voranschreiten, was auf die fundierte technische Grundlage seines Kernteams zurückzuführen ist.

Huang Xiaoyus starkes Interesse an Chips reicht in seine Kindheit zurück, Anfang der 90er Jahre, als er zum ersten Mal mit einem Computer in Berührung kam und neugierig war, wie Computer funktionieren. Diese Neugier trieb seine akademische und berufliche Laufbahn voran. 2007 ging Huang Xiaoyu nach Großbritannien, wo er ein Interesse an Chipdesign entwickelte und sich während seines Aufbaustudiums auf Mikroelektronik und Chipdesign spezialisierte.

Nach seinem Abschluss blieb Huang Xiaoyu in Großbritannien und arbeitete mehr als zehn Jahre bei AMD und Broadcom. Sein Doktorvater war ein dreifaches Mitglied der europäischen Akademie der Wissenschaften des Vereinigten Königreichs, Steve Furber, der 1983 ein Team anführte, das die ARM-Architektur in Cambridge, Großbritannien, auf den Weg brachte und so als „Vater der ARM-Architektur“ gefeiert wurde.

Als ChatGPT 2022 in Erscheinung trat, wandte sich Steve an Huang Xiaoyu und sagte, dass die Situation jetzt sehr an die Zeit erinnere, als sie die ARM-Architektur erstellten, und dass der neue Bedarf an Rechenleistung durch große Modelle nach einer neuen und effektiven Chiparchitektur rufe. Huang Xiaoyu entschied sich daraufhin, RuruAI zu gründen und lud Steve ein, sich als Mitbegründer anzuschließen.

RuruAI ist bestrebt, einen speziellen ASIC-Inferenz-Chip für Transformer zu entwickeln. Technologische Wege für AI-Inferenz-Chips unterscheiden sich in GPU, FPGA, ASIC usw. Huang Xiaoyu sieht ASIC als künftige Hauptentwicklungsrichtung für AI-Chips. Denn wenn Modelle in die großflächige Anwendung gehen, kann ASIC Algorithmen neuraler Netze perfekt koppeln; im Vergleich zu universellen Chips sind bei ASICs weniger Redundanzen, geringerer Energieverbrauch, hohe Rechenleistung und Effizienz zu erwarten, je größer die Chiplieferungen, desto geringer die Kosten.

Aus diesem Grund hat RuruAI die neue Vajra-Architektur eingeführt, um Hochkonfrontationsszenarien für große Modellanwendungen zu bewältigen. Huang Xiaoyu erklärt, dass die Vajra-Architektur eine spezielle ASIC-Architektur für Algorithmusmodelle maßgeschneidert werden kann, um ein extrem gutes Preis-Leistungs- und Energieverhältnis zu erreichen. Gleichzeitig ermöglicht der von Vajra-Architektur initiierte große Model-Architektur-Umstrukturierungsalgorithmus eine Umstrukturierung auf Hardware-Ebene und unterstützt nahezu alle Varianten des Transformer-Modells.

„Wir erwarten, einige Aufgaben zu erfüllen, die GPUs nicht bewältigen können. ASICs um Transformer zu bauen, eine sichere Architektur, die Kunden ermöglicht, dass ihre Inferenzleistungen sich dem theoretischen Maximum annähern, um die Kosten zu senken und die Effizienz zu steigern.“, sagt Huang Xiaoyu.

Roadshow vor Ort, Freude und Gelassenheit

Die Hitze des Chipsektors wird zwangsweise zu verstärktem Wettbewerb führen. In diesem blutig umkämpften Markt wird der Kampf zwischen großen und kleinen Fischen weitergehen. Huang Xiaoyu ist der Meinung, dass im Vergleich zu den großen Chipunternehmen Startups den Vorteil haben, dass sie nicht so leicht in das 'Innovator's Dilemma' verfallen, das beim Eintritt in aufstrebende Märkte durch zu vorsichtige Abwägungen entstehen kann.

„Wie das Sprichwort sagt, 'Die Barfüßigen fürchten sich nicht vor den Schuhträgern', wir können alles mit vollem Einsatz wagen und wenn wir erfolgreich sind, gibt es einen großen Wachstumsmarkt, wenn wir scheitern, können wir schnell in eine andere Richtung einschlagen.“, meinte Huang Xiaoyu.

Aber obwohl Startups „schnell das Ruder herumreißen“ können, stellt sich heraus, dass es beim Härtetest um wirkliche Stärke geht und dass Einzeltaktik möglicherweise nicht die beste Strategie für kleine und mittlere Unternehmen ist. Beim Chip-Unternehmertum ist das nicht anders. Wenn man eine stabile und starke Unterstützung aus einem Ökosystem erhält, kann man sicherlich mehr mit weniger Aufwand erreichen.

In seinem dritten Unternehmensjahr erkannte Huang Xiaoyu das Lenovo-Ökosystem und das „Project Teslar“ von Lenovo. Er fand heraus, dass Lenovo fest an den Einsatz für große AI-Modelle glaubt und viele innovative Maßnahmen eingeführt hat. „Es ist unzweifelhaft, dass Lenovos Philosophie sehr gut mit unserer übereinstimmt.“ sagte Huang Xiaoyu, der sich sofort für die „Lenovo New Business Innovation Eco Roadshow“ Saison zwei bewarb.

Zuvor hatte Huang Xiaoyu dank seiner langjährigen Arbeit und seines Lebens im Vereinigten Königreich einen guten Eindruck von der Marke Lenovo. „Denn Lenovo ist in Europa großartig“, sagte er. Er bemerkte, dass viele europäische Ingenieure um ihn herum im Laufe der Jahre kontinuierlich ihre Arbeitsmaschinen auf Lenovo-Produkte umgestellt hatten, was daran lag, dass das Preis-Leistungs-Verhältnis von Lenovo-Produkten einige westliche Topmarken bei Weitem übertroffen hatte.

Mit der Absicht, mit Kollegen zu konkurrieren, bereitete Huang Xiaoyu sorgfältig die PPT für diese Roadshow vor. Während der Roadshow traf er viele Branchenführer, „Namen, die er früher nur auf WeChat-Accounts oder in Berichten gesehen hatte“. Er war begeistert und teilte während seiner Rede seinen Weg in der Forschung und Entwicklung sowie das echte Feedback von Kunden.

In den Augen von Huang Xiaoyu ist Lenovo als vorreiternde globale Technologieunternehmen mit vollständiger Ressourcen- und Forschungs- und Entwicklungsabdeckung in der Lage, wichtige Unterstützung für die Entwicklung von AI-Chips zu bieten. Lenovo hat tiefe Wurzeln im Bereich der Hardware wie PCs, Server und Datenzentren, wobei die weltweiten Lieferkettenressourcen AI-Chipdesign, Produktion und Lieferung unterstützen können, um Startups oder Partner schneller auf den Markt zu bringen.

Zusätzlich verfügt Lenovo über ein mächtiges Netzwerksystem, dessen Stärke in der Fähigkeit zur Ressourcenintegration liegt und das es AI-Chip-Entwicklungsteams ermöglicht, mehr Anpassungsunterstützung für Software und Hardware zu erhalten, um das Problem technischer Inseln zu verringern.

Deshalb fühlt sich Huang Xiaoyu nicht nur erfreut, sondern auch beständig, als RuruAI als Top 10-Projekt ausgewählt wurde und in Lenovos „Project Teslar“ eintritt. Der Weg nach vorne fühlt sich nicht mehr einsam an.

Unterstützung der Ökologie, Grundlage für unternehmerischen Mut

In seiner Freizeit, während er in der Branche arbeitet, ist Huang Xiaoyu gerne im Studium buddhistischer Schriften vertieft. "Die Weisheit der buddhistischen Schriften handelt eigentlich davon, wie der Geist funktioniert," sagt Huang Xiaoyu. "In gewissem Sinne stimmen buddhistische Schriften mit dem, was die künstliche Intelligenz erforschen will, überein."

Buddhistische Schriften beeinflussen auch die Unternehmenskultur von RuruAI, von Firmenname bis hin zu Produktnamen, die alle von der buddhistischen Philosophie inspiriert sind. Huang Xiaoyu erklärt, dass der Name Vajra aus der buddhistischen Schrift stammt und für die „wahre Natur des Geistes“ steht und die Erwartungen des FuE-Teams an die Zukunft widerspiegelt: „Eines Tages könnte es wirklich so etwas wie einen digitalen Geist geben.“

Die Weisheit der buddhistischen Schriften hat auch für Huang Xiaoyu große Bedeutung, „wie eine Taschenlampe“ gibt sie ihm starke Beruhigung, wenn er forscht und entwickelt oder ein Unternehmen gründet.

Jetzt erhält diese Beruhigung eine weitere Dimension durch die tatkräftige Unterstützung von Lenovo und dem Lenovo-Ökosystem.

Huang Xiaoyu erinnert sich, dass es bei der Roadshow viele Unternehmen gab, die mit ihm in Kontakt traten. Eine große staatliche Bank zeigte großes Interesse, lud ihn ein, das Hauptquartier der Bank zu besuchen und brachte technische Experten der Bank zum Austausch mit. Auch der Venture-Capital-Bereich und führende Brancheneinrichtungen nahmen Notiz von RuruAI.

Lenovo ist der wichtigste Grund, warum diese potenziellen Kooperationen zustande kamen. Huang Xiaoyu ist der Meinung, dass Lenovo in der Vergrößerung von AI-Model-Geschäftsumfelder eine vorwärtsgewandte Rolle spielt und somit bei der Förderung der nationalen großen Modellentwicklung erheblich mitwirkt.

Huang Xiaoyu ist offensichtlich hoffnungsvoll bezüglich des Lenovo-Ökosystems: „Wir haben gerade erst begonnen, in das Lenovo-Ökosystem einzutreten. In der Zukunft könnten unsere Chips mit Lenovos Geschäft kooperieren oder durch die Unterstützung der Lieferkette von Lenovos Ökosystem unsere eigene Entwicklung beschleunigen.“

Für RuruAI ist das Jahr 2025 ein entscheidendes Jahr. Nach zwei Jahren der Forschung und Entwicklung ist geplant, dass ihre selbstentwickelten Chips bis Ende dieses Jahres die Serienproduktion erreichen. Mit Hilfe des Lenovo-Ökosystems glaubt Huang Xiaoyu, dass die Entwicklung des Unternehmens in den nächsten Jahren noch erfolgreicher sein wird.