Zwei junge Unternehmer aus der Jahrgangsgeneration nach 1995 haben ein Unternehmen für optische Rechenchips gegründet und das weltweit erste optische Chip mit integrierter Speicher- und Rechenfunktion entwickelt.
Autor | Wu Ruoyu
Redakteur | Peng Xiaoqiu
Im Jahr 2022 haben zwei junge Leute unter 30 Jahren – einer hat seine amerikanische Firma geschlossen, der andere hat sein Promotionsstudium an der Universität Oxford unterbrochen – beide sind nach China zurückgekehrt und haben eine Firma namens „Light Standard“ gegründet.
Nach drei Jahren hat Light Standard den ersten optischen Rechenchip weltweit mit einer Rechnerleistung und einer Rechengenauigkeit, die den kommerziellen Standards entsprechen, in die Produktion gebracht. Es ist damit die einzige Firma weltweit, die die Integration von Speicher und Rechenleistung realisiert hat und einen optischen Chip mit einer 128*128-Matrixgröße auf einem einzigen Chipkorn integriert hat.
Derjenige, der seine amerikanische Firma geschlossen hat, ist Xiong Yinjiang, Mitbegründer und Vorsitzender von Light Standard. Er ist jetzt für den Betrieb und die Kommerzialisierung verantwortlich. Er hat einen Master-Abschluss von der Universität Chicago und verfügt über viele Jahre Erfahrung in der Engineering-Praxis von großen Modellen und AI-Agenten. Derjenige, der sein Promotionsstudium unterbrochen hat, ist Cheng Tangsheng, Mitbegründer und CEO von Light Standard. Er ist jetzt für die Forschung und Entwicklung sowie die Umsetzung von Projekten verantwortlich. Cheng Tangsheng war Schüler von Harish Bhaskaran, dem weltweit ersten Forscher auf dem Gebiet der optischen Berechnung mit Phasenwechselmaterialien und einem Mitglied der Royal Academy of Engineering in Großbritannien.
Die beiden Mitbegründer von Light Standard. Links ist Xiong Yinjiang, rechts ist Cheng Tangsheng.
Der Grund, warum Xiong Yinjiang und Cheng Tangsheng sich entschlossen haben, ein eigenes Unternehmen zu gründen, ist, dass sie sich seit Jahren für die Geschäftsmöglichkeiten im Bereich der optischen Berechnung interessiert haben. Vor der Gründung ihres Unternehmens hatten sie die Produktion und die Anwendungsvalidierung von kleinen Matrix-Chips wie 3×3 und 4×4 abgeschlossen und Erfahrungen in allen Prozessschritten wie Produktion, Design und Materialien gesammelt. Im Jahr 2022 hat die Nachfrage nach KI explodiert. Die Nutzung der Geschwindigkeit und der Vorteile des Lichts zur Neugestaltung der Chipherstellung könnte möglicherweise die Moore'sche Regel wirklich überwinden und die Sorge um die Rechnerleistung lösen. Sie glaubten, dass die beste Zeit gekommen war. Insbesondere seit diesem Jahr hat die Nachfrage nach Rechnerleistung in der Branche stark zugenommen, da die großen Modelle und die generative KI weiter aufgestiegen sind. Nicht nur die Modelltrainingsphase selbst, sondern auch die anschließende praktische Inferenzphase verbrauchen mehr Energie.
Nach dem Bericht „Energie und KI“ der Internationalen Energieagentur verbrauchten die globalen Rechenzentren im Jahr 2024 etwa 415 Terawattstunden Strom, was 1,5 % des globalen Stromverbrauchs ausmacht. Es wird vorausgesagt, dass dieser Wert bis 2030 mehr als verdoppelt werden wird und auf etwa 945 Terawattstunden steigen wird, was die aktuelle Gesamtstromaufnahme Japans übersteigen würde.
Zugleich hängt die Rechnerleistung eines Chips direkt mit der Anzahl der darin enthaltenen Transistoren zusammen. Derzeit ist die Lithografie-Technologie auf 3 Nanometer herunter gekommen, was fast die atomphysikalische Grenze von 0,3 Nanometer erreicht hat. Um die Rechnerleistung eines elektrischen Chips weiter zu verbessern, kann man nur die fortschrittlichen Verpackungstechniken wie das Stapeln von Chips anwenden, um die Moore'sche Regel aufrechtzuerhalten. Dies ist jedoch nur eine vorübergehende Lösung und kann das Problem der Energieverschwendung und des Ungleichgewichts zwischen Angebot und Nachfrage an Rechnerleistung nicht dauerhaft lösen.
Seit 2017 haben die akademischen Diskussionen an der Universität Oxford und am MIT über die optische Berechnung internationale Aufmerksamkeit erregt. Menschen haben festgestellt, dass optische Chips nicht nur die Anzahl der Transistoren erhöhen können, sondern auch die optische Technologie zur Signalverarbeitung nutzen können. Sie haben das Potenzial, die Rechnerleistung um mehr als 1.000 Mal zu erhöhen, verbrauchen weniger Energie und haben eine größere Bandbreite als elektrische Chips.
In den letzten Jahren haben nicht nur die Regierung, die Kapitalmärkte und die Unternehmen in der Rechnerleistung-Ökosystem die Entwicklung der optischen Rechenchips beobachtet, sondern es sind auch mehrere Firmen auf diesem Gebiet in China und im Ausland entstanden. Light Standard wurde in diesem Kontext gegründet und konzentriert sich auf die Forschung und Entwicklung von photonischen Rechenchips mit integrierter Speicher- und Rechenleistung auf Basis der Heterointegration von Siliziumphotonik und Phasenwechselmaterialien (PCM).
Von der Laborarbeit zur kommerziellen Umsetzung
Um die optischen Rechenchips aus dem Labor in die industrielle Anwendung zu bringen, müssen zwei Kernprobleme gelöst werden: Erstens, wie kann man das Licht von der Faseroptik-Skala auf die Chip-Skala verkleinern? Zweitens, wie kann man die Fähigkeit des Chips zur Lösung komplexer Rechenaufgaben beibehalten, während man die Größe verkleinert, um sicherzustellen, dass es den tatsächlichen Anforderungen in Szenarien wie großen Modellen und Rechenzentren entspricht?
Light Standard hat seinen Durchbruch mit einer präzisen Einschätzung des richtigen Eingangsmoments begonnen. „Im Jahr 2017 hat der optische Rechenchip aufgrund seiner vielen Vorteile Aufmerksamkeit erregt, aber damals waren die Branchenketten wie die Fabrikation und die Verpackungstechnologie in China und im Ausland noch nicht reif. Insbesondere die Schwächen in den Schlüsseltechnologien wie die Chipverpackung haben die kommerzielle Umsetzung des optischen Rechenchips erschwert.“ sagte Xiong Yinjiang, Mitbegründer und Vorsitzender von Light Standard.
Bis 2022 hat die Explosion der KI und die Reifung der gesamten Branchenkette dazu geführt, dass es jetzt erforderlich ist, dass die Designfirmen aktiv in die Produktion eingreifen und die Produktionskette durch die Nachfrage beschleunigen, um die kommerzielle Umsetzung voranzutreiben. Daher hat Light Standard sich entschieden, sich in diesem Moment einzubringen.
Im Vergleich zum üblichen Rhythmus von Technologieunternehmen hat Light Standard seinen Produktentwicklungsprozess deutlich schneller vorangetrieben.
Nach der Gründung der Firma hat es schnell die Iteration der Matrixgrößen wie 16x16 und 25x25 abgeschlossen. Im Jahr 2023 hat es die Produktion eines Chips mit einer 64x64-Matrixgröße erreicht und im Juni des folgenden Jahres die 128x128-Matrixgröße erreicht.
Optischer Rechenchip mit einer 128*128-Matrixgröße
Aber die Produktion eines Chips mit einer 128×128-Matrix ist nur der erste Schritt, um die kommerzielle Schwelle zu erreichen. „Das bloße Erhöhen der Matrixgröße kann keine Wettbewerbsvorteile schaffen. Viele Lösungen haben feste Knotenpunkte und können nur für bestimmte Berechnungen verwendet werden, nicht für verschiedene Modelle.“ betonte Xiong Yinjiang. Der Wert des Light Standard-Chips liegt auch darin, dass es das erste Architektur mit „mehr als 16.000 Knotenpunkten, wobei jeder Knotenpunkt vollständig einstellbar ist“ geschaffen hat.
Für Szenarien wie die großen Modelle ist die 128×128-Matrix die derzeit „wirtschaftlich vertretbare“ Größe für die Aufteilung des Modells. Die Echtzeit-Einstellbarkeit der Knotenpunkte ermöglicht es dem Chip, sich an die Parameteränderungen eines beliebigen Modells anzupassen, was einen wichtigen Raum für die Programmierbarkeit der Matrixrechnung eröffnet – dies ist der Kernmarker für die Übernahme der optischen Rechenchips von der Forschung in die kommerzielle Nutzung.
Die Grundlage für diesen Durchbruch ist die einzigartige Wahl der Technologie von Light Standard: Die Heterointegration von Siliziumphotonik und Phasenwechselmaterialien sowie die einzigartige Crossbar-Photonen-Matrix-Rechenstruktur bieten die Kernlösungen für die beiden Probleme der „Größenverkleinerung“ und des „Gleichgewichts zwischen Rechnerleistung und Energieverbrauch“.
Demonstration der Crossbar-Technologie
„Die herkömmlichen reinen Silizium-Architekturen haben eine große Größe der programmierbaren Rechenmodule. Auf der Fläche eines Standard-Chips können nur einige hundert Module platziert werden. Bei der Standard-GHz-Taktfrequenz beträgt die Rechnerleistung nur wenige Tops, was weit hinter den Anforderungen der KI zurückbleibt. Noch wichtiger ist, dass reines Siliziummaterial während der Berechnung ständig Strom benötigt, um seinen Zustand aufrechtzuerhalten. Dieser Energieverbrauch macht 70 - 80 % des gesamten Energieverbrauchs des Systems aus, was hohe Anforderungen an die Wärmeableitung stellt und im Widerspruch zur Entwicklungstrend der zunehmenden Nachfrage nach Rechnerleistung steht.“ erklärte Xiong Yinjiang.
Durch die Forschung hat Light Standard die Größe der Module mit Phasenwechselmaterialien auf 1/10 - 1/20 der herkömmlichen Lösung verkleinert und die Größe der Matrix um das 10 - 20-fache erhöht. Bei der Energieeffizienz des KI-Chips hat Light Standard auch Optimierungen vorgenommen.
Heute braucht der Chip auf Basis der Heterointegration von Siliziumphotonik und Phasenwechselmaterialien nur einen einzigen Impuls mit sehr geringer Energie, um die Parameter zu aktualisieren. Aufgrund der nicht-flüchtigen Eigenschaft des Phasenwechselmaterials muss der Zustand nicht ständig mit Energie aufrechterhalten werden, was nahezu einen Energieverbrauch von Null bedeutet.
Darüber hinaus hat Light Standard die Speichermodule und die Rechenmodule integriert, indem es die Speicherfunktion des PCM-Phasenwechselmaterials nutzt, um die integrierte Speicher- und Rechenleistung zu realisieren und die Speicherlast zu verringern und die Leistung des Chips zu verbessern.
Wie verkauft man optische Chips?
In der kommerziellen Phase werden an Technologieunternehmen höhere Anforderungen gestellt. Die beiden Kundengruppen auf der Cloud-Seite, denen Light Standard zurzeit gegenübersteht, haben deutlich unterschiedliche Ansprüche, aber jeder Anspruch ist klar definiert.
Die Endverbraucher, repräsentiert durch die großen Internet-Unternehmen, sind auch das „Endspiel“ des Ökosystems der Rechnerleistung. Diese Kunden verfügen über eine eigene reife Rechenleistungskluster und Fähigkeiten zur Entwicklung großer Modelle. Für sie ist es kommerziell sinnvoll, auch wenn die Anfangsinvestitionen hoch sind, wenn der optische Rechenchip die Kernindikatoren wie Energieeffizienz und Rechnerleistungsdichte deutlich übertrifft. Darüber hinaus müssen die Hardwarekomponenten der schnellen Iteration der Modelle voraus sein und die neue Software-Ökosystem kompatibel sein.
Die andere Kundengruppe auf der Cloud-Seite sind die von der Regierung geführten KI-Rechenzentren, deren Anforderungen eher standardisiert sind und die mehr auf die wirtschaftliche Effizienz des Projekts achten. Die unterschiedlichen Ansprüche der beiden Kundengruppen sind im Wesentlichen die konkrete Darstellung des technologischen Werts in verschiedenen Szenarien und bilden genau das vollständige Marktkoordinatensystem für die Übernahme des optischen Rechenchips von der technologischen Validierung zur kommerziellen Massennutzung.
Die optoelektrischen Hybridrechenkarten, die Light Standard derzeit entwickelt, können über die PCIe-Schnittstelle oder andere allgemeine Standards Daten austauschen. Sie sind plug-and-play-fähig und bieten eine oberste Anwendungs-Schnittstelle und Ökosystem, die einfach kompatibel sind. Sie verfügen über eine hohe Energieeffizienz und eine hohe Algorithmusflexibilität und eignen sich für verschiedene Anwendungsfälle.
„In Zukunft werden unsere Produkte auch in den Endgeräten getestet. Die Unterschiede in den Kundenanforderungen zwischen der Cloud-Seite und der Endgeräte-Seite sind noch größer. Die Kernanforderungen auf der Cloud-Seite sind die hohe Energieeffizienz und die Algorithmusflexibilität. Es muss verstärkt in die Software-Ökosystem-Integration investiert werden und die Kompatibilität zwischen Hardware und Algorithmus gezielt optimiert werden. Auf der Endgeräte-Seite wird dagegen die Stabilität betont. Insbesondere in der Automobilanwendung müssen die extremen Temperaturen und andere komplexe Umgebungen berücksichtigt werden, was höhere Anforderungen an die Zuverlässigkeit der Hardware stellt.“ fügte Cheng Tangsheng, Mitbegründer und CEO von Light Standard, hinzu.
Der optoelektrische Hybridrechenchip in der ersten Verpackungsphase
Derzeit hat Light Standard Kooperationen mit führenden chinesischen Internet-Unternehmen, GPU-Herstellern, KI-Rechenzentren und Universitäten eingegangen und wartet auf die weitere Anwendungsvalidierung. Gleichzeitig führt es auch tiefe technische Austausch über die Anwendungen mit Satellitenherstellern, Telekommunikationsbetreibern und optischen Modulherstellern durch.
In Bezug auf die Verpackung und das Testen hat Light Standard frühzeitig Kooperationen mit Fabrikanten eingegangen und gemeinsam fortschrittliche Verpackungstechnologien entwickelt, um die technologische Iteration voranzutreiben. In diesem Jahr wird Light Standard die gemeinsame Verpackung und das