Der nächste Stopp für KI: QPU. NVIDIA hat bereits Pläne gemacht.
In den letzten Jahren haben die Regierungen der Vereinigten Staaten, Chinas und Europas ihre Investitionen in die Forschung und Entwicklung auf dem Gebiet der Quanteninformation erhöht.
Und erst kürzlich auf der neuesten GTC-Konferenz hat Jensen Huang, CEO von NVIDIA, erneut das QPU erwähnt. Dies deutet darauf hin, dass die kommerzielle Anwendung der Quantenrechnung in die Endphase eingetreten ist. Innerhalb von nur einer Woche haben Google und NVIDIA nacheinander technologische Durchbrüche im Bereich der Quantenrechnung angekündigt.
Was ist ein QPU?
Das QPU (Quantum Processing Unit, also die Quantenverarbeitungseinheit) ist die Kernkomponente eines Quantencomputers. Es realisiert die Rechenfunktion auf der Grundlage der Prinzipien der Quantenüberlagerung und -verschränkung. Seine Rechenleistung wächst exponentiell (2ⁿ) mit der Anzahl der Quantenbits n. Die derzeitigen Haupttechnologielösungen für QPUs umfassen physikalische Systeme wie supraleitende Quanten, Ionenfallen und Quantenpunkte und zeigen in hybriden Quanten-Klassik-Rechenarchitekturen großes Potenzial bei der Lösung komplexer Probleme.
Die Quantenrechnung ist eine revolutionäre Rechentechnologie, die die Eigenschaften der Quantenphysik nutzt, um Informationsprobleme zu behandeln und zu lösen. Sie wird auf einem Quantencomputer ausgeführt, der ein speziell entworfenes elektronisches Gerät ist, das die Manipulation von Objekten auf der Quantenebene ermöglicht. Auf der Quantenebene verhalten sich die Objekte ganz anders als in unserem alltäglichen Erleben. Die Quantenrechnung nutzt diese einzigartigen Quantenverhaltensweisen, indem sie Programme schreibt, um Aufgaben auszuführen, die herkömmliche Computer nicht bewältigen können.
Der wichtigste Durchbruch in der Quantenrechnung liegt in den Eigenschaften der Quantenbits (Qubits). Im Gegensatz zu klassischen Bits (0 oder 1) können Qubits in einem Zustand der Überlagerung vorliegen, d. h. gleichzeitig 0 und 1 sein. Dadurch können Quantencomputer mehrere Möglichkeiten parallel erkunden.
Betrachtet man die technologischen Umsetzungspfade, so lassen sich die Hardware für die Quantenrechnung hauptsächlich in zwei Kategorien einteilen.
Die erste Kategorie ist der Weg der "künstlichen Teilchen", bei dem diskrete Energieniveausysteme auf der Grundlage von mikroskopischen Strukturen aufgebaut werden, wie bei der supraleitenden Quantenrechnung und der Silizium-Halbleiter-Quantenrechnung. Der Vorteil liegt in der hohen Skalierbarkeit und der leichten Kopplung mit der bestehenden integrierten Schaltungstechnologie. Allerdings stehen vor derartigen Ansätzen die Herausforderungen der Quantengattertreue und der Bitkontrolle. Die supraleitende Quantenrechnung basiert auf der supraleitenden Josephson-Struktur, um ein Zwei-Niveau-System aufzubauen, wie z. B. in den Konfigurationen von Transmon und Fluxonium. Der Vorteil besteht in der hohen Skalierbarkeit, der leichten Manipulation und der guten Kompatibilität mit integrierten Schaltungen. Es ist derzeit einer der am besten entwickelten und führenden Ansätze. Beispielsweise setzt IBM ständig neue Rekorde bei der Anzahl der Bits und der Manipulationsgenauigkeit, und Google hat mit dem "Sycamore"-Chip die Quantenüberlegenheit demonstriert. Die Silizium-Halbleiter-Quantenrechnung nutzt die Spins von Elektronen in Silizium-basierten Quantenpunkten, um Quantenbits aufzubauen. Der Kernvorteil besteht in der hohen Skalierbarkeit und der hohen Kompatibilität mit der bestehenden CMOS-Technologie, was es für die Massenproduktion geeignet macht. Allerdings ist die Skalierbarkeit immer noch vor Herausforderungen gestellt, da es Probleme bei der Verarbeitung von Isotopenmaterialien und der Gitterstörung gibt.
Die zweite Kategorie ist der Weg der "natürlichen Teilchen", bei dem mikroskopische Teilchen direkt manipuliert werden, wie bei der Ionenfallen-Quantenrechnung, der Quantenrechnung mit neutralen Atomen und der Quantenrechnung mit Lichtquanten. Die Merkmale sind die gute Identität der Bits und die hohe Genauigkeit der logischen Gatter. Allerdings gibt es Herausforderungen bei der Konstruktion von großen Systemen. Die Ionenfallen-Quantenrechnung fängt geladene Ionen mithilfe eines Radiofrequenz-Elektrofelds ein und nutzt den Grundzustand und den angeregten Zustand der Ionen, um ein Zwei-Niveau-System aufzubauen. Der Kernvorteil besteht in der guten Vollvernetzung der Quantenbits, der extrem hohen Manipulationsgenauigkeit und der langen Kohärenzzeit. Es ist derzeit einer der Ansätze mit der höchsten Gattertreue. Allerdings stehen vor ihm die Herausforderungen der Massenausdehnung und der hochintegrierten Mess- und Steuerungstechnik. Die Quantenrechnung mit neutralen Atomen fängt neutrale Atome in einer Ultrahochvakuumkammer mithilfe von "optischen Pinzetten" (Laser) ein und bringt sie in den Rydberg-Zustand, um ein Zwei-Niveau-System aufzubauen. Der Kernvorteil besteht in der langen Kohärenzzeit, der hohen Treue und der besseren Skalierbarkeit als bei der Ionenfallen-Quantenrechnung. In den letzten Jahren hat es die schnellste Wachstumsrate bei der Anzahl der Bits gezeigt. Die Quantenrechnung mit Lichtquanten nutzt die Freiheitsgrade wie die Polarisation und die Phase von Photonen, um Quantenbits aufzubauen. Der Kernvorteil besteht in der langen Kohärenzzeit, der Möglichkeit, bei Raumtemperatur zu arbeiten und der einfachen Mess- und Steuerungstechnik. Sie wird in zwei Kategorien unterteilt: die "logische Gatter"-Art (allgemeine Rechnung) und die "spezielle" Art (z. B. Bose-Sampling, kohärentes Ising-System, für kombinatorische Optimierung).
Diese beiden Lager haben jeweils ihre eigenen Merkmale und Vorteile. Derzeit befinden sie sich in einer parallelen Entwicklungsphase und treiben gemeinsam die schnelle Entwicklung der Quantenrechnungstechnologie voran. Laut der Branchenplanung plant IBM, bis 2029 ein System mit 200 logischen Quantenbits zu liefern und bis 2033 die Anzahl auf Tausende von logischen Bits zu erweitern.
Das QPU passt perfekt zu KI
Die weltweit bekannte Beratungsfirma für aufstrebende Technologien ICV meint in ihrer Veröffentlichung "2024 Global Quantum Computing Industry Development Prospect", dass das Ende 2027 bis Anfang 2028 ein wichtiger Zeitpunkt für die gesamte Branche sein wird. Spezielle Quantencomputer werden allmählich bestimmte Probleme lösen können, wie kombinatorische Optimierung, Quantenchemie und maschinelles Lernen, und die Materialentwicklung und die Arzneimittelentwicklung vorantreiben.
Die Fusion von Quantenrechnung und Künstlicher Intelligenz wird als wichtiger Richtung für die nächste Generation der Rechenrevolution angesehen. Der Kern dieser Fusion liegt nicht in einer einseitigen technologischen Überlagerung, sondern in der horizontalen Verbindung mehrerer Bereiche und Disziplinen, die durch kooperative Innovationen nichtlineares Wachstum erzielen. Die Quantenrechnung hat das Potenzial, die derzeitige Rechenleistungsschranke bei der KI-Modellbildung zu überwinden und die Effizienz der Algorithmen zu verbessern. Andererseits sind Quantenbits leicht anfällig für Umwelteinflüsse und erfordern komplexe Kalibrierungs- und Fehlerkorrekturalgorithmen, um ordnungsgemäß zu funktionieren. Künstliche Intelligenz kann in Bereichen wie der Quantenkontrolle, der Fehlerkorrektur und der Algorithmenentwicklung die Quantentechnologie unterstützen und neue Wege für die Stabilität und Skalierbarkeit von Quantensystemen eröffnen.
Derzeit gibt es hauptsächlich zwei Richtungen bei der Kombination von Quanteninformation und Künstlicher Intelligenz: Eine ist "AI for Science" (wissenschaftliche Intelligenz), beispielsweise hat Google einmal künstliche Quantenintelligenz eingesetzt, um Fehlerkorrekturcodes zu optimieren. Die andere ist die Stärkung des maschinellen Lernens durch die Quantenrechnung. Wenn Quantencomputer in Zukunft reif werden, werden sie der KI die Rechenleistung zur Verfügung stellen.
Was die Energieeffizienz betrifft, hat das QPU theoretisch einen niedrigeren Stromverbrauch als klassische Prozessoren. Hybridsysteme werden als wirksamer Weg angesehen, um den Gesamtenergieverbrauch zu senken. Durch die Verwendung der Quantenrechnungstechnologie kann das Problem des Energieverbrauchs von gegenwärtigen KI-Rechenzentren effektiv gelöst werden.
NVIDIA hat bereits einen QPU-Ansatz entwickelt
Als Marktführer im Bereich der KI kann NVIDIA natürlich nicht außer Acht lassen, im Bereich des QPU tätig zu werden. Im Juni dieses Jahres hat Jensen Huang, CEO von NVIDIA, auf der GTC-Konferenz in Paris, Frankreich, erklärt, dass der Bereich der Quantenrechnung einen historischen Wendepunkt erreicht habe und vorhersagt, dass die nächsten Supercomputer mit einem QPU verbunden mit einem GPU ausgestattet sein werden.
Im Jahr 2022 hat NVIDIA die Gründung eines Projekts für hybride klassische - Quantencomputer angekündigt und vorgeschlagen, eine Architektur mit geringer Latenz für die Verbindung zwischen GPU und QPU sowie ein einheitliches Programmiermodell zu entwickeln. Durch die Schaffung eines schnellen, wenig verzögerten Verbindungskanals zwischen GPU und QPU wird es möglich, die klassischen Rechenressourcen für die Echtzeitoptimierung und -kalibrierung von Quantenkreisen zu nutzen. Das Kerntechnik-Toolkit cuQuantum dieses Systems ist bereits kommerziell erhältlich und wird von Unternehmen wie Amazon Web Services und Menten AI bei der Simulation von Quantenkreisen und der Optimierung der Arzneimittelentwicklung eingesetzt.
Bei der jüngsten GTC-Konferenz in Washington hat NVIDIA einen wichtigen Durchbruch im Quantenbereich bekannt gegeben und NVQLink vorgestellt, das die direkte Kommunikation zwischen QPU und GPU eines Quantencomputers ermöglicht. Jensen Huang hat darauf hingewiesen, dass das QPU in der Quantenrechnung bisher nie so viel Unterstützung erhalten habe. Derzeit haben 17 Quantenrechnungsunternehmen und 8 nationale Labore des US-amerikanischen Energieministeriums (DOE) sich an das NVIDIA-Ökosystem angeschlossen.
NVQLink ist im Wesentlichen eine Architektur für offene Systeme, die speziell entwickelt wurde, um die maximale Leistung der GPU-Rechenleistung eng mit der Quantenverarbeitungseinheit zu koppeln und einen beschleunigten Quanten-Supercomputer zu bauen. Aus technischer Sicht erreicht es eine Latenz von weniger als 4,0 Mikrosekunden (Hin- und Rückreise von FPGA über GPU zu FPGA) und einen Durchsatz von bis zu 400 Gb/s zwischen GPU und QPU. Diese Geschwindigkeit ist für die Quantenfehlerkorrektur von entscheidender Bedeutung, da die Quantenzustände äußerst empfindlich sind und die Detektion und Korrektur in kürzester Zeit erfolgen müssen.
Obwohl Quantencomputer theoretisch schnell sind, haben sie das fatale Problem, "zu empfindlich" zu sein: Thermisches Rauschen und elektromagnetische Störungen führen leicht zu Rechenfehlern, und diese Fehler akkumulieren sich, was die Ergebnisse unzuverlässig macht. Die Quantenfehlerkorrektur ist möglicherweise eine der am stärksten parallelen Rechenaufgaben weltweit, und hier kommt die GPU ins Spiel.
In der gegenwärtigen NISQ-Zeit (Noisy Intermediate-Scale Quantum, also die Zeit der Quantencomputer mit mittlerer Größe und Rauschen) sind die Quantenbits äußerst empfindlich. Ihre Entwicklung ist durch klassische Rechenaufgaben wie die Fehlerkorrektur, Kalibrierung und Kontrolle eingeschränkt. Um diese Engpässe zu überwinden, wird eine enorme klassische Rechenleistung benötigt. In Zukunft wird jeder NVIDIA GPU-Science-Supercomputer eng mit einer Quantenverarbeitungseinheit gekoppelt sein. NVQLink wird die schnelle Verbindung auf Hardwareebene herstellen, während CUDA-Q die einheitliche Programmierung und Verwaltung auf Softwareebene übernimmt.
CUDA-Q ist ein quelloffenes Softwareplattform für hybride Quanten-Klassik-Rechenaufgaben, die von NVIDIA entwickelt wurde und als "CUDA für die Quantenrechnung" positioniert wird. Sein hybrides Programmiermodell ermöglicht die gemeinsame Nutzung von GPU-, CPU- und QPU-Ressourcen in einem einzelnen Quantenprogramm. Dadurch können Entwickler Code schreiben, der nahtlos auf allen drei Plattformen laufen kann, und es bietet spezielle Lösungen für die Quantenfehlerkorrektur, was die Schwelle für die Entwicklung von Quantenrechnungen erheblich senkt.
In der industriellen Praxis hat NVIDIA über die CUDA-Q-Plattform Supercomputersysteme wie das Jülich Supercomputing Centre in Deutschland und das ABCI-Q in Japan verbunden und ein Ökosystem für die gemeinsame Nutzung von QPU und GPU geschaffen. In der hybriden Architektur ist das QPU für die Ausführung der Kernmodule von Quantenalgorithmen zuständig, während der klassische Prozessor die Datenvorverarbeitung und die Optimierung der Ergebnisse übernimmt.
NVIDIAs Strategie ist sehr klug - es entwickelt keine eigenen Quantencomputer, sondern konzentriert sich auf das Gebiet, in dem es am besten ist: auf die Schaffung einer Brücke zwischen Quanten- und klassischer Rechentechnologie. So werden Hersteller von Quantenrechnerchips von sich aus NVIDIA GPUs kaufen und diese zusammen nutzen.
Die chinesische Quantenrechnungsindustrie: Mehrere Ansätze laufen parallel
China ist auch in diesem Bereich nicht zurückgeblieben und schreitet ebenfalls voran.
Bose Quantum konzentriert sich auf den Weg der Quantenrechnung mit Lichtquanten und hat bisher sechs Finanzierungsrunden abgeschlossen. Der Unternehmenssprecher hat erklärt, dass es schwierig sei, einen universellen Quantencomputer zu entwickeln, aber dass es möglich sei, dass spezielle Quantencomputer in 3 - 5 Jahren kommerziell nutzbar werden. Derzeit hat das Unternehmen in Bereichen wie Finanzen, Kommunikation, Lebenswissenschaften, KI, Energieversorgung und Materialchemie marktorientierte Forschungen durchgeführt. Beispielsweise hat es mit Pharmazeutikern zusammengearbeitet, um Anwendungen in den Lebenswissenschaften voranzutreiben, und mit Banken wie Huaxia Bank und Ping An Bank an der Risikokontrolle in der Finanzbranche gearbeitet.
Turing Quantum verfolgt ebenfalls den Weg der Quantenrechnung mit Lichtquanten. Ge Zhibin, der Verkaufsleiter der KI-Rechenabteilung, hat erklärt, dass das Unternehmen 2021 gegründet wurde und in vier Jahren fünf Finanzierungsrunden abgeschlossen hat. Die jüngste Finanzierungsrunde, eine strategische Runde in Höhe von 100 Millionen Yuan, wurde am 21. Juli 2024 abgeschlossen und von Shengshi Investment geleitet. Die Mittel werden hauptsächlich für die Produktentwicklung von Photonenchips und die Beschleunigung der Industrialisierung eingesetzt. Am 7. November 2021 wurde das Joint Research Center for Photonic Chips von Shanghai Jiao Tong University in Wuxi offiziell unterzeichnet. Turing Quantum hat auf der Grundlage des Instituts für Photonenchips von Shanghai Jiao Tong University in Wuxi die erste chinesische Pilotproduktionslinie für Photonenchips gebaut, mit einer Gesamtinvestition von 650 Millionen Yuan. Die Schlüsselausrüstung für die Pilotproduktionslinie wurde im Januar 2024 installiert, was bedeutet, dass China in den Bereich der tatsächlichen Industrialisierung von Photonenchips eingetreten ist.
Guodun Quantum hat sich für den Weg der supraleitenden Quantenrechnung entschieden. Zhang Xujing, die Person in Charge der Quantenrechnungsaktivitäten, hat erklärt, dass die Quantenrechnung und die KI sich gegenseitig fördern und dass die Kombination von beiden einen "1 + 1 > 2"-Effekt erzielen wird. Derzeit haben weltweit vier Quantencomputer die Quantenüberlegenheit demonstriert, darunter der "Aurora"-Quantencomputer aus Kanada, der "Sycamore"-Chip von Google, der