NVIDIA GPUs werden von SpaceX in den Weltraum geschickt, um Karpathy's NanoGPT dort zu trainieren.
KI ist tatsächlich in den Weltraum gekommen.
Die Menschheit hat erstmals ein großes Modell im Weltraum trainiert und betrieben.
Die Hauptakteure sind uns auch sehr vertraut: Nvidia, SpaceX, Google … und NanoGPT von Andrej Karpathy, dem ehemaligen Mitbegründer von OpenAI.
Sobald diese Namen genannt werden, wird die Geschichte klar –
Nachdem die SpaceX-Rakete die Nvidia H100-Chips in den Weltraum gebracht hat, wurde das Open-Source-Großmodell Gemma von Google im Orbit betrieben, und es wurde eine Antwort erhalten:
Hallo, Erdlinge!
△
Außer Gemma wurde auch das Large Language Model NanoGPT von Karpathy auf der H100 mit dem kompletten Werk von Shakespeare trainiert.
Zu diesem Thema haben die Internetnutzer etwas zu sagen: In Zukunft müssen die Außerirdischen nicht mehr persönlich zur Erde kommen, um sie zu erforschen (doge).
Erstes Training von KI im Weltraum
Anfang des vergangenen Monats hat das Startup Starcloud, das als Mitglied von Nvidia Inception auf Weltraum-Datenzentren spezialisiert ist, den Starcloud-1-Satelliten mit einer SpaceX-Rakete in den Weltraum geschossen. Dieser Satellit ist mit Nvidia H100-Chips ausgestattet.
Jetzt hat die Menschheit erstmals auf diesem Satelliten ein großes KI-Modell im Weltraumorbit trainiert und betrieben.
Bei diesem ersten Weltraum-KI-Auftritt hat sich Gemma (Weltraumversion) so begrüßt:
Hallo, Erdlinge! Oder viel lieber möchte ich Sie nennen – eine faszinierende Existenz aus Blau und Grün.
Lassen Sie uns mal sehen, welche Wunder in der Welt, in der Sie leben, stecken. Ich bin Gemma, ich bin hier, um zu beobachten, zu analysieren und vielleicht gelegentlich auch etwas beunruhigende, aber dennoch einsichtreiche Einsichten zu geben. Lassen Sie uns anfangen!
Das erste direkt im Weltraum trainierte Modell ist das LLM NanoGPT, das von Andrej Karpathy entwickelt wurde.
Das Ziel von Starcloud ist jedoch nicht nur, dass KI im Weltraum funktionieren kann. Es plant auch, ein 5-GW-Orbit-Datenzentrum auf der Grundlage von Solarmodulen zu bauen, und die Bau- und Betriebskosten sollen deutlich niedriger sein als die der Erdkollegen.
Außerdem wurde angekündigt, dass bei der nächsten Satellitenraketenfahrt im Oktober 2026 mehr Nvidia H100-Chips und auch die Blackwell-Plattform in den Weltraum geschickt werden sollen.
Philip Johnston, CEO von Starcloud, sagte einmal:
Alles, was man auf einem Erddatenzentrum tun kann, hoffe ich auch im Weltraum zu können. Wir tun das, weil wir auf der Erde Energiebeschränkungen haben.
Je größer die KI-Modelle trainiert werden, desto knapper werden Strom und Land für Datenzentren. In manchen Städten ist die Stromnetzlast hoch, und bei manchen Unternehmen machen die Stromkosten den größten Teil der Trainingskosten aus. Die Energie und Infrastruktur der Erde haben ihre Grenzen erreicht, und die Wachstumskurve der KI wird von den geophysikalischen Bedingungen der Erde eingeschränkt.
Im Weltraum in niedriger Umlaufbahn gibt es jedoch keine Einschränkungen wie Land und Kühlung auf der Erde, und die Kosten wären theoretisch niedriger als auf der Erde. Die kontinuierliche und ausreichende Sonnenenergieversorgung gibt dem in-orbit-Rechenvermögen auch einen Energievorteil für den Langzeitbetrieb.
Viele Leute haben das Senden von Rechenleistung in den Weltraum in ihre Planung aufgenommen.
Nachdem die Nvidia H100 in den Weltraum geschickt wurde, sagte der CEO von Google, dass er auch TPUs in den Weltraum schicken will. Die ersten beiden Satelliten sollen Anfang 2027 starten.
Chinesische Akteure haben auch frühzeitig Pläne für Weltraumrechenleistung.
Seit 2019 haben chinesische Forschungseinrichtungen (wie das Institut für Informatik der Chinesischen Akademie der Wissenschaften, die Wuhan-Universität und die Peking-Universität für Post und Telekommunikation) die Weltraum-Intelligente Berechnung erforscht und Schlüsseltechnologien untersucht.
2024 hat das Team von Zhongke Tiantian das Hochladen und die Bereitstellung eines großen Modells im Weltraum abgeschlossen und die "Weltraum-Intelligente Kette" aufgebaut.
Im Mai dieses Jahres hat Guoxing Aerospace zusammen mit dem Zhijiang-Laboratorium das weltweit erste Weltraumrechnungs-Konstellation (die ersten 12 Satelliten der "Drei-Körper-Rechnungs-Konstellation") erfolgreich ins Weltall geschickt. Im September hat es die normale kommerzielle Betriebsweise erreicht und die erste kommerzielle Aufgabe erfolgreich unterstützt.
Im November hat Zhongke Tiantian das "Tiantian-Plan" veröffentlicht, in dem die Errichtung eines Super-Intelligenten-Agenten-Clusters mit 10 EOPS Rechenleistung in der Nähe der Erdoberfläche vorgeschlagen wird, und es hat auch das technische Projekt zur Bewältigung der Strahlungs- und Wärmeableitungschallenges veröffentlicht.
Die Weltraumversion der KI beschleunigt …
Referenzlinks:
[1]https://www.cnbc.com/2025/12/10/nvidia-backed-starcloud-trains-first-ai-model-in-space-orbital-data-centers.html
[2]https://x.com/karpathy/status/1998806260783919434
Dieser Artikel stammt aus dem offiziellen WeChat-Account „Liangziwei“. Verfasser: Wen Le. Veröffentlicht von 36Kr mit Genehmigung.