Mit 17 iPhone geknackt, 18 Jahre später Nvidia herausgefordert: AMD liefert freiwillig Chips

Ein Chiphersteller mit einem Marktwert in Billionen-Höhe schickte freiwillig zwei seiner besten KI-Beschleunigungskarten an den Hacker, der mit 17 Jahren das iPhone knackte: George Hotz. Hotz will mit 20.000 Codezeilen den Festungsgraben von Nvidias CUDA aufbrechen. Seine These ist einfach: Was Nvidia von der Konkurrenz abhebt, sind nicht die Chips selbst, sondern die über mehr als ein Jahrzehnt aufgebaute Softwarekomplexität – und dieser Festungsgraben ist vielleicht gar nicht so tief.

Im März 2025 veröffentlichte George Hotz einen Artikel auf seinem persönlichen Blog. Der Titel bestand nur aus zwei Wörtern: AMD YOLO, was soviel wie „Alles auf AMD setzen, ohne Rückzugsoption“ bedeutet.

Hotz schrieb im Artikel: AMD schickt uns zwei MI300X (AMDs Spitzen-AI-Beschleunigungskarten für Rechenzentren), die sich bereits auf dem Weg befinden.

Der MI300X ist AMDs Flaggschiffprodukt im Bereich der AI-Rechenleistung. Normalerweise müssen Cloud-Anbieter und Großmodellunternehmen an der Warteschlange stehen, um diese Karten zu bekommen. Jetzt sollen sie jedoch an tiny corp geschickt werden: ein kleines Unternehmen, das damals nicht einmal über ein Büro verfügte und über GitHub und Discord funktionierte.

Der Empfänger dieses Pakets ist in der Szene unter dem Namen geohot - George Hotz - bekannt.

Der Name geohot wurde erstmals 2007 durch ein Video bekannt. Damals war er 17 Jahre alt und entriegelte zum ersten Mal ein iPhone.

Im Jahr 2007 zeigte der 17-jährige George Hotz vor der Kamera das weltweit erste entriegelte iPhone. Das Video erreichte fast zwei Millionen Aufrufe und machte den Namen geohot in der Hackerszene bekannt.

Später wurde er wegen des Hackens der Sony PS3 vor Gericht gezogen. Diesmal will er jedoch etwas Größeres tun: von der Software-Seite her die CUDA-Mauern von NVIDIA sprengen.

„CUDA ist eine Ökosystem, kein unüberwindlicher Vorteil“

„CUDA ist eine Ökosystem, kein unüberwindlicher Vorteil.“

Hotz schrieb im Blog unverschämt, dass CUDA (NVIDIAs GPU-Berechnungsportal) kein unüberwindlicher Vorteil sei, wie viele denken, sondern nur ein frühes Ökosystem.

Er veröffentlichte im Blog einen Screenshot eines Tweets. Bereits im Januar 2025 nannte er die Zustellung von Chips durch AMD einen „Kulturtest“: um zu sehen, ob AMD bereit ist, in Software zu investieren.

Im März gab er im Blog seine Schlussfolgerung bekannt: AMD habe den Test bestanden. Er sei überzeugt, dass AMD nicht auf die Software verzichten werde. Wenn dies der Fall sei, gäbe es keinen Grund, warum NVIDIA 16-mal teurer sein sollte als AMD.

Das bedeutet: Damals war der Marktwert von NVIDIA etwa 16-mal höher als der von AMD. Die Hardware beider Unternehmen unterscheidet sich jedoch nicht so stark. AMD hat sogar auf der RDNA4-Architektur Tensor Cores mit doppelter Durchsatzleistung entwickelt, während NVIDIA bei seinen eigenen Karten die Leistung um die Hälfte reduziert hat.

Woher kommt diese 16-fache Differenz? Hotzs Antwort ist die Software. Genauer gesagt, die Komplexität der Software und die daraus resultierende Ökosystem-Sperre.

Entwickler sind an CUDA gewöhnt, und die Toolketten drehen sich um CUDA. Deshalb wird AMDs Hardware auch bei guter Qualität von niemandem berührt. Das Problem für AMD ist nie die Chip-Hardware, sondern das Fehlen eines leistungsfähigen Software-Stacks.

Natürlich ist dies Hotzs Einschätzung und keine offizielle Stellungnahme von AMD.

Er tat nicht nur mit Worten, sondern kaufte auch 250.000 US-Dollar an AMD-Aktien und betonte öffentlich, dass er auf einen Zeitraum von fünf Jahren setzt. Er schrieb im Blog:

Entweder ist NVIDIA stark überbewertet, oder AMD ist stark unterbewertet.

Hotz schrieb diesen Satz im März 2025, als der Marktwert von NVIDIA etwa 16-mal höher war als der von AMD.

Im Mai 2026 betrug der Marktwert von NVIDIA etwa 5,2 Billionen US-Dollar, während der von AMD etwa 760 Milliarden US-Dollar betrug. Der Unterschied verringerte sich auf etwa das 7-fache. In diesem Jahr stieg der Aktienkurs von AMD aufgrund des steigenden Bedarfs an AI-Rechenzentren stark an, und die Steigerung war weit höher als die von NVIDIA.

Natürlich beweist dies nicht, dass Hotz Recht hatte. Die Neubewertung von AMD beruht hauptsächlich auf der GPU-Verkaufszahl und den Finanzberichten, aber die Richtung der Marktstimmung bestätigt Hotzs Einschätzung: Die 16-fache Differenz ist nicht so stabil, wie man denkt.

Von der iPhone-Entriegelung bis zur Herausforderung an die Rechenleistungsherrschaft

Warum hat ein Programmierer, der noch nie einen Chip entwickelt hat, das Mut, NVIDIA herauszufordern? Die Geschichte beginnt, als er 17 Jahre alt war.

Im Sommer 2007 veröffentlichte Apple das erste iPhone, das exklusiv mit AT&T verknüpft war. Der 17-jährige Hotz war ein T-Mobile-Kunde. Er wollte ein iPhone, aber wechselte nicht den Anbieter. Deshalb beschloss er, das Telefon zu öffnen.

Laut der Berichterstattung von The New Yorker öffnete er den Rückdeckel mit einem Schraubendreher, fand den Basisbandprozessor, der den Anbieter einschränkte, löötete einen Draht an und gab ihm Spannung, um seinen Code zu stören. Am nächsten Morgen kündigte er vor der Kamera an, dass dies das weltweit erste entriegelte iPhone sei.

Dieses Video erreichte fast zwei Millionen Aufrufe und machte ihn zur damaligen weltweit bekanntesten Hacker. Zwei Jahre später wandte er sich der Sony PS3 zu, hackte den vermeintlich unknackbaren Spielkonsolen und wurde anschließend von Sony verklagt. Schließlich kam es zu einer Einigung.

Im Jahr 2011 verklagte Sony George Hotz wegen des Hackens der PS3. Der Fall endete mit einer außergerichtlichen Einigung. Hotz akzeptierte ein permanentes Verbot und versprach, nicht mehr an Sony-Produkten zu arbeiten.

Hotz hat eine einfache Definition für Hacker: Hacker sind für Computer, was Installateure für Rohrleitungen sind.

Seine Methodik hat sich in den letzten zehn Jahren nicht geändert: In einem geschlossenen System sucht er das Bauteil, das mit ihm „sprechen“ kann, und versucht, es zu beherrschen.

Zweißigtausend Zeilen Code, ein neues AMD-Stack neu schreiben

Das iPhone und die PS3 haben Hotzs Fähigkeiten bewiesen.

Aber um CUDA zu sprengen, reicht eine Person nicht aus. Es braucht etwas echtes, und das ist tinygrad. Es ist ein Open-Source-Deep-Learning-Stack, der von Hotz geleitet wird.

Tatsächlich hat Hotzs Fixation auf das „Aufbrechen geschlossener Systeme“ sich bereits von der Konsumelektronik auf die Branche ausgeweitet. Im Jahr 2015 gründete er das Unternehmen comma.ai für autonome Fahrzeuge. Fast alleine im Garage hat er ein eigenes Fahrerassistenzsystem entwickelt, das auf Autobahnen funktionieren kann und mit Tesla konkurriert.

Heute ist comma.ai noch in Betrieb, und sein Open-Source-Fahrmodell openpilot basiert auf tinygrad.

Das offizielle GitHub beschreibt es als ein End-to-End-System: von der Tensor-Bibliothek, der automatischen Differenzierung, der IR (Zwischenrepräsentation) und dem Compiler bis hin zur Just-in-Time-Kompilierung, der Graphenausführung und den Optimierern und Datenladekomponenten für das Training. Alles ist darin enthalten.

Das offizielle GitHub-Repository von tinygrad. Ein Open-Source-Deep-Learning-Stack, der von Hotz geleitet wird und mehrere Backends wie CUDA, AMD, METAL usw. unterstützt. https://github.com/tinygrad/tinygrad

Das größte Merkmal dieses Systems ist die „Minimalität“.

tinygrad unterstützt bereits mehrere Backends wie CUDA, AMD, METAL, QCOM, WEBGPU usw. Andere Unternehmen müssen für die Anpassung an neue Hardware eine ganze Menge an Anweisungssätzen verstehen. tinygrad braucht nur, dass die neue Hardware etwa 25 grundlegende Operationen wie Addition, Subtraktion, Multiplikation und Division ausführen kann, um angeschlossen zu werden.

Aber Hotzs Hauptschlachtfeld ist die AMD-Linie.

Laut der Berichterstattung der technischen Medien Phoronix hatte tiny corp bereits im Januar 2025 eigene Treiber, Laufzeitumgebungen, Bibliotheken und Simulatoren entwickelt. Zu diesem Zeitpunkt hatte dieser AMD-Stack etwa 12.000 Zeilen Code und fehlte nur noch ein RDNA3-Assembler, um „vollständig eigenständig“ zu sein.

Im März kündigte Hotz im Blog an, dass tiny corp bereits einen vollständigen AMD-Stack von der Hardware bis zur PyTorch-Ebene entwickelt hatte, mit der einzigen Ausnahme des LLVM-Compiler-Frameworks.

Er fügte hinzu, dass Entwickler nicht einmal die Schreibweise von tinygrad lernen müssen. Sie können weiterhin mit dem vertrauten PyTorch-Code arbeiten, und die untere Ebene wird automatisch auf diesen AMD-Stack umgestellt.

12.000 Zeilen waren nur die Größe des AMD-Stacks im Januar 2025. Das gesamte tinygrad-Projekt wächst ständig. Bis zur Version v0.13.0 hatte es bereits 22.853 Zeilen. Hotz gab am Ende von 2025 an, dass es ohne Tests 18.935 Zeilen betrug.

Aber egal, ob es 12.000 oder 18.000 Zeilen sind, im Vergleich zur Branche ist dies erstaunlich.

Ein Software-Stack, der eine GPU ansteuern und das Training durchführen kann, hat bei den Konkurrenten oft mehrere Millionen Zeilen Code. Wie Hotz sagt, ist tinygrad 1.000-mal kleiner als diese.

Das bedeutet, dass die Komplexität von CUDA nicht auf physikalischen Gesetzen basiert. Es kann von einem kleinen Team mit einer minimalistischen Idee neu geschrieben werden, und das ist, woran Hotz fest glaubt.

Tinybox, einen Rechenleistungsmachine auf den Markt bringen

Wenn die Geschichte hier enden würde, wäre tinygrad nur ein Projekt auf GitHub. Aber Hotzs Ambition geht über den Code hinaus.

tiny corp verkauft offiziell einen Computer namens Tinybox. Auf der offiziellen Website werden die Modelle red, green, pro, exa aufgeführt, und die Konfiguration, der Preis und die Lieferinformationen sind alle öffentlich. Nach der Bestellung und Bezahlung wird der Computer innerhalb einer Woche geliefert.

Der Tinybox, der von tiny corp offiziell verkauft wird.

Der Tinybox hat im MLPerf Training 4.0-Benchmark mit Maschinen konkurriert, die etwa 10-mal teurer waren. Laut Hotzs Blog am Ende von 2025 brachte diese Computerverkäufeinnahme pro Jahr etwa 200.000 US-Dollar ein, und er nutzt dieses Geld, um die Forschung und Entwicklung von tiny corp zu finanzieren.

Im gleichen Blogbeitrag erwähnte Hotz auch, dass sie einen Vertrag mit AMD unterzeichneten, um die MLPerf-Training von Llama 405B mit dem MI350X durchzuführen. Der Verhandlungsprozess dieses Vertrags fand hauptsächlich auf Twitter öffentlich statt.

tiny corp hat seine Mission in einem Satz formuliert: commoditize the petaflop (die Petaflop-Leistung kommerzialisieren).

Petaflop ist eine Einheit für die Rechenleistung und steht für eine Billion Floating-Point-Operationen pro Sekunde (10 hoch 15). Es ist eine übliche Einheit zur Messung der Rechenleistung von Supercomputern und AI.

Was Hotz erreichen will, ist die Kommerzialisierung der Milliarden Floating-Point-Operationen pro Sekunde, damit alle Menschen Zugang zu AI haben können.

Wenn die Rechenleistung wie Konsumelektronik preisgegebene, bestellbar und innerhalb einer Woche lieferbar ist, könnte die Erzählung von der „Knappheit der Rechenleistung“ ins Wanken geraten.

Eine neue Route

Die Bedeutung von Hotzs Geschichte liegt nicht in der Sensation, dass ein Hacker NVIDIA alleine herausfordert und CUDA beendet. CUDA ist heute immer noch die Standardauswahl für die meisten Entwickler.

Das Wichtigste ist die Hypothese, auf die Hotz setzt: Die Komplexität des AI-Software-Stacks kann auf ein Minimum reduziert werden. Wenn dies bewiesen wird, muss möglicherweise der Teil des Marktwerts von NVIDIA, der durch CUDA gestützt wird, neu berechnet werden.

Und dieses Wettrennen ist längst nicht mehr nur Hotzs Sache. In seinem Blogbeitrag „Fünf Jahre tinygrad“ am Ende von 2025 schrieb er: Der erste Code wurde im Oktober 2020 eingecheckt. Nach fünf Jahren hat das Unternehmen jetzt sechs Mitarbeiter, und viele haben bereits mehrere Jahre daran gearbeitet.

Nach Hotzs Meinung ist das Problem bei AMD nicht die Hardware, sondern die Software. Dies ist die Einschätzung eines Unternehmers und keine offizielle Stellungnahme von AMD. Wie viel von NVIDIAs 16-fachem Marktwert-Prämium auf die Hardware und wie viel auf die Softwaremauer zurückzuführen ist, die von Menschen Zeile für Zeile abgebaut wird?

Hotz hat seinen Einsatz von 250.000 US-Dollar auf einen Zeitraum von fünf Jahren festgelegt. Er will dann zurückschauen.

Ob dieser Einsatz als der Wahnsinn eines Hackers oder als der Anfang einer neuen Route eingestuft wird, weiß noch niemand. Aber die Dicke der Rechenleistungsmauer wird bereits von jemandem mit Code neu gemessen

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Mit 17 das iPhone geknackt, 18 Jahre später Nvidia herausgefordert – AMD liefert freiwillig Chips

„CUDA ist eine Ökosystem, kein unüberwindlicher Vorteil“

Von der iPhone-Entriegelung bis zur Herausforderung an die Rechenleistungsherrschaft

Zweißigtausend Zeilen Code, ein neues AMD-Stack neu schreiben

Tinybox, einen Rechenleistungsmachine auf den Markt bringen

Eine neue Route