DeepSeek's letztendliches Opfer ist nicht Nvidia | Krezukunft · Großereignis
Autor|Song Wanxin
Redakteur|Zheng Huaizhou
Während des Frühlingsfestes erfasste der DeepSeek-Boom die Welt. An Chinas A-Aktienmarkt legte das DeepSeek-Konzept stark zu, und mehrere Aktien, darunter RDaily Interaction, Qingyun Technology, Anheng Information und Tieniu Digital Technology, legten an den ersten beiden Handelstagen nach dem Frühlingsfest kontinuierlich zu.
Vor dem Erscheinen von DeepSeek war die "Rechenkraft-Theorie" die Hauptlogik innerhalb der großen Modellkreise. DeepSeek hat diese mit seiner Kraft durchbrochen und bewiesen, dass die Modellfähigkeiten und die Trainingskosten nicht unbedingt proportional sind. Dies ist der Hauptgrund, warum die KI-Branche Aufmerksamkeit gewann.
Daten zeigen, dass die Trainingskosten von DeepSeek-V3 nur 1 % der Llama-3-Kosten betragen und die Verarbeitungskosten von DeepSeek-R1 nur 3 % von OpenAI o1 ausmachen.
Da die Logik der Rechenkraft erschüttert wurde, wurde DeepSeek an der Wall Street zu einem "schwarzen Schwan", und führende Unternehmen der Rechenkraft wie Nvidia sowie Technologieaktien an der US-Börse erlebten einen dramatischen Rückgang.
Am 27. Januar erreichte DeepSeek sowohl im chinesischen als auch im US-amerikanischen App Store von Apple Platz eins der kostenlosen Charts. In der darauffolgenden Nacht erlebten US-Technologieaktien einen kollektiven Einbruch. Der Philadelphia Semiconductor Index (SOX) fiel um 9,2 % und verzeichnete den größten Rückgang seit März 2020, wobei der Aktienkurs von Nvidia um fast 17 % sank und seine Marktkapitalisierung um fast 600 Milliarden Dollar schrumpfte, was der größte Wertverlust in der Geschichte der US-Börse darstellt.
01 Open Source holt Closed Source ein
Die Kernkompetenzen von DeepSeek, neben niedrigen Kosten und Verarbeitungskapazität, sind vor allem die Fähigkeiten von Open-Source-Modellen, die zu den neuesten Closed-Source-Modellen aufschließen.
Laut DeepSeek erzielte DeepSeek-R1 in Tests wie Codeforces, GPQA Diamond, MATH-500, MMLU und SWE-bench Verified Ergebnisse, die dem o1-Original nahe kamen oder in einigen Tests sogar übertrafen. o1 repräsentiert das derzeit höchste Niveau an geschlossenen Modellen.
Der Chief AI Scientist von Meta, Yann Lecun, erklärte zuvor, dass die Einführung von DeepSeek-R1 nicht bedeutet, dass chinesische KI-Technologie die der USA übertroffen hat, sondern dass "die Kraft des Open Source-Modells das Closed-Source-Modell überwindet".
Auf technischer Ebene verzichtet das R1-Modell auf den HF (Human Feedback)-Teil von RLHF und behält nur den RL (Reinforcement Learning)-Teil, wobei das Modell die Fähigkeit zur Selbstreflexion entwickelt.
Der leitende Forschungsscientist von Nvidia, Jim Fan, wies darauf hin, dass DeepSeek-R1 möglicherweise das erste Open-Source-Softwareprojekt (OSS) ist, das den Einsatz und das Potenzial von RL (Reinforcement Learning) demonstriert und damit nachhaltiges Wachstum erzielt.
In der Branche herrscht Übereinstimmung darüber, dass bei der Konkurrenz zwischen Open Source und Closed Source die Leistungsfähigkeit der Closed Source-Modelle immer überlegen sein muss, sonst haben Nutzer keinen Grund, für einen schlechteren Dienst zu zahlen.
Wenn also Open-Source-Modelle die Closed-Source-Modelle einholen oder sogar übertreffen, wird der Open-Source-Ansatz die Closed-Source-Modelle beeinflussen. Dies ist einer der Hauptgründe dafür, dass DeepSeek Panik bei US-Technologieaktien ausgelöst hat.
Unter dem Druck des offenen und kostenlosen DeepSeek hat OpenAI ebenfalls entsprechende Anpassungen vorgenommen.
Am 1. Februar veröffentlichte OpenAI das o3-mini, das erste Inferenzmodell von OpenAI, das für kostenlose Nutzer zugänglich ist. Der CEO von OpenAI, Sam Altman, kommentierte zudem: "Ich persönlich denke, dass wir uns hier auf der falschen Seite der Geschichte befinden und eine andere Open-Source-Strategie finden müssen."
Bereits am 31. Januar gaben die drei Tech-Giganten Nvidia, Amazon und Microsoft bekannt, dass sie DeepSeek-R1 integrieren.
Die gemeinsame Anerkennung von DeepSeek durch die internationale KI-Gemeinschaft und seine weitreichende Verbreitung hat an Chinas A-Aktienmarkt weiterhin zur Beschleunigung der DeepSeek-Konzeptaktien beigetragen.
Aus Industriesicht bekundeten mehrere Finanzinstitute, dass DeepSeek die schnelle Entwicklung der gesamten heimischen KI-Industrie ankurbeln dürfte. Zudem könnte seine Open-Source- und kostengünstige Natur AI-Anwendungsfirmen stärken und die Einführung von AI-Hardware beschleunigen.
Aus der Perspektive der heimischen Substitution ist DeepSeeks Innovation vor dem Hintergrund der US-Chip-Beschränkungen entstanden und bestätigt, dass der geschlossene Kreislauf von der Chip-Produktion bis zu Modellen und Anwendungen im heimischen KI-Sektor umsetzbar ist, was das Vertrauen in die nationale AI-Industriekette deutlich stärkt.
02 Kapitalinvestitionen steigen statt zu sinken
Obwohl die Einführung von DeepSeek den US-Aktienmarkt dazu brachte, über das Erreichen des Spitzenbedarfs an Rechenkraft und die Verlangsamung der AI-Kapitalausgaben nachzudenken, gibt es keine Anzeichen für eine Reduzierung der Kapitalinvestitionen bei großen US-Unternehmen, so die neuesten Prognosen.
Auf der Telefonkonferenz zu den Quartalsergebnissen vom 4. Februar teilte Google mit, dass ihre Kapitalinvestitionen in diesem Jahr 75 Milliarden Dollar erreichen werden, was 32 % über den Markterwartungen liegt. Meta gab hingegen an, dass ihre jährlichen Kapitalkosten zwischen 60 und 65 Milliarden Dollar liegen werden, was ebenfalls weit über der Prognose der Analysten von 51,3 Milliarden Dollar liegt.
Microsoft gab Anfang des Jahres bekannt, dass ihre Kapitalinvestitionen in diesem Jahr 80 Milliarden Dollar erreichen würden, während für das Geschäftsjahr 2024 ein Wert von 55,7 Milliarden Dollar angegeben wird. Aufgrund von Divergenzen mit OpenAI bei der Entwicklung von KI reduziert Microsoft jedoch seine zusätzlichen Investitionen in OpenAI.
Aktuell ist bekannt, dass das Projekt 'Stargate', eine Kooperation zwischen OpenAI und Oracle aus dem November letzten Jahres, das Ziel hat, die Entwicklung der KI-Infrastruktur zu fördern. Die Investitionen von Microsoft waren jedoch geringer als erwartet. Laut Informationen von Insidern könnte diese Anpassung auf das abnehmende Investitionsinteresse von Microsoft an der KI-Infrastruktur zurückzuführen sein, während gleichzeitig versucht wird, den Druck der AI-Ausgaben zu verringern.
Außerdem änderte Microsoft am 20. Januar dieses Jahres die Kooperationsvereinbarung mit OpenAI und erlaubte die Nutzung von Cloud-Diensten von Wettbewerbern, wodurch die ursprüngliche Exklusivität abgeschwächt wurde.
Analysten rechnen damit, dass der Anteil der Kapitalinvestitionen an den Einnahmen von Microsoft, Meta, Amazon und Google bis 2025 auf 22 % steigen könnte, verglichen mit 17,2 % im Jahr 2024.
Langfristig unterstützt der Ansatz von DeepSeek tatsächlich das Wachstum der GPU-Nachfrage weiter.
Microsoft-CEO Satya Nadella zitierte auf einer Social-Media-Plattform das "Jevons-Paradoxon" und bemerkte, dass eine Verbesserung der Ressourcennutzungseffizienz möglicherweise zu einem Anstieg des Gesamtverbrauchs führen könnte.
Die anhaltende Senkung der Berechnungskosten durch DeepSeek wird die Hürde für KI-Anwendungen senken, und die verbreitete Anwendung wird das Wachstum der Rechenkraftnachfrage ankurbeln.
Ein Investitionsbericht des Finanzanalysten Cantor Fitzgerald stellte fest: "Wir glauben nicht, dass die Bedenken hinsichtlich des Erreichens eines Spitzenwerts bei den GPU-Ausgaben begründet sind. DeepSeek ist sehr vorteilhaft für Rechenleistungen und Nvidia."
Trotz der Auswirkungen auf Nvidia sehen mehrere Analystenteams die Aktie weiterhin positiv, und das Atif Malik-Team von Citigroup hält an ihrem "Kaufen"-Rating für Nvidia fest.
Daher könnte der endgültige Verlierer der DeepSeek-Turbulenzen insgesamt nicht Nvidia sein, sondern eher Mitstreiter wie OpenAI, die mit großen Modellen arbeiten.
Folgen Sie uns für weitere Neuigkeiten