StartseiteArtikel

Spending hundreds of millions to build an intelligent computing center, but 80% of the GPUs cannot be rented out | Focus Analysis

邱晓芬2024-12-20 10:15
The downstream AI applications have not yet emerged, which has caused difficulties for the domestic intelligent computing centers.

Willkommen bei "Intelligente Emergenz".

Autor: Qiu Xiaofen

Redakteur: Su Jianxun

In den letzten zwei Jahren gab es ein Wunder in der chinesischen KI-Industrie:

Viele börsennotierte Unternehmen ohne Hintergrund bei GPUs und Erfahrung in der Branche haben das Intelligenzcentrum als Mittel zur Entwicklung ihrer zweiten Wachstumskurve genutzt, um den Übergang in den KI-Bereich zu planen – zum Beispiel ein MSG-produzierendes Unternehmen (Lianhua Holdings), ein Farbstoffunternehmen (Jinji Co.), und sogar ein Spieler in der Glücksspielbranche (Hongbo Co.) usw.

Doch bis Ende 2024 kehrte sich die Lage um.

Am 29. November gab Lianhua Holdings bekannt, dass ihr Kaufvertrag für GPUs im Wert von fast 700 Millionen nur 12 Einheiten geliefert hat, während die restlichen 318 Einheiten aufgrund von „Unsicherheiten“ storniert wurden.

Nicht nur Lianhua Holdings, sondern auch viele andere börsennotierte Unternehmen haben kürzlich angekündigt, geplante Projekte für Intelligenzzentren zu stoppen oder zu stornieren, selbst auf das Risiko von Vertragsbrüchen.

Bildquelle: IC Photo

In den zwei Jahren, in denen die Erwartungen an KI hoch waren, war der Bau von Intelligenzzentren im Inland verrückt – bis zur ersten Hälfte dieses Jahres erreichte die inländische Rechenleistung 246 EFLOPS, mit einem über 65%igen Wachstum der intelligenten Rechenleistung im Jahresvergleich. Projekte zur Anwendung von Rechenleistung in Industrie, Bildung, Medizin, Energie und anderen Bereichen überstiegen 13.000.

Diese börsennotierten Unternehmen spielten unterschiedliche Rollen in der Welle des Baus von Intelligenzzentren, einige wählten einen einfachen Ansatz, indem sie dafür bezahlten, andere stellten Geräte (wie GPUs/Softwarelösungen/Algorithmusmodelle) bereit, während einige sich auf leichtere Weise einbrachten, um die Betriebsdienstleistungen für das Rechenzentrum zu unterstützen.

Was ist in den einheimischen Intelligenzzentren passiert, die vom Hype zur Abkühlung übergegangen sind?

Eine schwierige Rechnung

Mehrere Personen aus dem Intelligenzzentrum waren kürzlich in großen Inlandseinrichtungen unterwegs und erstaunt über den aktuellen Zustand der Branche. Sie sagten gegenüber "Intelligente Emergenz" unisono, dass der Markt für Rechenzentralen derzeit stillgelegt ist.

„Derzeit liegt die Auslastung der Rechenzentralen im Durchschnitt zwischen 20% und 30%, einige unternehmensbasierte“ Intelligenzzentren „haben sogar nur etwa 10% Auslastung“, sagte ein Brancheninsider.

Aus rein wirtschaftlicher Sicht ist dies kein gesunder Zustand. Ein Branchenexperte erklärte „Intelligente Emergenz“ die Kostenstruktur eines Intelligenzzentrums:

Anhand eines kleinen Intelligenzzentrums mit Nvidia H100 und einem Tausendkarten-Cluster liegen die Anfangsinvestitionen bei:

Ca. 300 Millionen für den Kauf von Rechengeräten;

Netzkosten von ca. 25 Millionen;

Kosten für Speicher- und Sicherheitsgeräte von ca. 10 Millionen;

Kosten für Plattformsoftware und Flüssigkeitskühlung von ca. 10 Millionen;

Gesamtkosten von rund 350 Millionen.

Ein Intelligenzzentrum erfordert nicht nur anfangs hohe Investitionen, sondern auch laufend Kosten für Strom, Wartung und Personal, die gemessene jährliche Ausgaben von etwa 50 Millionen erfordern.

Das heißt, zum Bau eines kleinen Intelligenzzentrums mit einem Tausendkarten-Cluster in China müssen Sie anfangs 350 Millionen investieren und jährlich 50 Millionen für den Betrieb aufwenden.

Bild von IC Photo

Nachdem diese Intelligenzzentren gebaut wurden, für wen werden die Rechenleistungen bereitgestellt? Wie kann man Geld verdienen?

Derzeit lösen inländische Anbieter das Problem der KI-Rechenleistung durch den Bau eigener Zentren für große Internetunternehmen, gut finanzierte KI-Unternehmen und führende Unternehmen in Nischen, hauptsächlich aus Sicherheitsgründen. Andere, die KI-Rechenleistung benötigen, mieten im Allgemeinen Rechenleistung von Drittzentren.

Zusätzlich bieten diese Zentren bei Bedarf auch ergänzende Rechenleistungen für die drei erstgenannten Spieler.

Die Begeisterung für den Bau von Intelligenzzentren in den letzten zwei Jahren liegt teilweise darin, dass trotz hoher Kosten die Regierungssubventionen helfen. In den letzten zwei Jahren wurden verschiedene politische Maßnahmen zur Unterstützung des Baus von Intelligenzzentren umgesetzt, wie Finanzielle Zuschüsse, Steuervergünstigungen und Landvergabe.

Beispielsweise sieht eine lokale Politik vor, dass bei einer Gesamtinvestition von über 100 Millionen ein Zuschuss in Höhe von 5%-15% des tatsächlichen Investitionsbetrags gewährt wird. In einigen Provinzen mit reichlich Wind/Solarressourcen werden Unternehmen, die Intelligenzzentren bauen, mit zusätzlichen Photovoltaikquoten belohnt.

Ein Branchenexperte fasste zusammen, dass die Unterstützungsmaßnahmen für den Bau von Intelligenzzentren je nach Region „lokal ausgehandelt” werden müssen.

Allerdings befinden sich Subventionen außerhalb des kommerziellen Bereichs, weshalb nach dem Bau der Intelligenzzentren die Rückgewinnung des investierten Geldes hauptsächlich davon abhängt, wieviele Karten (Rechenkapazität) vermietet werden können (also wie hoch die Nutzung der Zentren ist) und vom Mietpreis.

Derzeit sind diese beiden Werte nicht optimistisch. „Intelligente Emergenz“ berichtete kürzlich, dass der Mietpreis für einen Nvidia H100 Server (8 Karten) von 120.000-180.000 Yuan/Monat Anfang des Jahres auf jetzt etwa 75.000 Yuan/Monat gesunken ist, ein Rückgang von 50%.

Rechnet man mit einer aktuellen Auslastung von 20%, würde ein Intelligenzzentrum mit einem Tausendkarten-Cluster von Nvidia H100 jährlich nur etwa 23 Millionen Yuan einnehmen (nämlich 7,5 Millionen Yuan/Monat ✖️12 Monate ✖️128 Server ✖️20%), was bedeutet, dass ein Rechenzentrum mit Mühe kostendeckend arbeitet und kaum die Hälfte der Betriebskosten decken kann, geschweige denn die Investition zurückgewinnen.

Der Bau eines Intelligenzzentrums ist derzeit eine schwierige Rechnung.

Rechenzentren warten auf Erholung

Mehrere Branchenkenner sagten gegenüber „Intelligente Emergenz“, dass die derzeitige schwere Unterauslastung von Intelligenzzentren hauptsächlich darauf zurückzuführen ist, dass sich nach Inbetriebnahme der Rechenzentren herausgestellt hat, dass die KI-Nachfrage nicht wie erwartet schnell gewachsen ist und die Rechenkapazität schwer abzusetzen ist.

Zuvor erwartete man einen jährlichen Anstieg des Rechenvermietungsmarktes um mindestens 10%, aber bisher sind es nur etwa 5%.

Derzeit zielen die Zentren daher darauf ab, die Betriebskosten zu decken. „Die Rentabilität ist höchster Standard, ein langfristiges Ideal“, sagte Yue Yuanhang, CEO des Intelligenzzentrums-Technologieunternehmens „Zhibole Technology“, gegenüber „Intelligente Emergenz“. Berechnungen zufolge benötigt selbst ein Intelligenzzentrum mit 60%iger Auslastung der Geräte mehr als 7 Jahre, um die Investition wieder hereinzuholen.

Bild von IC Photo

Der Mangel an erwarteter AI-Nachfrage ist nicht die einzige Ursache der Unterauslastung. Es gibt auch eine inhärente Verzögerung bei Intelligenzzentren.

Beispielsweise basiert das Design und die Forschung einiger Intelligenzzentren auf den aktuellen Marktanforderungen und der Hardware-Situation. Doch bis zur tatsächlichen Umsetzung vergehen in der Regel Monate oder sogar Jahre – und bis dahin kann die Hardware bereits mehrere Zyklen weiterentwickelt sein, und auch die Marktanforderungen könnten sich dramatisch geändert haben.

Um die täglichen Betriebskosten zu senken, verfolgen derzeit einige Intelligenzzentren verschiedene Maßnahmen.

Einige Zentren schalten direkt nicht vermietete Geräte ab, „wenn man in den Serverraum geht, sind die Lampen ausgeschaltet und es gibt keine summenden Lüftergeräusche mehr“, sagte Yue Yuanhang. Andere Intelligenzzentren entscheiden sich alte Intel- und Nvidia-Geräte zu verkaufen, um den finanziellen Druck zu mindern.

Unternehmen mit noch nicht abgeschlossenen Bauprojekten haben den Bau laufender Projekte pausiert oder ganz geplante zweite Phasen storniert. Ein Brancheninsider berichtete gegenüber „Intelligente Emergenz“, dass nach einer mittelfristigen Unterbrechung von Intelligenzzentrum-Projekten, die vorher teuer gekauften Nvidia-Karten „ungenutzt herumliegen“.

Offensichtlich wandelt sich der Rechenleistungsmarkt stillschweigend zu einem Käufermarkt. In den letzten zwei Jahren war die Branche in einer Lage, in der „eine GPU kaum zu finden war“ und es „an Rechenleistung mangelte“, nun ist es umgekehrt.

Derzeit bevorzugen die meisten KI-Unternehmen den sparsamen Einsatz von Rechenkapazitäten, um unnötige Kosten zu vermeiden und wählen im Allgemeinen Ressourcen entsprechend ihren Anforderungen und ihrem Budget aus, etwa durch Verlangen nach niedrigeren Preisen und höherem Service.

Einige Intelligenzzentren senken Preise oder verbessern Dienstleistungen (zum Beispiel die Erhöhung der Betriebskapazität, um Modelle für nachgelagerte Anwender zu optimieren) und versuchen so, Marktanteile zu gewinnen.

Rechenleistung hat eine bedeutende Position in der KI-Industrie inne, vergleichbar mit Gas, Wasser, Strom, insbesondere angesichts der derzeit unklaren internationalen Lage. Obwohl sich Intelligenzzentren derzeit als schwierige Investition darstellen, ist es schwierig, grob zu behaupten, dass es nicht mehr gebaut werden sollte.

Langfristig stellte ein Branchenkenner eine kritische Frage: „Vielleicht ist der Mangel an KI-Rechenleistungsverbrauch nur ein kurzfristiges Phänomen. Soll die jetzige gelegentliche Unauslastung der Rechenzentren akzeptiert werden? Oder ist es besser in Eile Intelligenzzentren zu bauen, wenn die KI-Anwendung explodiert?

Weiterführende Lektüre:

Warum kostet eine Nvidia H100 nicht mehr, nachdem die Mieten in 10 Monaten um 50% gesunken sind? | Fokusanalyse

Ende