200 US-Dollar pro Monat einnehmen, aber möglicherweise 14.000 US-Dollar draufzahlen – Das „Verlustgeschäft“ hinter ChatGPT und Claude wird aufgedeckt
„200 US-Dollar pro Monat, unlimitiert nutzbar.“
In den letzten zwei Jahren war dies eines der erfolgreichsten Geschäftsmodelle in der KI-Branche. Von ChatGPT bis Claude haben die Anbieter von Large Language Modellen (LLMs) mit relativ festen und vorhersehbaren Abonnementpreisen schnell eine große Anzahl von Benutzern weltweit gewonnen und das ursprünglich komplexe API-Abrechnungsmodell in ein für die Masse akzeptables Konsumprodukt gewandelt.
Eine kürzlich veröffentlichte Analyse von SemiAnalysis hat jedoch die weniger rosige Seite dieses Modells aufgedeckt: Wenn die Benutzer die Fähigkeiten der Premium-Abonnements wirklich bis an die Grenzen nutzen, könnten OpenAI und Anthropic schwerwiegende Verluste erleiden.
Nach den API-Preisen könnte ein ChatGPT Pro-Benutzer, der monatlich 200 US-Dollar für ein Abonnement zahlt, theoretisch Modellressourcen im Wert von bis zu 14.000 US-Dollar verbrauchen. Bei dem gleich preisigen Claude Max-Abo von Anthropic liegt die theoretische Kostengrenze bei etwa 8.000 US-Dollar.
Monatsgebühr von 200 US-Dollar, bei voller Nutzung könnte es 14.000 US-Dollar wert sein
Die hierauf aufmerksam machenden Daten stammen aus einem Test von SemiAnalysis an den Abonnement-Systemen von OpenAI und Anthropic.
Die Forscher haben mehrere Bezahlpläne beider Anbieter einer Grenzbelastungstestung unterzogen. Sie haben reale Nutzungsszenarien von stark frequentierenden Benutzern simuliert, darunter langfristige Programmieraufgaben, komplexe Agent-Arbeitsabläufe und mehrstufige Inferenzaufgaben. Dabei wurden die Modelle so lange aufgerufen, bis die von der Plattform festgelegten Nutzungsgrenzen erreicht wurden.
Anschließend haben die Forscher diese Aufrufe anhand der offiziellen API-Preise umgerechnet. Das Ergebnis war überraschend:
● Das ChatGPT Pro 20x-Abo von OpenAI kostet monatlich 200 US-Dollar. Wenn ein Benutzer das Kontingent vollständig ausnutzt, könnten die Kosten laut API-Preisen bis auf etwa 14.000 US-Dollar steigen.
● Ähnlich verhält es sich bei Anthropic: Das ebenfalls 200 US-Dollar teure Claude Max 20x-Abo hat bei theoretisch maximaler Nutzung einen Token-Kostenbetrag von etwa 8.000 US-Dollar.
In extremen Fällen beträgt die Abonnementgebühr der Benutzer sogar weniger als zwei Prozent der tatsächlichen Kosten für die Plattform.
Natürlich nutzen die meisten Benutzer in der Realität nicht das gesamte Kontingent aus. Diese Zahlen repräsentieren daher eher die theoretische Obergrenze. Sie zeigen aber auch, dass für KI-Unternehmen nicht der Abonnementpreis, sondern die tatsächliche Nutzungsrate der Benutzer die Rentabilität bestimmt.
OpenAI hat es schwieriger als Anthropic
Deshalb hat SemiAnalysis die Break-Even-Punkte der verschiedenen Abonnements weiter untersucht.
Die Ergebnisse zeigen, dass das Geschäftsmodell von Anthropic derzeit etwas gesünder ist: Bei den Claude Pro- und Claude Max 5x-Abonnements kann sich das Unternehmen bei einer Nutzungsrate von etwa 20 % ungefähr amortisieren.
Im Vergleich dazu sieht es bei OpenAI weniger rosig aus: Wenn die Nutzungsrate der ChatGPT Plus- und ChatGPT Pro 5x-Benutzer 11,4 % überschreitet, beginnt OpenAI Verluste zu machen. Bei den höherwertigen Abonnements ist die Situation noch schlimmer.
Die Forscher haben festgestellt, dass die Bruttomarge des Premium-Abonnements von Anthropic bei einer Nutzungsrate von etwa 10 % auf null sinkt. Bei OpenAI reicht es bereits bei einer Nutzungsrate von etwa 5,7 %, um in den Bereich negativer Margen zu gelangen. Das bedeutet, dass einige stark frequentierende Benutzer nicht einmal 24 Stunden am Tag das Modell aufrufen müssen. Wenn sie es einfach über einen längeren Zeitraum mit hoher Frequenz nutzen, verliert die Plattform umso mehr, je mehr sie ihnen dient.
OpenAI-CEO Sam Altman hat auch öffentlich zugeben müssen, dass das Unternehmen mit diesem Konflikt konfrontiert ist. Mit dem stetig steigenden Token-Verbrauch wird der Kostendruck zu einem ernsthaften Problem. OpenAI sucht derzeit nach Möglichkeiten, um den Benutzern mehr Wert bei geringeren Kosten zu bieten.
Die Wurzel aller Probleme liegt in der Veränderung der KI-Nutzungsmuster.
Früher war der typische Anwendungsfall von ChatGPT die einfache Fragen-Antwort-Situation: Der Benutzer stellte eine Frage, und das Modell gab eine Antwort. In diesem Modell war der Token-Verbrauch relativ begrenzt. Heute verwenden immer mehr Benutzer KI-Programmierassistenten, mehrstufige Agenten, Systeme zur Analyse langer Texte und automatisierte Arbeitsabläufe. Diese Aufgaben erfordern in der Regel, dass das Modell wiederholt nachdenkt, plant, Werkzeuge aufruft und eine Vielzahl von Zwischenergebnissen erzeugt.
SemiAnalysis hat festgestellt, dass in einigen Agenten-Szenarien der Token-Verbrauch sogar das 1.000-fache des normalen Prompts betragen kann.
Microsoft, Meta und Amazon kontrollieren die internen KI-Kosten
Mit der zunehmenden Nutzung von KI-Tools durch die Mitarbeiter haben sich die Unternehmensrechnungen schnell erhöht. Microsoft, Meta und Amazon haben zwar zuvor die breite Nutzung von KI durch ihre Mitarbeiter gefördert, haben aber nach dem stetigen Anstieg der Kosten ihre Richtlinien verschärft.
Ein besonders bekanntes Beispiel hat die Aufmerksamkeit auf sich gezogen: Ein Unternehmen hat in nur einem Monat 500 Millionen US-Dollar für die Anthropic-Dienste ausgegeben, weil es die Mitarbeiter nicht in ihrer Nutzung von Claude einschränkte.
Angesichts der hohen Kosten setzen viele Unternehmen auf eine praktischere Strategie: Sie wechseln dynamisch zwischen Modellen, je nach Schwierigkeit der Aufgabe. Wie die Wall Street Journal berichtet hat, können Unternehmen auf diese Weise bis zu 95 % ihrer KI-Kosten sparen.
Einfach ausgedrückt:
● Komplexe Inferenzaufgaben werden an Spitzenmodelle wie GPT-5 und Claude Opus übertragen;
● Alltägliche Zusammenfassungen, Klassifizierungen und Informationsextraktionen werden an kostengünstigere Modelle delegiert.
Wie Vishal Misra, stellvertretender Dekan der Fakultät für Ingenieurwissenschaften an der Columbia University, sagt: „Nicht jede Aufgabe erfordert ein Modell, das Quantenphysik versteht.“ Und nach seiner Meinung verbessern sich die Fähigkeiten der Open-Source-Modelle schnell, und die Möglichkeit, dass KI-Anbieter hohe Prämien für Spitzenmodelle verlangen können, wird immer kleiner.
Teilweise haben bereits einige Start-ups diesen Wandel vollzogen.
Flo Crivello, Gründer und CEO der KI-Assistenten-Firma Lindy, hat kürzlich angekündigt, dass das Unternehmen 100 % des Datenverkehrs auf DeepSeek V4 umgeleitet hat und nicht mehr das Anthropic-Modell nutzt. Der Grund ist einfach: Nach zahlreichen Tests hat das Team festgestellt, dass DeepSeek V4 in den meisten Szenarien annähernd die gleichen Ergebnisse wie Claude Sonnet erzielt, aber viel kostengünstiger ist. Crivello hat angegeben, dass diese Umstellung das Unternehmen mehrere Millionen US-Dollar gespart hat.
Tatsächlich wachsen nicht nur DeepSeek, sondern auch andere Open-Source-Modelle wie Llama, Qwen und Mistral schnell. Wenn die Fähigkeitsunterschiede zwischen den Modellen immer kleiner werden, wird der Kostenvorteil oft zum entscheidenden Faktor.
Werden die KI-Kosten in Zukunft sinken?
Das Gute ist, dass die Branche allgemein glaubt, dass die KI-Inferenzkosten langfristig sinken werden.
Mit der zunehmenden Verfügbarkeit von GPUs, der Expansion von Rechenzentren, der Optimierung der Modellarchitektur und der Verbesserung der Hardwareeffizienz ist es möglich, dass die Betriebskosten von Mittelklasse-Modellen weiter sinken. SemiAnalysis prognostiziert, dass ein Modell mit der Leistungsfähigkeit von Claude Opus 4.8 in Zukunft theoretisch für nur etwa 20 US-Dollar pro Monat rentabel betrieben werden könnte.
Dies bedeutet jedoch nicht, dass alle Modelle günstiger werden. Bei den fortschrittlichsten Spitzenmodellen könnte es sogar umgekehrt sein. Diese Modelle haben die stärkste Inferenzfähigkeit, den längsten Kontext und die komplexesten Agenten-Fähigkeiten, und ihre Trainings- und Inferenzkosten bleiben sehr hoch.
Deshalb glauben immer mehr Analysten, dass die Fähigkeiten der Spitzenmodelle in Zukunft möglicherweise nicht mehr in einheitliche Abonnements verpackt werden, sondern eher über die API nach Verbrauch abgerechnet werden. Kurz gesagt: Die Standardfunktionen werden weiterhin monatlich abonniert, die Premiumfunktionen werden dagegen nach Bedarf bezahlt.
Verabredung: Abonniert Ihr KI-Dienste in Eurem täglichen Gebrauch, und welches KI-System nutzt Ihr am häufigsten?
Original-Artikel: https://www.techspot.com/news/112759-openai-anthropic-cant-afford-have-everyone-use-ai.html
Dieser Artikel stammt aus dem WeChat-Account „CSDN“. Autorin: Zheng Liyuan. Veröffentlicht von 36Kr mit Genehmigung.