Sind Unternehmer, die KI nutzen, indirekt zu "Arbeitern" von Zhipu und Kimi geworden?

Rechenkapazität ist zum "Stein des Anstoßes" geworden.

Das chinesische große KI-Modell Zhipu Qingyan hat kürzlich auf dem Markt viel Aufsehen erregt. Wegen seiner hervorragenden Leistung beginnen einige Ausländer sogar, Chinesisch selbst zu lernen, um es problemlos nutzen zu können.

Für einige chinesische Benutzer jedoch kann das große KI-Modell von Zhipu, obwohl es leistungsstark ist, in manchen Zeiten die Geschwindigkeit verringern, die Token schnell verbrauchen und sogar versehentlich Konten sperren, was die Zufriedenheit der Benutzer unabsichtlich mindern kann.

Für Unternehmer war es eigentlich zu erwarten, dass das große KI-Modell ihnen wie Flügel an den Arme geben würde. Doch oft wird die Arbeitsgeschwindigkeit stattdessen verlangsamt.

Andererseits können auch andere große Modelle wie Kimi, DeepSeek und MiniMax Probleme wie unsichtbare Rechenleistung, Geschwindigkeitsverringerung und Leistungseinbußen haben. Je mehr die Benutzer einst von den großen KI-Modellen begeistert waren, desto mehr könnten sie am Ende enttäuscht sein.

Der Hauptgrund für die häufigen Enttäuschungen, die die Benutzer von verschiedenen großen KI-Modellen erleben, scheint die mangelnde Rechenleistung zu sein. Hinter den häufigen Preiserhöhungen der Token der verschiedenen Anbieter steckt die stetig steigende Nachfrage.

Die steigenden Rechenleistungskosten setzen die KI-bezogenen Unternehmer unter großen Druck. Deshalb müssen sie die kostbare Rechenleistung durch das Wechseln von Modellen, die Nutzung zu anderen Zeiten und das Löschen von Verlaufsdaten bewahren.

Unter diesen Umständen ist es für Unternehmer, die sich beweisen wollen, unklar, ob ihre Unternehmen und Geschäfte profitabel werden, nachdem sie mit KI-Tools herumexperimentiert haben. Aber die Anbieter, die die "Spaten" verkaufen, verdienen bestimmt reichlich.

01 Die dreifache Enttäuschung von Zhipu

Wenn das Preisniveau eines großen KI-Modells in China viel niedriger ist als im Ausland, würden Sie als Technikbegeisterter sich nicht glücklich fühlen?

Die Mitgliedschaftspreise von Zhipu Qingyan haben kürzlich viele chinesische Benutzer in die Lage gebracht, von der KI zu profitieren.

Denn die Mitgliedschaften des großen KI-Modells von Zhipu Qingyan werden derzeit in drei Stufen unterteilt: Lite, Pro und Max. Die neuesten Preise in China betragen 49 Yuan, 149 Yuan und 469 Yuan.

Andererseits kosten die gleichen drei Mitgliedschaftsangebote der Auslandsversion von Zhipu Qingyan 18 US-Dollar, 72 US-Dollar und 160 US-Dollar, was in Yuan umgerechnet 123 Yuan, 491 Yuan und 1091 Yuan entspricht. Das ist 74 Yuan, 342 Yuan und 622 Yuan mehr als in China.

Der große Preisunterschied zwischen der chinesischen und der ausländischen Version der gleichen Zhipu Qingyan-Mitgliedschaft hat einige Ausländer dazu veranlasst, umgekehrt "Shopping-Reisen" nach China zu machen.

Einige von ihnen lernen im Internet fleißig chinesische Schriftzeichen, um chinesische Captchas zu lösen. Andere lassen sich WeChat- und Alipay-Konten registrieren, um sich bei Zhipu anzumelden und zu bezahlen. Wieder andere nutzen VPNs, um als chinesische Benutzer vorzutäuschen.

Die Tatsache, dass das große KI-Modell von Zhipu Qingyan Ausländern einen höheren Preis verlangt, scheint darauf zurückzuführen zu sein, dass das Unternehmen absolut an der Qualität seines Produkts glaubt.

Aber einige chinesische Benutzer können beim Öffnen von Zhipu Qingyan während der Nutzung dreifache Enttäuschungen erleben.

Die erste Enttäuschung heißt "Geschwindigkeitsverringerung".

Seit die Mode des Haltungs von Hummern aufgekommen ist, hat Xiaoyu, ein Absolvent der Informatik, versucht, ein Rezept-Applikation mit Hilfe des großen KI-Modells zu entwickeln. Aber er hat nicht gedacht, dass er von den Schwierigkeiten der Plattform geschlagen werden würde, obwohl er einen Monat Mitgliedschaft bezahlt hat, um seinen Unternehmensgründungstraum zu verwirklichen.

Er hat sich bei Zhipu Qingyan für das Max-Mitgliedschaftspaket entschieden und den neuesten GLM5.1-Agenten genutzt, um Programmcode zu generieren.

Aber nach ein paar Tagen hat Xiaoyu festgestellt, dass die Arbeitsleistung seines Zhipu Qingyan-Hummers nachmittags sinkt. Der generierte Code ist unregelmäßig, was die Entwicklung stark behindert.

Hat der mit echtem Geld gekaufte Hummer die Angewohnheit, zu Mittag zu schlafen? Xiaoyu ist über dieses Faulheitsverhalten des Hummers sehr ratlos. Doch bevor er eine Lösung gefunden hat, kommt die zweite Enttäuschung, die "Token-Begrenzung", unabsichtlich.

Da die Effizienz der Codegenerierung nicht hoch war, hat Xiaoyu die App-Entwicklung eingestellt und stattdessen die Hummer damit beauftragt, sich mit Finanzen zu beschäftigen.

Er hat den GLM5.1-Agenten von Zhipu Qingyan angewiesen, täglich Morgen- und Abendberichte über den chinesischen Aktienmarkt zu erstellen. Die Hummer, die vormals nachmittags faul waren, sind diesmal überaus fleißig geworden und haben so viele Analysen geliefert, dass sie binnen drei Tagen die Token für eine Woche verbraucht haben.

Xiaoyu sagte dazu: "Obwohl die von Zhipu generierten Berichte tatsächlich von hoher Qualität sind, werden die Token auch ziemlich schnell verbraucht. Ich kann in den nächsten Tagen nicht mehr den Aktienmarkt verfolgen."

Helpless musste Xiaoyu seinen Traum, ein Aktienexperte zu werden, vorerst aufgeben und auf die Wiederherstellung der KI-Fähigkeiten von Zhipu warten. Doch so kam die dritte Enttäuschung: "Kontensperrung".

Da Xiaoyu in seinem Alltag häufig zwischen Computer, Handy und Tablet wechselt, um Zhipu Qingyan zu nutzen, und außerdem oft auf Reisen ist, ändert sich seine IP-Adresse häufig.

Deshalb hat Xiaoyu festgestellt, dass sein Konto gesperrt wurde, nachdem er Zhipu Qingyan eine Zeitlang genutzt hat. Der Grund für die Sperrung könnte sein, dass das System vermutet, dass das Konto von mehreren Personen geteilt wird.

01 Ist die Rechenleistung der Schlüssel?

Die Geschwindigkeitsverringerung, die Token-Begrenzung und die Kontensperrung von Zhipu Qingyan haben Xiaoyu, der noch nicht einmal die Hälfte seiner Unternehmensgründung erreicht hat, mehrmals enttäuscht.

Außer bei Zhipu Qingyan können Sie ähnliche Phänomene auch bei anderen großen KI-Modellen beobachten.

Awen hat vor kurzem 99 Yuan für die Moderato-Mitgliedschaft von Kimi bezahlt und den K2.6-Agenten genutzt, um ein MCP-Plugin zu schreiben.

Diese Stufe der Kimi-Mitgliedschaft hat zwei Bedingungen: eine Fünf-Stunden-Begrenzung und eine Wochen-Begrenzung. Wenn der Benutzer die Fünf-Stunden-Begrenzung erreicht, muss er fünf Stunden warten, bevor er weiter nutzen kann. Wenn er die Wochen-Begrenzung erreicht, muss er eine Woche warten.

Aber Awen hat in der Praxis festgestellt, dass Kimi schon nach einer halben Stunde die Fünf-Stunden-Begrenzung erreicht hat. Am dritten Tag hat er sogar die Wochen-Begrenzung erreicht, was die Projektabwicklung verzögert hat.

Awen sagte dazu: "Nachdem ich die Wochen-Begrenzung erreicht habe, habe ich auf der Kimi-Seite gesehen, dass ich nur 10,51 % meines Monatslimits verbraucht habe. Wenn man annimmt, dass ein Monat vier Wochen hat, sollte ich maximal 40 % verbrauchen. Wie wird dieses Limit eigentlich berechnet?"

Nach einer Kommunikation mit dem Kimi-Support hat Awen erfahren, dass das Mitgliedschaftslimit von Kimi PPT, Agent, Code usw. umfasst. Aber wie viel Limit eine einzelne Aufgabe tatsächlich verbraucht, ist für die Benutzer noch immer ein Rätsel.

Heutzutage sind verschiedene große KI-Modelle sehr beliebt. Aber wenn die Benutzer sich als Mitglieder anmelden, können sie leicht in eine Situation geraten, in der sie die Geschwindigkeit, das Limit usw. nicht verstehen. Warum ist das so?

Der grundlegende Grund scheint zu sein, dass die meisten großen KI-Modelle auf dem Markt mangelnde Rechenleistung haben. Deshalb müssen sie die Geschwindigkeit beschränken und Limits setzen, um die Benutzererfahrung zu gewährleisten.

Im März 2026 hat die tägliche Token-Nutzung in China 140 Billionen überschritten. Im Vergleich zum Jahresanfang 2024, als die tägliche Nutzung 100 Milliarden betrug, hat sich die Nutzung um das 1.000-fache erhöht. Im Vergleich zum Ende 2025, als die tägliche Nutzung 100 Billionen betrug, hat sie um etwa 40 % zugenommen.

Der sprunghafte Anstieg der Nachfrage nach Rechenleistung hat am direktesten zu einer Preiserhöhung der Rechenleistung geführt.

Am 11. März 2026 hat Tencent Cloud angekündigt, die Preise für das große Hunyuan-Modell 2.0 Instruct um 463 % zu erhöhen. Am 9. April hat es eine weitere Ankündigung gemacht, die Preise für KI-Rechenleistung, Container-Services, EMR und andere Produkte um 5 % zu erhöhen.

Am 18. März 2026 hat Alibaba Cloud angekündigt, die Preise für KI-Rechenleistung, Speicher und andere Produkte um 5 % bis 34 % zu erhöhen. Am 13. April hat es die kostenlose API-Nutzung für Data Works-Benutzer angepasst und mit der Volumenabrechnung begonnen. Am 15. April hat es eine weitere Ankündigung gemacht, die Preise für einige Dienste des Bailian-Modells um 2 % bis 5 % zu erhöhen.

Darüber hinaus hat Baidu Cloud am 18. März ebenfalls angekündigt, die Preise für KI-Rechenleistung und Speicherbezogene Dienstleistungen um 5 % bis 30 % zu erhöhen.

Zhipu hat sogar dreimal im Jahr die Preise angepasst. Nach zwei Preiserhöhungen am 12. Februar und am 16. März hat es am 8. April, als es den GLM5.1-Agenten veröffentlichte, angekündigt, die Preise für alle APIs um 10 % zu erhöhen.

Werden die häufigen Preiserhöhungen der großen KI-Modell-Anbieter einige Benutzer abschrecken? Eigentlich nicht.

Beispielsweise hat Zhang Peng, der CEO von Zhipu, auf der Jahreshauptversammlung 2025 mitgeteilt, dass die Preise für die Zhipu-API-Nutzung im ersten Quartal 2026 um 83 % gestiegen sind. Aber der Markt ist immer noch nachgefragt, und die Nutzungsmenge hat sogar um 400 % zugenommen.

Nach der Veröffentlichung des großen Alibaba Qwen3.6-Plus-Modells Anfang April hat die tägliche Nutzungsmenge 1,4 Billionen Token überschritten, was es zum ersten großen Modell der Welt macht, das täglich mehr als 1 Billion Token verarbeiten kann.

03 Kann der Durchschnittsbürger KI für sich arbeiten lassen?

Es ist ersichtlich, dass mit der zunehmenden Einbettung von KI in das Leben der Menschen die Rechenleistungskosten und die Nachfrage nach Rechenleistung in einer Spirale steigen.

Aber für die Benutzer der großen KI-Modelle, die weiterhin bereit sind, zu zahlen, bedeutet die doppelte Steigerung von Preis und Nachfrage großen Druck. Insbesondere für einige Benutzer, die versuchen, mit KI-Tools eine Ein-Personen-Unternehmung zu gründen, wird der Kostenfaktor immer wichtiger.

Berichte zeigen, dass ein Unternehmer, der im Bereich KI-SaaS tätig ist, 920.000 Yuan von seinen insgesamt 1,2 Millionen Yuan Umsatz für Token ausgeben musste. Nach Abzug aller anderen Kosten hat er nicht nur kein Profit gemacht, sondern sogar Verluste erlitten.

Daraus ist ersichtlich, dass die Preiserhöhungen der großen KI-Modelle diejenigen, die versuchen, mit KI zu gründen, vor Kostenproblemen stellen. Einige von ihnen haben drei Strategien entwickelt, um die Kosten zu senken und die Effizienz zu erhöhen:

Erstens, wenn einfache Aufgaben zu erledigen sind, sollten sie auf eine niedrigere Version des Modells umschalten.

Verschiedene Stufen der großen KI-Modelle haben unterschiedliche Preisregeln. Deshalb ordnen einige Unternehmer die Aufgaben nach Schwierigkeitsgrad ein und geben die schwierigsten Aufgaben dem leistungsstärksten KI-Modell, um die kostbare Rechenleistung zu sparen.

Beispielsweise nutzt Xiaoyu, den wir zuvor erwähnt haben, für die Analyse des chinesischen Aktienmarktes nicht mehr den GLM5.1-Agenten von Zhipu, sondern die kostenlose Version von Zhipu Qingyan.

Zweitens, die Nutzung der großen KI-Modelle sollte zu anderen Zeiten erfolgen.

Da die meisten großen KI-Modelle tagsüber mehr Rechenleistung verbrauchen, sinkt nicht nur die Benutzererfahrung, sondern auch der Anbieter hat großen Druck. Deshalb haben einige KI-Anbieter eine Rabattaktion nach Mitternacht eingeführt, um die Rechenlast zu verteilen.

Beispielsweise hat DeepSeek eine Rabattaktion für die Nutzung zu anderen Zeiten eingeführt. Zwischen halb eins nach Mitternacht und halb neun morgens wird der Preis des V3-Modells auf 50 % des regulären Preises und der Preis des R1-Modells auf 25 % des regulären Preises reduziert. Kostenbewusste Unternehmer werden dadurch zu Nachtschwärmern.

Drittens,

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。