Schnelle Bereitstellung von 70 Milliarden Finanzierung - DeepSeek schränkt Anzahl von Wiederholungen und Änderungen ein

Jedes Mal, wenn man bei der kostenlosen KI "von vorne beginnt", steckt dahinter eine Rechnung der Rechenleistung.

Am Nachmittag des 29. Mai stellten viele Internetnutzer fest, dass DeepSeek nun Beschränkungen bei der Neugenerierung und Änderung von Inhalten hat.

Nach mehreren aufeinanderfolgenden Änderungen oder Neugenerierungen wird auf der Seite angezeigt, dass die Obergrenze erreicht ist. Einige Nutzer berichteten, dass in normalen Gesprächen die Obergrenze nach 3 bis 6 Neugenerierungen erreicht wird; im Expertenmodus gibt es möglicherweise nur 3 Versuche. Die Obergrenze für die Anzahl der Eingabeänderungen beträgt in der Regel 6 Mal.

Bis jetzt hat DeepSeek keine offizielle Ankündigung herausgegeben und auch keine feste Kontingenttabelle veröffentlicht. Dennoch hat dieses Thema heftige Diskussionen in den Communities ausgelöst. Schließlich hat DeepSeek eine große Anzahl treuer Benutzer, mich eingeschlossen. Normalerweise können wir es verstehen, wenn es gelegentlich zu Serverauslastungen oder Seitenabstürzen kommt. Aber es ist nicht akzeptabel, plötzlich und ohne Vorankündigung Beschränkungen einzuführen. Das macht uns sehr nervös.

Die API scheint von diesen Änderungen nicht betroffen zu sein. Wahrscheinlich handelt es sich um Probleme mit der Infrastruktur, eine bekannte Situation.

01 Temporäre Trafficbeschränkung bei knapper Rechenleistung?

Bezüglich dieser Beschränkungen sagte der sogenannte "halb-offizielle Account" Baiqiang auf Xiaohongshu: Keine Panik, dies ist nur vorübergehend.

Laut seiner Aussage ist die plötzliche Beschränkung von "Nachricht ändern" und "Neugenerierung" keine sogenannte "negative Optimierung" von DeepSeek, sondern lediglich ein vorübergehender Schritt, der aufgrund des hohen Drucks auf die Rechenleistung ergriffen wurde.

In letzter Zeit hat DeepSeek einen starken Anstieg der Nutzerzahl verzeichnet, insbesondere seit dem Nachmittag des 29. Mai ist der Anfragedruck auf der App-Seite deutlich gestiegen. Um die Grundfunktion des Textgesprächs aufrechtzuerhalten, musste das Team vorerst die häufigen Aktionen wie "Nachricht ändern" und "Neugenerierung" beschränken.

Obwohl es für die Nutzer einfach ist, auf die Schaltfläche "Neugenerierung" zu klicken oder die ursprüngliche Frage zu ändern, handelt es sich für den Server nicht um eine einfache Aktualisierung, sondern um eine neue Inferenzanfrage. Bei jedem Klick auf die Neugenerierungsschaltfläche muss das Modell den Kontext neu verarbeiten und eine neue Antwort generieren. Das Gleiche gilt für die Änderung der Nachricht. Sobald sich die ursprüngliche Frage ändert, muss das Modell auf der Grundlage der neuen Eingabe erneut antworten.

Wenn also viele Nutzer gleichzeitig wiederholt klicken und die "Neugenerierung" wie einen unbegrenzten Kartenziehbutton behandeln, wird dieser Teil der Anfragen zu einem erheblichen Serverlastfaktor.

Dieses Ereignis kann in Verbindung mit einigen jüngsten Änderungen bei DeepSeek betrachtet werden. Beispielsweise wurde die Datei-Upload-Funktion im Expertenmodus entfernt, die intelligente Suchfunktion deaktiviert und es kommt immer wieder zu "Serverauslastungen". Hinter all diesen Phänomenen steckt die Knappheit der Rechenressourcen. Der Gesamtdruck auf den Service ist so hoch, dass es notwendig ist, Abwägungen zu treffen.

DeepSeek ist so gut, dass die zugrunde liegende Infrastruktur aufholen muss.

Bezüglich der Situation, dass die Obergrenze für "Nachricht ändern" oder "Neugenerierung" erreicht ist, gibt Baiqiang den Rat, nicht schnell hintereinander zu klicken. Stattdessen soll man 15 bis 30 Minuten warten und dann erneut versuchen. Laut diesem Account wird in den meisten Fällen die Beschränkung nach der Wartezeit automatisch aufgehoben. Wenn man hingegen wiederholt und schnell klickt, kann dies möglicherweise als abnorm hoher Anfragedruck von der System erkannt werden, was zu einer Verlängerung der Beschränkungszeit führt.

Baiqiang erwähnte auch, dass neue Karten für die Huawei Ascend Supernode in der Entwicklung sind und voraussichtlich im zweiten Halbjahr online gehen. Dann wird die Rechenleistung erheblich erweitert und diese vorübergehenden Beschränkungen werden wahrscheinlich aufgehoben.

Bis jetzt hat DeepSeek noch keine offizielle Ankündigung zu diesem Thema herausgegeben. Die Anzahl der Beschränkungen, die Wiederherstellungszeit sowie die genauen Änderungen nach der Erweiterung der Rechenleistung im zweiten Halbjahr müssen noch von der offiziellen Seite bestätigt werden.

02 DeepSeek ist kein Alleingänger

Tatsächlich ist DeepSeek nicht das erste KI-Unternehmen, das so handelt.

Bei KI-Modellen ist es üblich, bei knapper Rechenleistung, einem starken Anstieg der Nutzerzahl oder hohem Druck in Spitzenzeiten die Traffic zu beschränken, die Qualität zu reduzieren, die Nutzer in eine Warteschlange zu setzen oder einige ressourcenintensive Funktionen separat zu beschränken.

ChatGPT hat immer eine Nachrichtenobergrenze. Selbst zahlende Nutzer können in Zeiten hoher Nachfrage möglicherweise auf die Anzahl ihrer Nutzungen beschränkt werden. Freie Nutzer werden nach Erreichen des Kontingents für das hochwertigere Modell auf ein leichteres Modell umgestellt.

Dies kann als eine Art "Service-Degradierung" verstanden werden. Es geht nicht darum, die Nutzung zu verbieten, sondern darum, sicherzustellen, dass nicht alle unbegrenzt die teuersten und ressourcenintensivsten Funktionen nutzen können.

Ähnliches gilt für Claude. Anthropic setzt für verschiedene Nutzer Nutzungsbudgets, und auch bei Claude Code und der API werden die Obergrenzen je nach Kapazität angepasst. Wenn die Rechenleistung reichlich ist, kann das Kontingent erhöht werden; wenn der Anfragedruck steigt, werden die Beschränkungen deutlicher.

Am 6. Mai veröffentlichte Anthropic eine Spezialmeldung, in der sie erklärte, dass sie die Nutzungsobergrenzen für Claude Code und die Claude API erhöht hat, dank neuer Rechenleistungskooperationen und Kapazitätserweiterungen. Dies zeigt umgekehrt, dass die Nutzungsobergrenze direkt mit der Rechenkapazität verbunden ist. Bei knapper Rechenleistung werden die Beschränkungen verschärft, nach einer Kapazitätserweiterung werden sie gelockert.

Anthropic hat jetzt jedoch detailliertere Nutzungsbeschränkungen für verschiedene Abonnements festgelegt. Hochressourcenintensive Szenarien wie Claude Code nähern sich zunehmend der Logik der Token-basierten Bezahlung.

Bei Produkten zur Bild- und Videogenerierung ist dies noch deutlicher. Sora, die Bildgenerierungsfunktion von Gemini und andere KI-Videotools haben bei einem plötzlichen Anstieg der Nachfrage alle Probleme wie eine Reduzierung der Generierungsanzahl, längere Warteschlangen und eine Verringerung des kostenlosen Kontingents erfahren.

Man kann sagen, dass "jede Inferenz hat Kosten" eine unausweichliche Realität für KI-Produkte geworden ist.

Vor kurzem hat die Einführung einer Gebühr für Doubao eine Diskussion ausgelöst. Der Hashtag "Doubao, teuer und unbrauchbar" war auf Weibo kurzzeitig sehr beliebt. Obwohl die Funktionsbeschränkungen von DeepSeek und Doubao unterschiedlich sind, ist die Reaktion der Nutzer auf beide Fälle ähnlich: Die Nutzer sind gewöhnt, KI-Produkte billig und unbeschränkt nutzen zu können. Sobald die Plattform beginnt, Gebühren zu erheben oder bestimmte Funktionen zu beschränken, kann die Reaktion der Nutzer schnell negativ sein.

Für KI-Unternehmen ist es üblich, die Grundfunktionen kostenlos anzubieten, für komplexere Funktionen Gebühren zu erheben, für ressourcenintensive Funktionen Kontingente festzulegen und in Spitzenzeiten temporäre Trafficbeschränkungen einzuführen.

Die Beschränkung der Anzahl der "Neugenerierungen" und "Nachrichtenänderungen" bei DeepSeek ist im gesamten KI-Sektor nicht ungewöhnlich. Es werden nicht der Chat-Eingang oder das Modell selbst beschränkt, sondern nur die Aktionen, die von den Nutzern häufig angeklickt werden und bei jedem Klick neue Inferenzressourcen verbrauchen.

Die Grundfunktion des Textgesprächs muss auf jeden Fall aufrechterhalten werden, da dies die Grundvoraussetzung für die Nutzung des Produkts ist. Funktionen wie Neugenerierung, wiederholte Änderungen, Datei-Upload, Internet-Suche, lange Kontexte und multimodale Generierung werden eher in Zeiten hoher Belastung beschränkt oder degradiert.

Ich denke, der Schwerpunkt dieser Kontroverse liegt nicht darin, "wie viel" beschränkt wird, sondern "wie" die Beschränkung durchgeführt wird.

Wenn die offizielle Seite frühzeitig erklärt, dass es sich um eine temporäre Trafficbeschränkung handelt, wann diese aufgehoben wird und welche Aktionen betroffen sind, werden die Nutzer es wahrscheinlich leichter akzeptieren. Ohne eine Ankündigung und plötzlich eingeschränkten Funktionen werden die Nutzer natürlich sofort vermuten, dass die Funktionen reduziert werden oder dass in Zukunft Gebühren erhoben werden.

Wenn KI-Produkte von Experimentiertools zu alltäglichen Tools werden, werden die Nutzer zunehmend auf Stabilität und Transparenz achten. Beschränkungen können verstanden werden, aber es ist besser, dass die Nutzer nicht erst durch eine Pop-up-Nachricht davon erfahren.

DeepSeek sollte wissen, dass ein Anstieg der Nutzungsanzahl, der eine Beschränkung erforderlich macht, auch bedeutet, dass viele Nutzer auf das Unternehmen warten.

Es würde schon reichen, wenn man ihnen zumindest eine klare Aussage geben würde.

Dieser Artikel stammt aus dem WeChat-Account "Zimu AI", Autor: Yuan Xinyue. Veröffentlicht von 36Kr mit Genehmigung.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Bitte stellen Sie schnell die Finanzierung von 70 Milliarden zur Verfügung. DeepSeek beginnt die Anzahl der Wiederholungen und Änderungen einzuschränken.

01

Temporäre Trafficbeschränkung bei knapper Rechenleistung?

02

DeepSeek ist kein Alleingänger