Wenxin Aktualisierung: Doubao wird kostenpflichtig - KI verläßt Ära der „reinen Traffic-Orientierung“

Die Ära des Überangebots an Zugangsmöglichkeiten ist vorbei

Am 24. Juni hat ByteDance Doubao drei Abonnementpläne für bezahlte Dienste eingeführt: Der Standardplan kostet 68 Yuan pro Monat, der Premiumplan 200 Yuan pro Monat und der High-End-Plan 500 Yuan pro Monat. Alle Pläne sind mit der Doubao 2.1-Serie von Modellen verbunden.

Fast zur gleichen Zeit hat Baidu angekündigt, dass es die Websites von Wenxin Yiyan Web, Wenxin und Wenxin Assistant zusammenführt und sie alle auf der Wenxin Assistant-Seite sammelt. Die Preisstrategie bleibt unverändert: Die Dienste bleiben weiterhin kostenlos.

Einerseits beginnen AI-Anwendungen, die Nutzer zu bezahlen, andererseits werden die Zugangspunkte weniger, die Funktionen aber immer umfangreicher, und es wird kein Cent verlangt. Zwei Unternehmen haben in Bezug auf dieselbe Branchenfrage jeweils eine eigene Antwort gegeben.

Die Frage lautet: Gilt in der Welt der Künstlichen Intelligenz noch die alte Regel aus der Zeit des mobilen Internets, dass mehr Zugangspunkte mehr Traffic und mehr Verhandlungsmacht bedeuten? In den letzten zehn Jahren oder so basierte die Expansionslogik fast aller Internetunternehmen auf dieser Annahme: Man verbreitete möglichst viele Zugangspunkte, um die Zeit der Nutzer zu beanspruchen, und baute sich so einen Schutzwall aus Größe auf.

Aber die Kostenstruktur von AI-Produkten unterscheidet sich völlig von der aus der Internetzeit. Hinter jeder Frage und Antwort steckt eine reale Rechenleistungskonsumtion. Manchmal bedeutet mehr Nutzer auch eine höhere Rechnung.

Doubao und Wenxin stehen genau auf beiden Seiten dieser logischen Kluft.

Doubao hat mit der Bezahlung einen Preis auf die „Abgeschlossenen Aufgaben“ gesetzt, während Wenxin mit der kostenlosen Erweiterung mehr Funktionen zu Infrastruktur gemacht hat. Die beiden Wege scheinen entgegengesetzt zu sein, aber tatsächlich beantworten sie beide dieselbe Veränderung: Der Wettlauf im Bereich der Künstlichen Intelligenz hat sich von der Anzahl der Zugangspunkte und der Größe des Traffics hin zum Fähigkeit, Dinge tatsächlich zu bewerkstelligen, verlagert.

Die beiden Wege treffen in ähnlicher Zeit aufeinander und bilden einen idealen Ausgangspunkt, um die kommerzielle Entwicklung von chinesischen Large Language Modellen zu beobachten.

Der globale Wettlauf um die „Zugangspunkte“ in der KI-Branche

Die Redundanz von Zugangspunkten ist fast ein „Mittelaltersproblem“ für jedes Unternehmen, das AI-Produkte entwickelt.

Die Logik der frühen Expansionsphase ist leicht zu verstehen: Man nimmt zunächst die Plätze ein und verbessert dann langsam die Nutzererfahrung. Wer die Nutzer zuerst bindet, hat einen Vorsprung. Das ist an sich unbeanstandet, aber der Preis dafür ist, dass die Nutzer nicht wissen, wo sie fragen sollen.

Die Situation bei Microsoft zeigt das am besten. Öffnet man Word, gibt es einen Copilot in der Seitenleiste. Wechselt man zu Teams, ist dort auch ein Copilot. Geht man auf GitHub, ist der Copilot noch da. Auch in Edge gibt es einen Copilot, und selbst Windows hat einen eingebauten Copilot. Die Nutzer müssen zwischen fünf voneinander unabhängigen Zugangspunkten hin- und herwechseln, und keiner von ihnen teilt den Gesprächsstatus und den historischen Kontext. Der AI-Assistent wird somit zu einer Belastung für das Gedächtnis der Nutzer.

Diese Redundanz ist in der frühen Phase eines Produkts tolerierbar. Damals war Copilot eher eine Funktionsdemonstration: Zusammenfassung einer Sitzung, Entwurf einer E-Mail, Vervollständigung eines Codes. Die Nutzer brauchten sich nicht allzu sehr darauf zu verlassen, und der Preis für einen Fehler war nicht hoch.

Aber wenn die Branche von Chatfenstern zu Intelligenten Agenten übergeht, braucht die KI nicht mehr nur ein Chat-Tool, sondern ein System, das planen, ausführen, prüfen und Aufgaben von einer Szene zur nächsten weiterleiten kann. Man kann nicht einfach mit mehreren Assistenten, die denselben Namen tragen, aber voneinander unabhängig sind, arbeiten. Wenn die Erwartungen der Nutzer an die KI von „kann man ein bisschen chatten“ zu „kann man diese Aufgabe erledigen“ wechseln, wird die Vielzahl der Zugangspunkte selbst zum Feind der Effizienz.

Deshalb haben die Großkonzerne fast gleichzeitig dieselbe Maßnahme ergriffen: Sie haben die verstreuten Zugangspunkte zusammengeführt.

Google hat den Weg beschritten, Gemini stetig in Chrome, den Traffic-Zugangspunkt, zu integrieren. Zuerst war es als Seitenleiste dauerhaft vorhanden, und später wurde die Funktion „Automatisches Browsen“ hinzugefügt. Die Nutzer können Gemini bitten, Preise zu vergleichen, Formulare auszufüllen und Tickets zu buchen. Bei sensiblen Aktionen wie der Anmeldung oder der Endzahlung wird die Kontrolle wieder an die Nutzer zurückgegeben. Google hat sich darüber klar Gedanken gemacht: Es will Gemini zum einheitlichen Hauptzugangspunkt für die KI in der Suche, im Browser und in der Bürosoftware machen und damit auch die Kernfunktion der Suche vor der Übernahme durch chatbasierte Interaktionen schützen.

Microsoft hat ähnliche Schritte unternommen. Im Mai dieses Jahres berichtete Fortune unter Berufung auf interne Quellen, dass das Unternehmen ein noch nicht offiziell benanntes „Super-App“ vorbereitet. Es plant, Copilot Chat, GitHub Copilot, Copilot Cowork und den Workflow-Engine mit dem internen Codename Autopilot in eine Schnittstelle zu integrieren. Das Projekt wird von Jacob Andreou, dem Leiter des Copilot-Businesses, geleitet. Das interne Ziel ist, „ein Copilot zu schaffen“, und die Umsetzung ist für Ende Sommer dieses Jahres geplant.

Obwohl die Lösungen der beiden Unternehmen in den Details unterschiedlich sind, geht es um dasselbe Problem: Die Nutzer sollten nicht zuerst Zeit damit verbringen, zu entscheiden, an welchen AI-Assistenten sie ihre Frage stellen sollen, bevor sie mit der Lösung des Problems beginnen.

Baidus „Zusammenführung von drei Websites“ ist die Lösung für diesen Fall auf dem chinesischen Markt.

Das Schließen einiger Websites und die Vereinheitlichung eines Domänennamens ist die sichtbare Reduktion. Das Unsichtbare ist, dass die Such-, Dokumenten-, Büro- und Agenten-Funktionen erstmals in ein und dasselbe Scheduling-System integriert wurden. Das System entscheidet selbst, welche Teilfunktion aufgerufen werden soll, anstatt die Entscheidung an die Nutzer zu delegieren.

Beispielsweise musste ein Nutzer früher, wenn er mit der KI einen Bericht schreiben wollte, zuerst entscheiden, ob er bei Wenxin Yiyan nach Ideen fragen oder im Dokumentenarchiv nach einem Template suchen sollte. Die historischen Aufzeichnungen und die Stilpräferenzen beider Seiten waren unabhängig voneinander. Jetzt muss der Nutzer nur seine Anforderung formulieren, und der Rest wird vom System erledigt.

Diese Veränderung scheint auf den ersten Blick eine Verbesserung der Nutzererfahrung zu sein, aber sie zeigt eigentlich eine Verschiebung des Schwerpunkts im KI-Wettlauf: Wer es den Nutzern ermöglicht, ihre Aufgaben an einem Ort zu erledigen, der kann die Nutzer wirklich binden.

Doubao geht links, Wenxin geht rechts

Die Entscheidung von Doubao, Gebühren zu erheben, war früher geplant, als die Öffentlichkeit vermutet hat.

Einen Monat zurück in der Zeit hatte Doubao bereits Anfang Mai in der Versionsbeschreibung im App Store Anzeichen von bezahlten Optionen gezeigt. Die Öffentlichkeit hat fast zwei Monate darüber diskutiert, und erst gestern ist die Entscheidung endgültig umgesetzt worden. Die drei Preiskategorien sind: Standardplan 68 Yuan, Premiumplan 200 Yuan und High-End-Plan 500 Yuan. Diese Pläne richten sich hauptsächlich an Szenarien mit hohem Rechenleistungsbedarf, wie Softwareentwicklung, Datenanalyse, professionelles Design und die Analyse von sehr langen Dokumenten. Genau diese Bereiche waren es, die in der kostenlosen Version am schwierigsten zu finanzieren waren.

Im Vergleich zu den Preisen internationaler Konkurrenten ist 68 Yuan niedriger als der Startpreis von ChatGPT Plus und Claude Pro, der etwa über 100 Yuan liegt. Obwohl 500 Yuan der höchste Preis von Doubao ist, ist er immer noch deutlich niedriger als die High-End-Preise von ChatGPT Pro und Claude Max, die mehrere hundert US-Dollar pro Monat kosten.

Dies ist auch das erste Mal, dass die chinesische Large Language Model-Branche bei einer Anwendung für die breite Öffentlichkeit das „Komplexe“ direkt mit einem Preis versehen hat. Einfache Fragen bleiben weiterhin kostenlos, während die intellektuellen Aufgaben, die wirklich Rechenleistung und Zeit in Anspruch nehmen, einen Preis wert sind.

Hinter dieser Entscheidung stecken reale wirtschaftliche Drücke. Bis März dieses Jahres hatte die tägliche Token-Nutzung des Doubao-Modells bereits 120 Billionen überschritten, was in drei Monaten verdoppelt wurde und 1000 Mal so viel ist wie bei der Veröffentlichung im Mai 2024.

In der Zeit des mobilen Internets galt die Regel, dass mehr Nutzer mehr Gewinn bedeuten. Diese Regel gilt jedoch nicht für das Geschäft mit Large Language Modellen. Jede kostenlose Konversation verursacht Hardware-Ausfall und Stromkosten. Je mehr Nutzer es gibt, desto höher ist die Rechnung. Größe garantiert nicht unbedingt mehr Verhandlungsmacht.

Von diesem Blickwinkel aus gesehen ist die Entscheidung von Doubao, Gebühren zu erheben, durchaus verständlich. Wenxin hat jedoch einen anderen Weg gewählt. Hinter dieser Entscheidung steckt das von Baidu seit Jahren propagierte, aber selten wirklich analysierte „Langfristdenken“.

Zusätzlich zur „Zusammenführung von drei Websites“ ist auch das Wenxin Large Language Model 5.1 online. Die Preisstrategie bleibt unverändert, und es wird weiterhin für alle Nutzer kostenlos zur Verfügung gestellt. Die Funktionspalette wurde jedoch erweitert, und es wurden neue Funktionen wie die Online-Bearbeitung von Office-Dokumenten, Zeitpläne, AI-Berichte, AI-PPTs, eingehende Recherchen und AI-Musik hinzugefügt. Die Anwendungsbereiche reichen jetzt von einfachen Fragen bis hin zu konkreten Szenarien in der Schule, im Büro und im Alltag.

Wenxins Vertrauen in die kostenlose Nutzung beruht darauf, dass die Kostenkurve durch Technologie gesenkt wurde.

Das Wenxin Large Language Model 5.1 hat in der internationalen autoritativen Search Arena-Bewertung 1223 Punkte erreicht, was weltweit Rang 4 und in China Rang 1 ist. Es ist auch das einzige chinesische Modell, das derzeit in dieser Liste vertreten ist. In der AIME26-Bewertung, die als „Mathematikwettbewerb“ bezeichnet wird (mit Tool-Interaktion), hat es 99.6 Punkte erreicht, nur hinter Gemini 3.1 Pro.

Das Wichtigste ist jedoch die Kosten. Wenxin 5.1 verwendet eine Methode der „Mehrdimensionalen elastischen Vorhersage“. Es extrahiert direkt ein optimales Subnetz aus der Submodell-Matrix von Wenxin 5.0 und übernimmt die bereits gelernten Kenntnisse von 5.0. Dadurch entfällt der Aufwand für das Training von Grund auf. Die Gesamtparameter wurden auf etwa ein Drittel der Vorgängerversion reduziert, die aktiven Parameter auf etwa die Hälfte, und die Kosten für das Vorhersage-Training betragen nur 6 % im Vergleich zu Modellen gleicher Größe.

Aber allein diese Kostenrechnung reicht nicht aus, um das „Langfristdenken“ zu rechtfertigen.

Es ist erwähnenswert, dass es in der chinesischen Large Language Model-Branche seit Anfang dieses Jahres bereits eine Welle von Gebührenerhebungen gegeben hat. Wenxin hat sich entschieden, gegen diese Welle zu schwimmen.

ZhiPu hat ab dem 12. Februar den Preis für seinen GLM Coding Plan erhöht und die Erstkaufrabatte aufgehoben. Der Lite-Plan kostet jetzt 49 Yuan, der Max-Plan 469 Yuan. Step Plan von Jieyue Xingchen wurde erstmals am 23. März eingeführt, mit einem Startpreis von 49 Yuan pro Monat. MiniMax hat es noch dramatischer gemacht. Am 1. Juni, als das neue Modell M3 online, hat es die Abrechnungsweise von der Transaktionsgebühr zur Token-Nutzung geändert, ohne vorherige Ankündigung. Der Einstiegspreis von 29 Yuan ist direkt auf 49 Yuan gestiegen, was die Entwicklergemeinschaft in Aufruhr versetzte.

Als ein Unternehmen, das Erfahrung in der KI-Preisgestaltung hat, hat Baidu bewusst entschieden, die Basisfunktionen im kostenlosen Bereich zu belassen, während die Branche allgemein mit der Schichtpreisgestaltung beginnt. Hinter dieser Entscheidung steckt nicht nur eine bessere Kostenkontrolle, sondern auch die Überzeugung von seiner langfristigen Strategie.

Eine kurzfristige Marktposition reicht nicht aus, um diese Entscheidung zu rechtfertigen. Baidu hat in den letzten zehn Jahren kontinuierlich hohe Investitionen in die KI-Forschung getätigt, von der Chip-Ebene (Kunlun-Chip), über die Frameworks-Ebene (PaddlePaddle), bis zur Modell-Ebene (Wenxin Large Language Model) und schließlich zur Anwendungs-Ebene (eine Reihe von Anwendungen und Agenten). Alle vier Ebenen der Technologiestruktur sind vollständig integriert.

Am Ende kommt es darauf an, ob die kostenlose Strategie aufrecht erhalten werden kann, was letztendlich die Prüfung der vollständigen Integration dieser gesamten Technologiestruktur ist.

Unterschiedliche Ressourcen, unterschiedliche Wege

Die beiden Wege, die Doubao und Wenxin gewählt haben, werden von zwei unterschiedlichen Ressourcenausstattungen bestimmt.

Baidu folgt einem „Ökosystem-Flywheel“. Es nutzt die technologischen Vorteile, um die Nutzerzahl zu erhöhen. Die Nutzerzahl bildet dann eine Ökosystembarriere, die wiederum über bestehende Motoren wie die Suche und den Smart Cloud die Wertschöpfung der KI-Funktionen indirekt realisiert. Das Merkmal dieser Kette ist, dass der Monetarisierungsprozess weit von den Nutzern entfernt ist, aber nahe an Baidus bestehenden Geschäften. Die Suche und der Cloud-Service sind beispielsweise Geschäfte mit stabilen Cashflows. Die Integration von KI-Funktionen ist im Wesentlichen ein neuer Motor für die alten Geschäfte.

Doubao folgt einem „Produkt-Flywheel“. Die Produktqualität führt zu Nutzerzahlungen, und die Einnahmen werden in die Modellentwicklung investiert, was einen schnelleren und effizienteren Zyklus bildet. Dieser Weg ist am nächsten an den Nutzern und hat eine schnelle Rückzahlung, aber der Preis dafür ist, dass das Produkt ständig seinen Wert beweisen muss. Die Entscheidung

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Wenxin wird aktualisiert, Doubao ist kostenpflichtig – die KI verläßt die Ära der „reinen Traffic-Orientierung“

Der globale Wettlauf um die „Zugangspunkte“ in der KI-Branche

Doubao geht links, Wenxin geht rechts

Unterschiedliche Ressourcen, unterschiedliche Wege