36Kr Exklusiv | Vier zentrale Aufgaben für ByteDance KI im Jahr 2026
Text | Zhou Xinyu
Redaktion | Zhang Yuxin, Yang Xuan
„Intelligente Entstehung“ hat aus mehreren Quellen exklusiv erfahren, dass ByteDance im Jahr 2026 vier wichtige Themen im Bereich KI hat:
Erhöhung der Investitionen in das Training von Weltmodellen. Bis Ende des Jahres soll die Leistung des Modells das Niveau des derzeitigen weltweit besten (SOTA) Google Genie 3 erreichen.
Das Videomodell soll weiterhin führend bleiben und neue Richtungen wie die „dynamische Generierung“ erkunden.
Weiterhin soll die Grundlage für Coding verbessert werden. Das Dogfooding von Coding (Datenrückfluss, Bewertung, Bildung eines Fliegendrehscheibensystems) soll verbessert werden, um die Fähigkeiten des Agenten zu steigern.
Doubao soll seine kommerzielle Fähigkeit stärken. Der Schwerpunkt liegt auf dem Anwendungsbereich „Büroarbeit“.
ByteDances unvollendete Aufgabe: Weltmodelle
Heute gibt es in ByteDances KI - Portfolio das Seed 2.0, das ByteDance endlich in die erste Liga der chinesischen Großen Modelle katapultiert hat, sowie das Seedance 2.0, das auf weltweitem Niveau SOTA ist. Auf der Anwendungsseite hat Doubao ebenfalls eine deutliche Führung erreicht. Wir haben von mehreren Seiten erfahren, dass nach dem chinesischen Neujahr 2026 die tägliche aktive Benutzerzahl (DAU) von Doubao 200 Millionen erreichte.
„Es gibt keine offensichtlichen Schwächen.“ So bewertete ein KI - Strateg einer großen Firma ByteDances KI - Geschäftsportfolio.
Aber unter all diesen Modellen fehlt gerade das Schlüsselmodell für die nächste Phase der Forschung an Großen Modellen: das Weltmodell.
Mehrere Personen, die mit dem Seed - Team in Kontakt stehen, haben uns erzählt, dass ByteDance ein relativ spät in den Wettlauf um Weltmodelle eingetretener Teilnehmer ist. Im Jahr 2024 übernahm Zhou Chang, der gerade von Alibaba zu ByteDance gewechselt war, die Leitung der Forschung an Weltmodellen.
Damals war die interne Einschätzung, dass die Richtung und die kommerziellen Anwendungsfälle von Weltmodellen noch nicht klar waren. Wichtiger war es, den Kampf um das Videomodell zu gewinnen.
Erst im Jahr 2025 gründete ByteDance in kleinerem Umfang eine Forschungsgruppe, um die VLA - Richtung (Visuelles - Sprach - Aktionsmodell) in Weltmodellen zu erforschen. Es gab zwei Teamleiter:
Einer war Li Hang, der Leiter des ByteDance AI Lab. Im April 2025 wurde das gesamte AI Lab (einschließlich des Robotics - Teams) in das Seed - Team integriert, um die Kommunikationseffizienz zwischen Modell und Anwendung (Embodied AI) zu verbessern. Die Weltmodell - Trainingsdaten basieren hauptsächlich auf Simulationsdaten.
Der andere war Wang Wenqian, ein Multimodal - Forscher von Seed, der hauptsächlich auf natürlichen Daten trainiert.
Im Jahr 2026 stellte Wu Yonghui endlich auf der gesamten Seed - Mitarbeiterversammlung ein klares Ziel für das Weltmodell: Bis Ende 2026 soll mindestens eine Version des Weltmodells veröffentlicht werden, deren Leistung mit dem derzeitigen Welt - SOTA (besten) - Modell Google Genie 3, das im August 2025 veröffentlicht wurde, vergleichbar ist.
Aber nach dem gegenwärtigen Fortschritt ist die Einholgeschwindigkeit nicht ausreichend. Eine Person, die mit Seed in Kontakt steht, hat uns erzählt, dass Wu Yonghui mehrmals in internen Seed - Meetings sagte, dass die Ergebnisse von ByteDances Weltmodell und Embodied AI nicht den Erwartungen entsprachen.
Ein weiterer Seed - Mitarbeiter hat gesagt, dass laut interner Bewertung Ende 2026 die Gesamteigenschaften von ByteDances Weltmodell noch 10 % hinter dem globalen SOTA zurücklag.
Aber dieser Kampf repräsentiert die Zukunft.
Einerseits ist der Markt für Embodied AI, der einen Volumen von mindestens 10 Milliarden US - Dollar hat, sowie die Spiele - und Unterhaltungsbranche, die riesige Entwicklungsmöglichkeiten bietet, die Nachfolgebranche des Weltmodells.
Ein ehemaliger Seed - Forscher hat uns einmal gesagt, dass die Anwendungsfälle von ByteDances Robotern bisher hauptsächlich auf die Gegenstandstransport und die industrielle Bewegung beschränkt waren, aber die interne Einschätzung war, dass die Wachstumsgrenze relativ niedrig war. „Der Markt für humanoide Roboter, der ein breiteres Potenzial hat, ist eine Richtung, in die ByteDance sicherlich eintreten wird.“
Andererseits gibt es noch viele Meinungsverschiedenheiten bei der Richtung des Weltmodells, einschließlich der Video - Generierungs - Schule, der VLA - Schule (Visuelles - Sprach - Aktionsmodell) und der JEPA - Schule (Pixel - Vorhersage).
„Mit ByteDances Personalmengen und finanziellen Investitionen besteht eine hohe Wahrscheinlichkeit, dass man gewinnt, wenn man wetten will. Wenn man nicht wetten will, wird man definitiv verlieren.“ So analysierte uns ein KI - Investor.
Um das Ziel zu erreichen, in die erste Weltliga aufzusteigen, hat ByteDance seit 2026 auch viele Anpassungen bei der Weltmodell - Trainings durchgeführt.
„Intelligente Entstehung“ hat erfahren, dass nach dem chinesischen Neujahr 2026 Seed eine neue Weltmodell - Forschungsgruppe gegründet hat, deren Leiter Fan Haoqi, ein ehemaliger Forscher des Meta FAIR Lab, ist und der an Zhou Chang, den Leiter der Multimodal - und Weltmodell - Abteilung von Seed, berichtet.
Zur gleichen Zeit wurden die beiden VLA - Forschungsgruppen, die von Li Hang und Wang Wenqian geleitet wurden, zusammengeführt und berichten nun einheitlich an Zhou Chang.
Mehrere Kenner haben „Intelligente Entstehung“ mitgeteilt, dass die von Li Hang und Wang Wenqian geforschte Richtung hauptsächlich VLA ist, die auf „Improvisation“ und „Wirklichkeit“ abzielt, und die Zielanwendungsfälle Embodied AI sind. Die neue Gruppe, die von Fan Haoqi geleitet wird, verfolgt die 3D - Simulationsrichtung, mit dem Schwerpunkt auf Anwendungsfällen wie Spielen und Unterhaltung.
Abgesehen von der Expansion des Personals und der Forschungsrichtungen ist die Investition in Weltmodelle auch die höchste unter den verschiedenen Modellrichtungen wie Text, Coding und Video.
Besonders auffällig ist das Datenbudget. Ein Mitarbeiter der ByteDance - Datenplattform hat uns erzählt, dass die Strategie der „Massenproduktion“ von Trainingsdaten in den LLM (Große Sprachmodelle) und dem Seedance 2.0 bereits erhebliche Erträge gebracht hat. Das Team plant, die gleiche „Datenmeer - Taktik“ auch bei der Weltmodell - Trainings anzuwenden.
Dies entspricht auch einer höheren Dateninvestition. Wir haben von mehreren Seiten erfahren, dass das Budget für die Trainingsdaten (einschließlich VLA, Langzeitvideos, 3D - Moden usw.) von Weltmodellen in 2026 in allen Moden am höchsten ist und mehrere Millionen Yuan beträgt.
Ein Datenlieferant hat erwähnt, dass ByteDances Dateninvestition in Weltmodelle 3 - 4 Mal höher sein kann als die anderer Anbieter.
Coding: Streben nach noch perfekteren Datenengineering
Die Coding - Fähigkeit ist die Grundlage und der Schlüssel, der die Obergrenze der Agenten - Effektivität bestimmt. Dies ist bereits ein Konsens in der Branche.
Mehrere Kenner haben uns die Wichtigkeit, die ByteDance Coding beimisst, erwähnt. „ByteDances Investition in Coding war immer hoch und nur hinter der Investition in Weltmodelle in diesem Jahr.“ So sagte uns eine Person, die mit Seed in Kontakt steht.
Zum Beispiel werden intern gezielt Daten gekauft oder werden die Trainingsdaten - Demos von ausländischen Spitzen - Coding - Modellen wie Claude Code und CodeX untersucht.
Auf der Force - Konferenz von Volcengine im Jahr 2025 hat auch Hong Dingkun, der Technische Vizepräsident von ByteDance, gesagt, dass Coding als eine hoch strukturierte und logisch strenge Aufgabe hohe Anforderungen an das Modell in Bezug auf das Verständnis komplexer semantischer Strukturen, logisches Denken, Algorithmenentwurf und präzise Ausdruck stellt und die Exploration der Intelligenz - Obergrenze des Modells unterstützen kann.
Aber in der Öffentlichkeit war die Präsenz von ByteDances Coding - Geschäft bisher nicht sehr stark. Sowohl das im November 2025 veröffentlichte Modell Doubao - Seed - Code als auch das Anfang 2025 veröffentlichte AI - Programmiertool Trae hatten nicht die gleichen Effekte und Bekanntheit wie das GLM 5 von Zhipu und das K2 von Yuezhianmian.
„Der Grund, warum ByteDances Coding - Effekte keine Durchbrüche erzielen können, liegt in der fehlenden Datenrückführung.“ So bewertete ein Kenner. Aufgrund der begrenzten Modellfähigkeiten sind die relevanten ByteDance - Geschäfte nicht bereit, Seed - Code zu verwenden.
Selbst das AI - Coding - Tool Trae hat zunächst DeepSeek und Claude Code sowie ein eigenes intern trainiertes Coding - Modell integriert.
Das führt dazu, dass ByteDances Coding - Modell fehlende Rückmeldungen aus realen Anwendungsfällen hat.
Seit 2026 haben viele ByteDance - Mitarbeiter bemerkt, dass die verschiedenen Geschäftseinheiten die Unterstützung für das Seed - Modell verstärken. Ein Seed - Mitarbeiter hat „Intelligente Entstehung“ mitgeteilt, dass ByteDance früher nicht beschränkte, dass die Geschäftseinheiten Drittanbieter - Coding - Modelle für die Entwicklung verwenden konnten. Seit 2026 werden jedoch mehrere Anwendungsabteilungen gezwungen, das Seed - Modell zu verwenden.
Aber bei noch höheren Dateninvestitionen hat die Rekrutierungstätigkeit von Seed etwas nachgelassen.
Ein Headhunter aus der KI - Branche hat „Intelligente Entstehung“ mitgeteilt, dass das ByteDance - Personalmanagement jetzt das Signal aussendet, dass die Zeit der groben und hoch bezahlten Rekrutierung vorbei ist. Das nächste Thema ist die interne Förderung junger Talente und die Verbesserung der Algorithmus - Vergütung.
Heute sind die wenigen offenen Stellen bei Seed hauptsächlich für AI - Talente von DeepSeek sowie aus ausländischen Großunternehmen wie OpenAI, DeepMind und Meta reserviert, wie zum Beispiel Guo Daya, ein ehemaliges Kernmitglied von DeepSeek, und Dong Xin, ein ehemaliger Forscher von NVIDIA.
Wie kann Seedance seine SOTA - Position halten?
Ein weiteres Schwerpunktthema von ByteDance im Bereich KI - Modelle im Jahr 2026 ist die Aufrechterhaltung der SOTA - Position von Seedance im globalen Bereich der Videogenerierung.
„Der Erfolg von Seedance 2.0 ist der Erfolg der Daten.“ So hat der Gründer eines Videogenerierungs - Start - Ups „Intelligente Entstehung“ über Seedance 2.0 gesagt. Wir haben erfahren, dass die riesige Menge an Trainingsdaten und ein Evaluierungsteam von über 2000 Personen für die beeindruckenden Ergebnisse von Seedance 2.0 verantwortlich sind.
Aber die kontinuierliche Trainingsmethode der „Massenproduktion“ birgt auch Risiken. Einige Studien haben gezeigt, dass es im Bereich der Videogenerierung ein Phänomen namens „Anti - Skalierungsgesetz“ gibt. Einfach ausgedrückt, je mehr Trainingsdaten es gibt, desto eher „faulenzt“ das Modell, indem es nur bestimmte Schlüsselbilder lernt und die vollständige Erzählung ignoriert. Deshalb sinkt der Nutzen der „Massenproduktion“ von Daten in der späten Trainingsphase oft.
Zwei Kenner aus dem Datenbereich haben uns erzählt, dass Seedance bei der Vorab - Trainings bereits die maximale Leistung erreicht hat. Um die Leistung weiter zu verbessern, muss man die Trainingsdaten reinigen und eine feinere Nach - Trainings durchführen.
Zur gleichen Zeit ist die „dynamische Generierungs“ - Fähigkeit eine neue Richtung, auf die sich das Seedance - Team im Jahr 2026 konzentriert.
Die sogenannte „dynamische Generierung“ oder interaktives Video bedeutet, dass der Benutzer Befehle eingeben kann und den Inhalt und die Handlung des generierten Videos jederzeit anpassen kann. In diesem Bereich hat bereits das mit einem Schätzwert von 1,32 Milliarden US - Dollar bewertete Vivix AI (gegründet von Liu Yu, dem ehemaligen Leiter der Hochschul - Forschung bei SenseTime) Erfolg erzielt.
Mehrere Kenner haben „Intelligente Entstehung“ mitgeteilt, dass Zhou Chang immer sehr optimistisch über die Umsetzungsmöglichkeiten der dynamischen Generierung ist.
„Interaktive Videos können zu kleinen Spielen oder interaktiven Serien gemacht werden und können auch mit der Erforschung von Weltmodellen verbunden werden (die Videogenerierung ist auch ein Weg zur Erforschung von Weltmodellen).“ So sagte eine Person, die mit Seed in Kontakt steht.
Beschleunigung der Kommerzialisierung und des Auslandsmarkteintritts von Doubao
36Kr hat exklusiv berichtet, dass Doubao voraussichtlich Ende Juni 2026 bezahlbaren Inhalt online stellen wird. Gleichzeitig plant Doubao auch, mit dem TikTok - E - Commerce zu verbinden, um die bezahlbaren Anwendungsfälle zu verbessern.
Anfang Mai 2026 hat Doubao im App Store ein neues Bezahlabonnement - Angebot aktualisiert. Der monatliche Abonnementpreis variiert zwischen kostenlos und 500 Yuan.
Am 3. Juni hat das Doubao - Team auch angekündigt, dass es dem Bedarf an Produktivität von Fachleuten gerecht werden will und eine „Doubao Professional Edition“ einführen wird, die professionelle Dienstleistungen wie Softwareentwicklung, Datenanalyse, professionelles Design, Prozessautomatisierung, Finanzanalyse und wissenschaftliche Forschung umfasst.
Mehrere Kenner haben gesagt, dass nach dem chinesischen Neujahr die tägliche aktive Benutzerzahl (DAU) von Doubao bereits 200 Millionen überschritten hat. „Das Werbebudget von Doubao ist dieses Jahr sehr niedrig.“ In der Ansicht eines Kenner bringt die hohe DAU hohe Inference - Kosten und Wartungsdruck mit sich. Doubao möchte in diesem Zeitpunkt die Kommerzialisierung vorantreiben, um sowohl die Wachstumsgeschwindigkeit zu verlangsamen als auch die eigene Selbstfinanzierung zu verbessern.
Die PPT - Generierung ist der Kernpunkt, um die Benutzer zu bezahlen zu bringen. „Doubao möchte die PPT - Generierungsfunktion verbessern, um Anwendern aus hochwertigen Branchen wie Finanzen und Recht zu berechnen.“ So sagte eine Person, die mit Doubao in Kontakt steht. In der nächsten Phase plant Doubao auch, eine Unternehmensversion einzuführen und mit den internen Systemen von Unternehmen zu verbinden, aber die genaue Art der Verbindung wird noch intern diskutiert.
Er sagte, dass diese Idee von dem Geschäftsmodell ausländischer Modelle inspiriert wurde. Derzeit hat sich der kommerzielle Weg der Bezahlung für Büroanwendungen im Ausland bereits bewährt. Laut den von Anthropic veröffentlichten Daten erreichte Claude Code nur sechs Monate nach dem Start ein ARR von 1 Milliarde US - Dollar. Ein Jahr nach dem Start erreichte das ARR im Februar 2026 bereits 2,5 Milliarden US - Dollar.
Der beachtliche Cashflow