Der WeChat-Agent hat den "Heldenruf" ausgesprochen, und die Hälfte der Internet-Giganten antwortet darauf.
Der WeChat-Agent kommt tatsächlich bald.
Die WeChat-Öffentlichkeitsplattform hat eine solche Anleitung für WeChat-AI-Entwickler veröffentlicht.
Die Anleitung besagt, dass die WeChat-Öffentlichkeitsplattform auf der Grundlage des vollen Respekts der Rechte und der freien Wahl der Entwickler die Möglichkeit bietet, sich einfach in die WeChat-AI-Ökosystem einzubinden, um den Benutzern ein intelligenteres Interaktionserlebnis zu bieten und zu helfen, Mini-Programme schneller zu entdecken und zu nutzen.
Nach der Einbindung haben Mini-Programme die Chance, von der WeChat-AI empfohlen und aufgerufen zu werden. Mini-Programme, die die Einbindung nicht abgeschlossen haben, können von der WeChat-AI nicht aufgerufen werden.
Die Plattform bietet zwei Arten der Einbindung. Im automatischen Modus wird der Plattform die Erlaubnis erteilt, den Quellcode des Mini-Programms beim Übermitteln zur Prüfung einzulesen, ohne zusätzliche Entwicklungsefforte zu erfordern. Im Entwicklungsmodus können die Entwickler auf der Grundlage der Geschäftseigenschaften des Mini-Programms eine individuelle Entwicklung vornehmen.
Am gleichen Tag hat Meituan offiziell angekündigt, dass es als erstes in das WeChat-AI-Ökosystem integriert wird. Als Teil des ersten Beta-Testteams hat Meituan bereits zusammen mit dem WeChat-Team an der Entwicklung und dem Test der Einbindung gearbeitet. In Zukunft können Benutzer über die WeChat-AI lokale Lebensdienstleistungen wie Meituan Delivery aufrufen.
Lebensdienstleistungsplattformen wie Ctrip und Tongcheng haben ebenfalls die Einbindung in WeChat angekündigt.
Vor einigen Tagen hat der Tencent-Support angegeben, dass WeChat zusammen mit Mobiltelefonherstellern wie Huawei, Xiaomi, Honor, OPPO und vivo an der Einführung der A2A-Assistentenfunktion arbeitet, und bereits mehrere Hersteller die Einbindung abgeschlossen haben.
Benutzer können über den AI-Assistenten des entsprechenden Mobiltelefon-Systems WeChat-Sprech- oder Videotelefonate starten oder Nachrichten an bestimmte Freunde senden.
Dies ist nicht das erste Mal, dass Nachrichten über WeChat-AI verbreitet werden. Bereits im März dieses Jahres haben ausländische Medien berichtet, dass Tencent ein streng geheimes AI-Agent-Projekt innerhalb von WeChat vorantreibt.
Am 2. Juni haben ausländische Medien berichtet, dass Tencent ein Prototyp des eingebauten WeChat-AI-Agents testet und den Compliance-Prüfprozess spätestens diesen Monat starten wird. Am Tag der Veröffentlichung der Meldung stieg der Schlusskurs der Tencent-Aktien um 10,5%, und der Marktwert stieg um mehr als 300 Milliarden HK-Dollar, was den größten Tagesgewinn seit Januar 2021 darstellt.
WeChat-AI könnte vielleicht die endgültige Antwort für die zweite Hälfte der Tencent-AI-Reise sein.
01
Das Profil von WeChat-AI
Personen, die die frühen Demonstrationen gesehen haben, haben angegeben, dass Benutzer auf der Hauptoberfläche von WeChat nach rechts wischen können, um das Dialogfenster des AI-Agents aufzurufen. Nach der Eingabe eines Befehls ruft der Agent automatisch Mini-Programme im WeChat-Ökosystem auf und erledigt Aufgaben wie die Auswahl, Bestellung und Reservierung.
Wenn Sie beispielsweise sagen: "Bestelle mir einen Kaffee für weniger als 30 Yuan, der nicht zu süß ist und in der Nähe abgeholt werden kann", ruft der Agent automatisch Mini-Programme in WeChat auf, um Kaffeehäuser auszuwählen, den Geschmack und den Preis zu vergleichen und sogar den Bestellprozess abzuschließen.
Wenn man nur die Beschreibung hört, unterscheidet es sich nicht viel von AI-Chatboten wie Doubao und Qianwen.
Das Besondere hierbei ist, dass WeChat-AI die Steuerung des gesamten WeChat-Ökosystems hat.
In der Jahresbericht von Tencent 2025 wurde deutlich erwähnt, dass das Ziel darin besteht, in der WeChat-Ökosystem nächste Generation von Agentic-Services aufzubauen und die Fähigkeiten von Mini-Programmen, Inhalten, Sozialem und Zahlungen zu verbinden. Bis zum 31. März 2026 betrug die monatliche aktive Benutzerzahl von WeChat und WeChat zusammen 1,432 Milliarden.
Das bedeutet, dass WeChat-AI, egal ob gut oder schlecht, einmal online geht, bestimmt eine Super-App sein wird.
Es gibt Millionen von Mini-Programmen in WeChat, die alltägliche Szenarien wie Taxifahrten, Lieferdienste, Ticketbuchungen und Lebensmittelkäufe abdecken. Fast alle führenden chinesischen Internetdienstleistungen haben Mini-Programm-Eingänge in diesem Ökosystem.
Die Kernfähigkeit von WeChat-AI besteht darin, dass die AI die Dienste und Transaktionsfähigkeiten dieser Mini-Programme aufrufen kann und einen vollständigen Zyklus von der Erkenntnis über die Entscheidung bis zur Ausführung abschließen kann.
Wie soll es das dann tun?
Zunächst muss es die Benutzerabsicht verstehen. Wenn ein Benutzer sagt: "Buch mir ein Restaurant", hat das in einer Familien-Gruppe und in einer Arbeits-Gruppe völlig unterschiedliche Bedeutungen.
Wer beteiligt sich, wer hat die Entscheidungsgewalt, wie hoch ist das Budget, gibt es irgendwelche Essenswünsche oder -abneigungen, und in welchem Stadium befindet sich die Aufgabe? All dies sind Informationen, die der Agent verstehen muss. Die Schwierigkeit besteht darin, dass Aufgaben in WeChat von Natur aus über die Zeit hinweg verteilt sind. Die Diskussion über den Sommerurlaub in einer Familien-Gruppe kann über mehrere Tage hin- und hergehen.
Dann muss es die Werkzeuge aufrufen.
Der Agent muss tätig werden, indem er Informationen sucht, mit Mini-Programmen Abfragen und Preisvergleiche durchführt, Transaktionen mit WeChat Pay abschließt und die Ergebnisse an den Benutzer über Service-Benachrichtigungen zurückgibt.
Laut dem "Frühjahrsbericht über den Panoramawirkungsbereich von Ökosystemtraffic 2026" von QuestMobile hat die tägliche aktive Benutzerzahl von Mini-Programmen bereits über 900 Millionen erreicht und deckt Hunderte von Nischenbereichen ab.
Jetzt ist das Werkzeugkasten groß genug, aber kann WeChat-AI es richtig nutzen?
In einer am 18. März veröffentlichten Studie von Tencent wurden einige technische Details enthüllt. Das WeChat-Team hat UI-Oceanus entwickelt, ein Weltmodell, das speziell für das Mini-Programm-Ökosystem konzipiert ist. Seine Aufgabe ist es, die Ergebnisse von Aktionen vorherzusagen. Der Agent hat einen Button gefunden, aber was passiert, wenn man darauf klickt? Wohin springt die Seite? Welches Fenster erscheint? Wird der Zahlungsprozess gestartet?
Wenn Menschen eine APP bedienen, haben sie eine Intuition für diese Dinge, der Agent hat diese Intuition nicht, also muss er es aus den Daten lernen.
Ein Spiel-AI lernt, wie sich ein Charakter bewegt, wenn man eine Taste drückt. Das Weltmodell von Mini-Programmen lernt, wie sich die Seite ändert, wenn man auf einen Button klickt.
Das Training direkt in der realen Mini-Programm-Umgebung ist zu langsam und zu instabil, daher generiert UI-Oceanus automatisch simulierte Aktionen und Seitenänderungen und erstellt 5 Millionen Stichproben. Dadurch kann der Agent in einer virtuellen Umgebung lernen, wie man Mini-Programme bedient, und diese Fähigkeiten dann in die reale Welt übertragen.
Es gibt auch das Problem der Kosten. Wenn die Eingänge von 1,4 Milliarden monatlichen aktiven Benutzern in jedem Szenario eine Inferenz auslösen, sind die Kosten astronomisch. Tencent muss einen Ausgleich zwischen der Verwendung von kleinen Modellen für einfache Aufgaben und der Verwendung von starken Modellen für komplexe Aufgaben finden. Diese Fähigkeit zur Mehrmodell-Steuerung muss sowohl die Effektivität sicherstellen als auch die Kosten kontrollieren.
Schließlich muss es die Ökosystemkoordination vornehmen.
Es gibt zu viele Mini-Programme in WeChat. Die Qualität der Dienste, die Stabilität der Schnittstellen, die Kooperationsbereitschaft der Anbieter, der Zahlungsprozess, die Empfehlungsreihenfolge und die Verteilung der Einnahmen - jedes dieser Themen könnte lange diskutiert werden.
Der AI-Agent muss für den Benutzer die Aufgabe tatsächlich erledigen und nicht nur glatt versprechen, um dann mitten im Prozess zu verlieren.
WeChat-AI ist also ein sehr komplexes Projekt, das verschiedene komplexe Szenarien bewältigen muss. Es muss natürliche Sprache verstehen, Mini-Programme aufrufen, Zahlungen verarbeiten, Kontexte verwalten und das Ökosystem koordinieren.
Das Profil von WeChat-AI ist klar, aber dieses Produkt wird viel größer sein, als wir uns vorstellen.
02
Warum WeChat am besten geeignet ist, diesen Agenten zu hosten
Je reicher der Kontext ist, desto besser kann die AI die wahre Absicht des Benutzers verstehen und desto genauer sind die Entscheidungen.
Und WeChat ist genau der größte Kontext-Container von Tencent.
WeChat hat eine Beziehungsstruktur. Die sozialen Beziehungen, Chatverläufe und Gruppendiskussionen von 1,4 Milliarden Benutzern in WeChat sind alle Kontextinformationen. WeChat hat Mini-Programme, und die von Millionen von Mini-Programmen abgedeckten Dienstleistungsszenarien sind ebenfalls Kontextinformationen.
WeChat hat eine Zahlungsmöglichkeit. Die Konsumgewohnheiten, Zahlungsverläufe und Transaktionspräferenzen der Benutzer sind auch Kontextinformationen.
WeChat hat Inhalte. Die Informationsströme in den öffentlichen Accounts, Video-Kanälen und Freundeskreisen sind ebenfalls Kontextinformationen.
In letzter Zeit hat Tencent viele AI-Produkte wie Yuanbao, ima, WorkBuddy und Marvis eingeführt. Sie scheinen voneinander unabhängig zu sein, aber tatsächlich sammeln sie alle Fähigkeiten für WeChat-AI.
Hinter diesem liegt ein Mechanismus namens Co-Design innerhalb von Tencent.
Einfach ausgedrückt, bedeutet Co-Design, dass das Produktteam und das Modellteam gemeinsam designen und optimieren.
Bei der herkömmlichen Methode trainiert das Modellteam zuerst das Modell und gibt es dann an das Produktteam weiter. Wenn das Produktteam Probleme entdeckt, gibt es diese zurück, und das Modellteam passt das Modell an.
Dieser Prozess ist langsam, und es kommt oft vor, dass "das Modell stark ist, aber das Produkt schlecht zu bedienen ist".
Die Vorgehensweise von Co-Design ist anders. Das Yuanbao-Team teilt dem Hunyuan-Team mit, wie Benutzer in der realen Welt Fragen stellen und welche Probleme sie haben. Das Hunyuan-Team optimiert dann bestimmte Fähigkeiten des Modells auf der Grundlage dieser realen Rückmeldungen.
Nach der Optimierung testet das Yuanbao-Team sofort das Modell, entdeckt neue Probleme und passt es weiter an.
Dieser Prozess ist bidirektional und synchron. Das Produkt liefert dem Modell reale Daten und Rückmeldungen, und das Modell gibt dem Produkt stärkere Fähigkeiten.
Warum ist das nützlich? Der wesentliche Unterschied zwischen der LLM-Zeit und der früheren AI liegt in der Generalisierbarkeit.
Vor der LLM-Zeit musste man für ein Übersetzungsprodukt nur die Übersetzungsdaten richtig aufbereiten und für ein Schachprogramm nur die Schachdaten bereitstellen.
Aber heute ist die Situation anders. Selbst wenn man nur einen Coding-Agenten entwickeln möchte, muss das Modell Chatfähigkeiten, Suchfähigkeiten, Befehlseinhaltungsfähigkeiten und Inferenzfähigkeiten haben. Am Ende wird es zu einem sehr komplexen interdisziplinären Problem.
Das Co-Design von Tencent und Yuanbao soll dem Hunyuan-Modell starke Chat- und Suchfähigkeiten verleihen. Diese Fähigkeiten können dann auf andere Produkte wie ima und WorkBuddy übertragen werden. Die Fähigkeiten, die in einem Produkt trainiert werden, können andere Produkte auch besser machen.
Genauer gesagt, behandelt Yuanbao die Prompt-Verteilung in der realen Welt. Die Fragen, die Benutzer in Yuanbao stellen, sind oft unklar und bestehen vielleicht nur aus ein paar Sätzen, und sie stellen immer wieder Nachfragen.
Die Fähigkeiten in der mehrfachen Dialogführung und der Absichtserkennung, die in diesen Szenarien trainiert werden, können direkt auf das Verständnis des Kontexts bei der Bearbeitung von Gruppenchat-Aufgaben in WeChat-AI übertragen werden.
WorkBuddy sammelt Daten aus dem Bürokooperationsszenario.
Es versteht die Semantik von Unternehmensszenarien wie Dokumentstrukturen, Meetingprotokollen und Aufgabenverteilung. Diese Fähigkeiten ermöglichen es WeChat-AI, beim Bearbeiten von Aufgaben Schlüsselinformationen zu extrahieren und Entscheidungspunkte zu erkennen.
ima sammelt Suchfähigkeiten. Es trainiert das Modell, wie man eine unklare Suchanfrage in eine genaue Suchstrategie umwandelt und wie man aus einer Vielzahl von Ergebnissen die relevanten Informationen auswählt. Diese Fähigkeiten ermöglichen es WeChat-AI, vor dem Aufruf von Mini-Programmen eine Informationsauswahl und Absichtsklärung durchzuführen, so dass WeChat-AI nicht alle möglichen Mini-Programme aufruft und Zeit und Token verschwendet, sondern nur die wenigen, die tatsächlich benötigt werden.
Marvis trainiert die Fähigkeit zur Aufgabenaufteilung und Werkzeugsteuerung.
Marvis teilt die Benutzerbefehle in mehrere Teilaufgaben auf und steuert verschiedene Agenten, um Dateien, Systeme und Anwendungen zu bedienen. Diese Fähigkeit zur Aufgabenplanung und Mehragenten-Koordination ermöglicht es WeChat-AI, bei Aufgaben wie "Bestelle mir Kaffee und benachrichtige meine Kollegen" zu wissen, wie man Mini-Programm-Aufrufe, Zahlungsprozesse und Nachrichtenbenachrichtigungen miteinander verknüpft.
Diese Produkte liefern verschiedene Daten, aber diese Daten können sich gegenseitig ausbreiten und übertragen, um ein netzartiges System zu bilden. Die Daten, die in einem Produkt trainiert werden, können durch die Generalisierungsmechanismen der Vor- und Nachtraining verbessern die Leistung eines anderen Produkts.
WeChat-AI befindet sich jetzt im Zentrum eines AI-Netzwerks.
Es muss nicht von Grund auf neu aufgebaut werden, sondern kann direkt auf diese bereits bewährten Fähigkeiten zurückgreifen.
Wichtiger noch ist, dass WeChat selbst ein vollständiges Ökosystem ist. Es hat eine Beziehungsstruktur, Mini-Programme, einen Transaktionszyklus mit WeChat Pay und einen Inhaltsökosystem mit öffentlichen Accounts und Video-Kanälen. Dies ist etwas, was andere Agent-Produkte nicht haben.
03
Wie groß ist die Bühne für WeChat-AI?
All dies wird derzeit