StartseiteArtikel

Meituan dreht seine AI-Strategie um, Pan Xin, der ehemalige Leiter der AI-Plattform für visuelle Modelle von ByteDance, tritt bei ein | Exklusivbericht von Intelligence Emergence

咏仪2025-12-10 14:16
Unter dem Druck des Wettstreits im Lieferdienstbereich führt Meituan einen harten Kampf für die künstliche Intelligenz-Infrastruktur.

Text | Deng Yongyi

Redaktion | Su Jianxun, Yang Xuan

Nach exklusiven Informationen aus mehreren Quellen von "Intelligente Entstehung" hat Pan Xin, der ehemalige AI-Partner von Flash Extreme und der ehemalige Leiter der Plattform für große visuelle KI-Modelle von ByteDance, kürzlich der Gruppe Meituan beigetreten.

Pan Xin war einst Forscher bei Google DeepMind und trug zur Entwicklung des dynamischen Graphenmodus von TensorFlow bei. Nach seiner Rückkehr in China arbeitete er nacheinander bei Baidu, Tencent und ByteDance.

Bei Baidu leitete er die Optimierung der PaddlePaddle-Plattform und den Aufbau des Wuliang Deep Learning Frameworks. Danach war er Leiter der AIGC- und großen visuelle KI-Modelle-Plattform bei Tencent und ByteDance, wobei seine Geschäftstätigkeit hauptsächlich auf dem Multimodalbereich konzentriert war. Im November 2024 trat Pan Xin dann bei Flash Extreme Technology ein und übernahm die Rolle des AI-Partners, bei der er die gesamte AI-Technologieentwicklung und das Projekt für intelligente Brillen verantwortete.

Nach exklusiven Informationen von "Intelligente Entstehung" ist Pan Xin seit seinem Eintritt bei Meituan für die Innovationsarbeit in der Multimodal-KI zuständig und hat die Entwicklung mehrerer relevanter Anwendungen wie der LongCat App geleitet.

Das Schlüsselwort für Meituan im Jahr 2025 war der Lieferdienst-Kampf und die KI.

"Meituans strategische Positionierung in Bezug auf KI-Technologie ist eine aggressive Offensive, nicht eine passive Verteidigung." sagte Wang Xing einst. Auf der Telefonkonferenz im ersten Quartal 2025 gab Meituans Gründer Wang Xing erstmals die Fortschritte des großen KI-Modells LongCat (Hibiskusmaki) von Meituan bekannt.

Er sagte einst, dass Meituans KI-Strategie auf drei Ebenen aufgebaut ist:

  • AI at work, bei der KI hauptsächlich in der Arbeit und dem Betrieb aller Mitarbeiter eingesetzt wird;
  • AI in products, bei der bestehende 2B- und 2C-Produkte und -Dienste mit KI verbessert und völlig neue KI-native Produkte geschaffen werden;
  • und Building LLM (großes Sprachmodell), bei der aktiv in Capex (Kapitalausgaben) investiert wird, um die Fähigkeiten des selbst entwickelten Basismodells zu verbessern.

Ab dem zweiten Quartal dieses Jahres hat jedoch in China ein heftiger Lieferdienst-Kampf begonnen. Unter Druck hat Meituan seine begrenzten Ressourcen zunächst auf das Training des Basismodells gelegt.

Nach Informationen von Personen, die der Gruppe Meituan nahestehen, hat Meituan im Jahr 2025 seine Rekrutierungsaktivität in Bezug auf das Pre-Training und die Geschäftsebene der KI-Anwendung nicht verringert.

"Dieses Jahr hat Meituan die Rekrutierung von KI-Fachkräften hauptsächlich auf das Modelltraining konzentriert, und die Rekrutierungsstandards waren auch sehr hoch. Die Fachkräfte stammen hauptsächlich aus den Teams von Alibaba Tongyi, Seed und Tencent Hunyuan." sagte eine informierte Person.

Seit 2025 hat Meituan eine Reihe von Fortschritten in Bezug auf Basismodelle und Anwendungen veröffentlicht, darunter:

  • Im Juni veröffentlichte Meituan sein erstes KI-Programmierprodukt Nocode, über das wir auch exklusiv berichtet haben;
  • Im September veröffentlichte und öffnete Meituan offiziell sein erstes großes Sprachmodell LongCat-Flash-Chat und veröffentlichte das Inferenzmodell LongCat-Flash-Thinking;
  • Im Oktober veröffentlichte Meituan das Video-Generierungsmodell LongCat-Video und öffnete es gleichzeitig;
  • Im November veröffentlichte Meituan das offene Multimodal-Modell LongCat-Flash-Omni;
  • Im Dezember veröffentlichte und öffnete Meituan drei Bildmodelle LongCat‑Image, LongCat‑Image‑Dev und LongCat‑Image‑Edit.

Man kann erkennen, dass Meituan in diesem Jahr im Wesentlichen den Aufbau des gesamten Multimodal-Basismodells von Sprachmodellen bis hin zu visuellen, audio- und video-basierten Modellen abgeschlossen hat.

Der Aufbau der Basisfähigkeiten ist in gewisser Weise auch der Vorbereitung für die KI-Umwandlung von Meituans Kerngeschäften. Ab dem zweiten Halbjahr 2025 hat Meituan die Umsetzung von KI-Anwendungen deutlich beschleunigt, wobei es sich stärker auf die KI-Umwandlung der Kerngeschäfte konzentriert hat.

Beispielsweise hat Meituan im Oktober KI-Tools wie "Kangaroo Advisor" und "Intelligent Manager" für Gastronomiebetriebe eingeführt und sie allen Betrieben in der Branche kostenlos zur Verfügung gestellt.

Derzeit rekrutieren alle Geschäftsebenen von Meituan, einschließlich der Finanz-, Kundendienst- und E-Commerce-Ebenen, stark KI-Anwendungsfachkräfte, wobei der Schwerpunkt auf dem Post-Training und der kommerziellen Umsetzung liegt.

Früher waren Meituans KI-Anwendungsinnovationen hauptsächlich auf einige unabhängige KI-To-C-Anwendungen wie Wow und Miaosha konzentriert, die alle Innovationen außerhalb der Kerngeschäfte waren. Jetzt hat sich diese To-C-Entwicklung eingeschränkt.

Ein Indiz dafür ist, dass der ehemalige Gründer Wang Huiwen das große Modellunternehmen "Guangnian Zhiwai" gründete, das von Meituan übernommen wurde. Dieses Team wird jetzt unter dem Namen GN06 betrieben. Laut Berichten von Leifeng.com wurde der ehemalige Leiter von "Guangnian Zhiwai", Liu Jiong, im November nach Meituan versetzt und berichtet direkt an Meituans Plattformleiter Li Shubin. In letzter Zeit hat auch die Rekrutierungsaktivität dieses Teams abgenommen.

Coverquelle | IC photo

👇🏻 Scannen Sie den Code, um der "Intelligente Entstehung KI-Austauschgruppe" beizutreten 👇🏻

Herzlich willkommen zum Austausch

Dieser Artikel stammt aus dem WeChat-Account "Intelligente Entstehung", Autor: Deng Yongyi, veröffentlicht von 36 Kr mit Genehmigung.