Lin Junyang veröffentlichte erstmals einen langen Artikel nach seinem Austritt aus Qianwen: KI schreitet von "deduktivem Denken" hin zu "Agenten-Denken"
Bildquelle: Jiemian Bildergalerie, Fan Jianlei
Am 26. März veröffentlichte Lin Junyang, der ehemalige Technologieverantwortliche des Alibaba Qianwen Large Language Models, auf einer sozialen Plattform seinen ersten ausführlichen Artikel nach seinem Ausscheiden. In diesem Artikel enthielt er keine Informationen über seine zukünftige Berufsplanung, sondern teilte seine technologischen Überlegungen, konzentrierte sich auf die Entwicklung der Large Language Model - Technologie und die Vorhersage der nächsten Phase der Künstlichen Intelligenz, was weite Aufmerksamkeit in der Branche erregte.
In diesem Artikel mit dem Titel From "Reasoning" Thinking to "Agentic" Thinking (Von "deduktivem Denken" zu "Agenten - Denken") erklärte Lin Junyang, dass die Branche in den letzten zwei Jahren ihre Bewertungsweise und die Kernerwartungen für Large Language Models neu definiert habe.
Er wies darauf hin, dass sich der Fokus der Branche im ersten Halbjahr 2025 hauptsächlich auf "deduktives Denken" konzentrierte. Das heißt, durch Techniken wie verstärktes Lernen sollte das Modell nach einer gegebenen Eingabe durch interne logische Schlussfolgerungen eine strenge Schlusskette generieren, um die Genauigkeit der Antworten zu verbessern. OpenAIs o1 und DeepSeek - R1 sind typische Vertreter dieses Paradigmas. "Im ersten Halbjahr 2025 beschäftigte sich die Branche damit, wie man das Modell dazu bringt, 'ein bisschen länger nachzudenken'. Jetzt ist es an der Zeit, über den nächsten Schritt nachzudenken."
Er meinte, dass "Agenten - Denken" der Kern der nächsten Phase der Künstlichen Intelligenz sei. Das Modell sei nicht länger auf interne statische Schlussfolgerungen beschränkt, sondern denke für Handlungen und aktualisiere kontinuierlich seine Pläne in der Interaktion mit der Umwelt und anhand der Rückmeldungen aus der Welt.
Lin Junyang teilte auch die praktischen Erfahrungen des Qianwen - Teams. Er erwähnte, dass das Qianwen - Team Anfang 2025 den großen Wunsch gehabt habe, ein einheitliches System zu entwickeln, das das Denkmodell und das Befehlsmodell vereint. Diese Richtung sei richtig. Aber er sagte auch, dass die Vereinigung der beiden Modelle in der Praxis bisher nicht sehr erfolgreich gewesen sei. Das Kernproblem liege nicht in der Kompatibilität der Modelle, sondern in den signifikanten Unterschieden in der Datenverteilung und den Verhaltenszielen der beiden Modelle: Deduktive Modelle hätten auf logisch strenge und verifizierbare Daten angewiesen, während Agenten - Modelle vollständige Interaktionsdaten benötigten. "Eine wirklich erfolgreiche Vereinigung erfordert ein glattes Spektrum der Schlussfolgerungsstärke."
Er meinte, dass eine längere Schlusskette nicht automatisch bedeutet, dass das Modell intelligenter sei. Oftmals zeige eine längere Schlusskette eher an, dass das Modell Rechenleistung verschwende.
Er erwähnte, dass das Qianwen - Team erkannt habe, dass die Branche aus der Zeit des Trainierens von Modellen in die Zeit des Trainierens von Agenten eintritt. Das definierende Merkmal sei die geschlossene Interaktion mit der realen Welt. Das Kernproblem des Agenten - Denkens habe sich von "kann das Modell lang genug denken" zu "kann das Modell auf eine Weise denken, die effektive Handlungen ermöglicht" gewandelt.
Er schätzte, dass das Agenten - Denken die vorherrschende Denkform werden werde. Die Modellarchitektur und die Trainingsdaten seien natürlich immer noch wichtig, aber auch die Umgebungsgestaltung, die Rollout - Infrastruktur, die Robustheit des Evaluators und die Koordination zwischen mehreren Agenten seien in den Kernbereich gerückt.
Am 4. März kündigte Lin Junyang auf sozialen Medien öffentlich an, dass er seine Position bei Qianwen aufgegeben habe. Am gleichen Tag gaben auch Yu Bowen, der Verantwortliche für das Nach - Training von Qwen, und Li Kaixin, ein Kernbeitragender von Qwen 3.5/VL/Coder, ihre Kündigung bekannt.
Am 5. März reagierte Wu Yongming, der CEO der Alibaba - Gruppe, in einer internen E - Mail. Die Firma habe beschlossen, Lin Junyangs Kündigung zu genehmigen und dankte ihm für seine bisherigen Beiträge. Zhou Jingren, der CTO von Alibaba Cloud und der Leiter des Tongyi - Labors, werde weiterhin das Tongyi - Labor leiten, um die nachfolgenden Arbeiten voranzutreiben. Gleichzeitig werde die Firma eine Unterstützungsgruppe für Basis - Modelle gründen, um die Ressourcen der Gruppe zur Unterstützung der Basis - Modellentwicklung zu koordinieren.
Lin Junyang wurde 1993 geboren und war einst der jüngste Technologieexperte der Stufe P10 bei Alibaba. Er absolvierte seinen Masterstudium an der Fakultät für Fremdsprachen der Peking - Universität und trat 2019 als Senior - Algorithmusingenieur in das Alibaba DAMO Academy ein. Er beteiligte sich schrittweise an der Entwicklung von Kernmodellen wie M6 und OFA. Nach der Gründung des Tongyi - Labors Ende 2022 wurde er zum Technologieverantwortlichen des Qianwen Large Language Models ernannt und führte das Team bei der Entwicklung der Open - Source - Modelle der Qwen - Serie an. Bis zu seinem Ausscheiden hatten die Qwen - Modelle weltweit über 600 Millionen Downloads und es gab über 200.000 abgeleitete Modelle.
Dieser Artikel stammt von "Jiemian News", Autor: Shen Xiaoge, veröffentlicht von 36Kr mit Genehmigung.