Dai Jifeng und Chen Tianqiao starten gemeinsam mit AGI ihre Premiere und rocken die Bühne! Das stärkste Open-Source-Tiefenforschungsmodel liefert in den GAIA-Tests 82,4 Punkte und schlägt OpenAI.
Bai Jiao, geschrieben aus Aofeisi. Quantum Bit | Offizielles WeChat-Konto QbitAI
Das stärkste Open-Source-Tiefenforschungsmodel ist da.
MiroMind ODR (Open Deep Research) ist das erste technische Projekt von Dai Jifeng seit seiner Übernahme bei Chen Tianqiao.
Zunächst hat es die stärkste Leistung erreicht. Das Ergebnis des GAIA-Tests liegt bei 82,4 Punkten, was es über zahlreiche Open-Source- und Closed-Source-Modelle hinausführt, darunter Manus und OpenAIs DeepResearch.
Zweitens ist es wirklich vollständig Open-Source und reproduzierbar. Sein Kernmodell, die Daten, der Trainingsablauf, die AI-Infrastruktur und der DR-Agent-Frameworks sind alle Open-Source.
Laut Dai Jifengs Freundeskreisbeiträgen werden sie ein monatliches Open-Source-Update aufrechterhalten. Dieses Projekt ist das Ergebnis eines vierteljährlichen Einsatzes seines Teams.
Aus den von ihnen bereitgestellten Demos scheint es, dass alles auf Mobilgeräten durchgeführt wird. Daher besteht die Möglichkeit, dass sie es später auch auf Mobilgeräten bereitstellen.
Derzeit haben sie auch eine Demo zur Verfügung, die man testen kann.
Das stärkste Open-Source-Tiefenforschungsmodel
Im Demo-Bereich steht die folgende Beschreibung: Wir stellen keine KI bereit (wir transportieren nur die KI), sondern bauen sie gemeinsam mit Ihnen auf.
Okay, nun zur Projekt-Erfahrung. Derzeit ist es noch in einem frühen Stadium und unterstützt nur einzelne Dialoge und englische Eingaben.
Wählt man einfach eine der empfohlenen Fragen aus, kann man deutlich unterscheiden, wo der Denkprozess und wo das Endergebnis sind.
Links vom Denkprozess gibt es eine Navigationshilfe für den Workflow, mit der man bestimmte Schritte anzeigen lassen kann.
Während des Prozesses kann man sehen, dass es Internetrecherchen unterstützt.
Das Endergebnis wird auch recht klar dargestellt.
Im Vergleich zu bestehenden Tiefenforschungsmethoden hat das MiroMind ODR-Projekt alle Phasen der Tiefenforschung geöffnet, einschließlich vier Teilprojekten:
MiroFlow (Agent-Framework), MiroThinker (Modell), MiroVerse (Daten) und MiroTrain (Trainingsinfrastruktur).
MiroFlow unterstützt den Aufruf vieler gängiger Tools, erweitert das Large Language Model und ermöglicht Tools-unterstützte Tiefenforschungsinferenz. Sein Highlight ist die stabile Reproduktion der besten Leistung, nämlich die 82,4 Punkte im GAIA-Test.
MiroThinker ist ein Large Language Model, das von Natur aus Tools-unterstützte Inferenz unterstützt. Es ist trainierbar und reproduzierbar und hat die beste Leistung im GAIA-Test.
Außerdem hat es eine SOTA-Leistung (60,2 %) auf GAIA-Text-103 erreicht, was nahe an OpenAIs Deep Research liegt.
MiroVerse bietet 147.000 Open-Source-Trainingsdaten für die Tiefenforschungstraining. Darüber hinaus wird das Team auf die Rückmeldungen der Community achten und monatlich hochwertige und tiefergehende Forschungsdatensätze bereitstellen.
MiroTrain unterstützt das stabile und effiziente Training von Tiefenforschungsmodeln, deckt den gesamten Deep-Research-Trainingsablauf ab und unterstützt das Training mit langen Texten und RL-Tools.
Aber neben diesem Projekt gibt es auch das MiroMind-M1 auf GitHub, das sie vor einigen Wochen entwickelt haben.
MiroMind-M1 ist eine Reihe von vollständig Open-Source-Inferenz-Sprachemodellen auf Basis von Qwen-2.5, die sich auf die Verbesserung der mathematischen Inferenzfähigkeit konzentrieren.
Dieses Modell wurde durch überwachtes Finetuning (SFT) auf 719.000 sorgfältig ausgewählten Fragensätzen trainiert und durch Reinforcement Learning mit überprüfbaren Belohnungen (RLVR) auf 62.000 herausfordernden Beispielen optimiert, wobei die kontextbasierte mehrstufige Strategieoptimierungsmethode (CAMPO) verwendet wurde.
Bei AIME24, AIME25 und MATH500 hat es die beste Leistung unter den Open-Source-Modellen auf Basis von 7B Qwen-2.5 erreicht.
Dai Jifengs erstes Projekt nach seiner Übernahme bei Shanda
Die zentrale Figur in diesem Projekt ist natürlich Dai Jifeng, ein Renommierter in der Branche.
Seine persönliche Website zeigt immer noch seine Position als Assistentprofessor an der Fakultät für Elektrische Ingenieurwesen der Tsinghua-Universität an.
Öffentliche Informationen zeigen, dass Dai Jifeng über 80 Artikel in internationalen Zeitschriften und Konferenzen in den Bereichen Computervision und Deep Learning veröffentlicht hat, und seine Artikel wurden insgesamt über 60.000 Mal zitiert.
Er ist der Autor des R-FCN-Objekterkennungsalgorithmus und der Deformable ConvNets. Das R-FCN wurde als "eines der drei Meta-Modelle für die Zielerkennung" bewertet; die von ihm entwickelten Deformable ConvNets übertreffen die Leistung der visuellen Large Language Modelle von Microsoft, Meta, Google und anderen Institutionen.
Das von ihm geleitete InternVL-Multimodal-Basis-Modell ist eines der einflussreichsten Open-Source-Multimodal-Basis-Modelle und wird in der Industrie und der Wissenschaft weit verbreitet eingesetzt. Die Anzahl der Downloads auf Hugging Face hat 10 Millionen überschritten.
Im Jahr 2009 und 2014 hat er an der Fakultät für Automatisierung der Tsinghua-Universität seinen Bachelor- und Doktorgrad in Ingenieurwissenschaften erworben.
Anschließend arbeitete er in der Visuelle Gruppe des Microsoft Research Asia als Chef-Forscher und Forschungsmanager.
Im Jahr 2019 wechselte er in das Forschungsinstitut von SenseTime und übernahm die Position des leitenden Forschungsdirektors. Bis 2022 kehrte er in die akademische Welt zurück und wurde Assistentprofessor.
Seine Entscheidung, erneut in die Geschäftswelt zurückzukehren, ist für die AGI.
Laut einer Meldung von Kechuangban Daily hat er Shanda Networks, einer Tochtergesellschaft von Chen Tianqiao, beigetreten und bereitet eine neue KI-Startup-Gesellschaft vor, deren Ziel es ist, ein zweites DeepSeek zu schaffen und grundlegende Forschungen rund um die AGI durchzuführen.
Diese Gesellschaft hat drei Forschungsschwerpunkte: Die Intelligenz von KI-basierten Geschäftsentscheidungen, die Inhaltsverteilung außerhalb des Algorithmen-Silos und die KI-Dienste für die alternde Bevölkerung und die junge Generation.
Aber auch auf der offiziellen Website von MiroMind kann man einige Hinweise entnehmen. Ihre Mission lautet: Wir schaffen ein digitales Lebewesen mit Selbstbewusstsein, das gemeinsam mit der Community evolviert, um sicher und nützliche AGI für alle Menschen zu erreichen.
Somit ist das MiroMind ODR sowohl die offizielle Präsentation von MiroMind als auch Dai Jifengs erstes technisches Projekt im Bereich der AGI.
Blog: https://miromind.ai/blog/miromind-open-deep-researchDemo: https://dr.miromind.ai/GitHub: https://github.com/MiroMindAIHugging Face: https://huggingface.co/miromind-ai
Dieser Artikel stammt vom offiziellen WeChat-Konto "Quantum Bit". Autor: Fokus auf führende Technologien. 36Kr hat die Veröffentlichung mit Genehmigung vorgenommen.