Das kleine Modell Qianwen 3.5 wird viermal nacheinander veröffentlicht, das Intelligenzdichtekennzeichen erreicht ein neues Hoch und entfacht die Edge-AI.
Am 3. März wurde bekannt gegeben, dass Alibaba gestern Abend vier kleine Qwen 3.5-Modellserien open source gemacht hat, darunter Qwen3.5-0.8B/2B/4B/9B. Dank der technologischen Innovation und des Durchbruchs in der Modelltechnologie sind die kleinen Qwen 3.5-Modelle auch äußerst leistungsstark: Die Gesamtleistung des Qwen3.5-9B-Modells ist mit der von Modellen vergleichbar, die um das Zehnfache mehr Parameter haben; Die Agent-Fähigkeiten des Qwen3.5-4B-Modells sind besser als die einiger internationaler Mainstream-Modelle und eignen sich daher hervorragend als multimodale Basis für leichte Agenten. Die Qwen3.5-0.8B/2B-Modelle sind klein und schnell und eignen sich besonders für die Implementierung auf Endgeräten wie Mobiltelefonen und Smartbrillen.
Dank der Innovation in der Modellarchitektur und des Durchbruchs in der Trainingstechnologie hat Qwen 3.5 erstmals in einem kleinen dichten (Dense) Modell eine starke native multimodale Fähigkeit erreicht. Sowohl das Intelligenzniveau als auch die visuelle Verständnisfähigkeit des Modells wurden verbessert. Selbst kleine Modelle erreichen nun die Leistungsebene mittlerer und sogar großer Modelle, und die Intelligenzdichte hat einen neuen Höchststand erreicht. In mehreren autoritativen Tests, die Anweisungserfüllung (IFBench), Doktoratsniveau-Schlussfolgerung (GPQA), mathematische Schlussfolgerung (HMMT 25), körperliche Schlussfolgerung (ERQA), komplexes Dokumentenverständnis (OmniDocBench) und andere Aspekte umfassen, ist die Leistung des Qwen3.5-9B-Modells mit der von Modellen wie Qwen3-Next-80B-A3B-Thinking vergleichbar, die um das Zehnfache größer sind. Es ist deutlich besser als internationale Mainstream-Leichtmodelle und eine sehr kostengünstige Wahl für ein universelles Modell.
Das noch kleinere 4B-Modell erreicht ein perfektes Gleichgewicht zwischen Leistung und Ressourcenverbrauch. Es hat starke Agent-Fähigkeiten und eignet sich als multimodale Basis für leichte Agenten. Im Test des visuellen Agenten (ScreenSpot pro) ist die Leistung des Qwen3.5-4B-Modells mit der des Qwen3-VL-30B-A3B-Modells vergleichbar, das fast achtmal größer ist. Es kann wie ein echter Mensch Mobiltelefone und Computer autonom bedienen. Im Test der Werkzeugaufrufe (TIRE-Bench) ist die Leistung des Qwen 4B-Modells deutlich besser als die aktueller internationaler Mainstream-Modelle. Die extrem kleinen Qwen3.5-0.8B/2B-Modelle sind klein und haben eine schnelle Inferenzgeschwindigkeit. Sie können direkt auf Endgeräten wie Mobiltelefonen, Tablets, intelligenten Fahrzeugcockpits und tragbaren Geräten implementiert werden und eröffnen möglicherweise neue Möglichkeiten für Endgeräte-AI-Anwendungen wie offline-Sprachinteraktion, lokale Dokumentenanalyse und Echtzeitwahrnehmungsentscheidungen. Einige Experten sagen, dass mit der Veröffentlichung der kleinen Qwen 3.5-Modelle in Zukunft die Kernanwendungsfälle von KI auf Endgeräten explodieren werden.
Derzeit hat Qwen 3.5 acht neue Modelle open source gemacht, die alle "mit Kleinem Große besiegen". Dies ist auch die Verbesserung der "Intelligenzdichte", die Musk beeindruckt hat, indem sie mit weniger Rechenleistung stärkere Intelligenz bietet. Das am Silvesterabend veröffentlichte neue native multimodale Basismodell Qwen3.5-397B-A17B mit weniger als 400 Milliarden Parametern übertrifft das vorherige Qwen 3-Flaggschiffmodell mit Billionen von Parametern. Die drei mittleren Modelle Qwen3.5-35B-A3B, Qwen3.5-122B-A10B und Qwen3.5-27B, die am Ende des letzten Monats open source gemacht wurden, sind leistungsstark und können auf Consumer-Grafikkarten laufen. Im ersten Monat nach der Open-Source-Veröffentlichung dominierte Qwen 3.5 die internationale Open-Source-Modell-Rankingliste und belegte vier der fünf besten Plätze, was die KI-Community in Aufruhr versetzte. Einige Entwickler haben festgestellt, dass ein normaler Laptop mit einem M4-Chip ein mittleres Qwen 3.5-Modell lokal und schnell ausführen kann, und seine Leistung ist mit der von Spitzenmodellen vergleichbar. Einige Entwickler haben erstaunt kommentiert: "Qwen hat es allein geschafft, ein Modell in die Klasse von Claude Sonnet 4.5 in den Computer zu packen - und das kostenlos."
Alibaba setzt auf die umfassende Open-Source-Veröffentlichung von Modellen aller Größen und Modalitäten, die verschiedene Bereiche wie große Sprachmodelle, Mathematik, Programmierung, Sprache und Vision abdecken. Insgesamt hat es mehr als 400 Qwen-Modelle open source gemacht. Die weltweite Downloadzahl hat die Milliardenmarke überschritten, und die Anzahl der abgeleiteten Modelle beträgt über 200.000. Es ist ein weltweit sehr einflussreiches Open-Source-Modell-System.