Ein weiteres chinesisches Flaggschiff-Modell wird Open Source: Ausländische Nutzer: Vier große chinesische AI-Open-Source-Unternehmen sind entstanden

Die Ökosystem der inländischen Open-Source-Modelle ist beispiellos blühend.

In den letzten Wochen hat es einen Konzentrationsschub bei chinesischen Open-Source-Modellen gegeben. Große Internet-Unternehmen und AI-Unternehmen haben ihre eigenen Open-Source-Bomben auf den Markt geworfen und sich um die Spitze in der globalen Open-Source-Modellliste gerungen. Und in dieser Woche ist wieder ein chinesisches Open-Source-Modell weltweit beliebt geworden.

Dieses Modell stammt von Zhipu, das als "chinesisches OpenAI" bekannt ist. Es ist das neueste Flaggschiffmodell GLM-4.5. Die Veröffentlichung war auch sehr opportun - genau vor der angeblichen Veröffentlichung von OpenAIs GPT-5. Es setzt ebenfalls auf Fähigkeiten wie Inferenz, Programmierung und Agentenfähigkeiten.

Zhipu hat jedoch durch die Open-Source-Strategie einen Vorsprung erlangt und bereits im In- und Ausland eine Welle von Aufmerksamkeit erhalten. Der offizielle Ankündigungspost hat über 770.000 Aufrufe und wurde auch von dem CEO der Open-Source-Hosting-Plattform HuggingFace geteilt.

Weniger als 48 Stunden nach der Veröffentlichung hat GLM-4.5 die erste Stelle in der HuggingFace-Trendliste erreicht und ist damit eines der am meisten beachteten Open-Source-Modelle weltweit. GLM-4.5-Air liegt an der sechsten Stelle. Bil Gurley, Partner der Silicon Valley Venture Capital Firma BenchmarK, schrieb in einem Beitrag: Die kombinierte Wirkung der chinesischen Open-Source-AI-Modelle ist sehr stark. Die Modelle können sich gegenseitig verbessern, und die Einführung neuer Modelle ist einfacher.

Es ist bemerkenswert, dass um die Zeit der WAIC herum die Open-Source-Initiativen chinesischer Large Language Modelle ins Rampenlicht gerückt sind. Das K2 von Yuezhianmian und mehrere Modelle von Alibaba haben beeindruckende Leistungen gezeigt, und dann hat das Zhipu GLM-Modell die Waffe aufgenommen. Heute sind fast alle in der Hugging-Face Open-Source-Modellliste in den ersten zehn Plätzen chinesische Large Language Modelle. CNBC meint, dass die von chinesischen Unternehmen entwickelten KKI-Modelle nicht nur eine höhere Intelligenz aufweisen, sondern auch die Nutzungskosten stetig sinken.

Ein ausländischer AI-Blogger hat sogar ein anschauliches Mem-Grafik erstellt, um die gegenwärtige Entwicklung der AI-Wettbewerbssituation zu beschreiben: Die globalen Large Language Modelle haben sich nun in die Open-Source-Szene, repräsentiert durch chinesische Modelle, und die Closed-Source-Szene, repräsentiert durch amerikanische Modelle aufgeteilt. In letzter Zeit, nach DeepSeek und Qwen, haben auch chinesische Modelle wie Kimi und GLM in der Open-Source-Szene aufgetaucht und die chinesische Open-Source-Szene verstärkt. Es scheint, dass sich die "vier Helden der chinesischen AI-Open-Source" gebildet haben, die sich den "vier Stärken der Closed-Source", bestehend aus GPT, Claude, Gemini und Grok, widersetzen.

GLM-4.5 ist als Agenten-Basis-Modell mit Fähigkeiten in Inferenz, Programmierung und Agentenfähigkeiten konzipiert. In 12 Benchmark-Tests, die Szenarien wie Inferenz, Programmierung und Agentenfähigkeiten umfassen, hat GLM4.5 eine weltweite Open-Source-Modell-SOTA (d. h. Platz 1), erster chinesischer Platz und dritter globaler Platz erreicht.

Auf der Liste hinaus hat Zhipu die Agenten-Programmierfähigkeit des Modells in realen Szenarien getestet und es mit Modellen wie Claude-4-Sonnet, Kimi-K2 und Qwen3-Coder verglichen. Um die Transparenz der Bewertung sicherzustellen, hat Zhipu alle 52 Aufgaben und Agenten-Trajektorien, die in den obigen Tests involviert waren, veröffentlicht, damit die Branche die Tests wiederholen und verifizieren kann. Dies hat auch die Zustimmung der Netizens erhalten.

Zugleich bietet Zhipu für das Modell eine sehr kostengünstige API-Preisgestaltung an. Die API-Aufrufpreise liegen bei nur 0,8 Yuan pro Million Tokens für die Eingabe und 2 Yuan pro Million Tokens für die Ausgabe; die Hochgeschwindigkeitsschnittstelle kann bis zu 100 Tokens pro Sekunde erreichen. Darüber hinaus können Benutzer die volle Version von GLM-4.5 kostenlos auf Zhipu Qingyan und z.ai nutzen.

In letzter Zeit hat Zhidongxi die verschiedenen Fähigkeiten von GLM-4.5 intensiv getestet. Das Modell hat in der praktischen Produktion überraschende Ergebnisse erzielt.

Testlink:

https://chatglm.cn

https://chat.z.ai/

Modell-Repository:

https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b

01. Echtzeit-Test von GLM-4.5: Ein Satz für eine vollständige Datenbank, klarer Denkprozess

Anzahl von chinesischen und ausländischen Nutzern haben bereits GLM-4.5 getestet, um es zu nutzen, um einen persönlichen AI-Trainer für Fitness, Webspiele, 3D-Animationen usw. zu erstellen. Seine Fähigkeiten in Programmierung und der Bewältigung komplexer Aufgaben mit langen Sequenzen haben einen tiefen Eindruck hinterlassen.

Dies ist auf die Agentenfähigkeiten von GLM-4.5 zurückzuführen. Im Vergleich zu traditionellen statischen Aufgaben wie Fragen und Antworten, Zusammenfassungen und Übersetzungen stellen Agentenaufgaben strengere und umfassendere Anforderungen an das Modell. Sie zeigen die Schlüsselfaktoren von Large Language Modellen in Bereichen wie Wahrnehmung, Gedächtnis, Planung und Ausführung und bilden die Grundlage für zukünftige mehrdimensionale Fähigkeiten.

Agentenaufgaben befassen sich oft mit offenen Umgebungen und erfordern, dass das Modell kontinuierliche Wahrnehmung, Langzeitplanung und Selbstkorrektur kann. Darüber hinaus sind Agentenaufgaben komplexe Prozesse, die nicht nur Sprachverarbeitungsfähigkeiten erfordern, sondern auch die Koordination von Tools, die Ausführung von Code, die Bedienung von Schnittstellen und sogar mehrmalige Interaktionen. Dies ist eine echte Prüfung der Gesamtkoordinationsfähigkeit des Modells. Aus diesem Grund kann man sagen, dass Agentenaufgaben nicht nur eine gewöhnliche Aufgabe sind, sondern auch eine "Stresstest".

Full-Stack-Entwicklung ist ein typisches Beispiel für eine Agentenaufgabe. Um die relevanten Fähigkeiten zu testen, hat Zhidongxi GLM-4.5 eine relativ vollständige Entwicklungsaufgabe gestellt - die Erstellung einer bilingualen (Chinesisch-Englisch) Glossardatenbank mit PHP + MySQL, die die Funktionen zum Hinzufügen, Löschen, Bearbeiten und Abfragen von Einträgen hat. Einer der Schwierigkeiten dieser Aufgabe besteht darin, dass das Modell die Projektstruktur selbst planen, die Funktionsanforderungen klar definieren und die Datenbankdesignen ausarbeiten muss, so wie ein echter Ingenieur alles umfassend überdenken und Probleme lösen muss.

Zhidongxi hat ähnliche Aufgaben auch anderen Modellen gestellt. Viele Modelle konnten jedoch die Projektstruktur nicht vernünftig planen und haben sogar versucht, alle Funktionen in einer einzigen Webseite zu entwickeln. Daher konnten die Ergebnisse nicht in der Produktion eingesetzt werden, geschweige denn weiter modifiziert oder erweitert werden.

Erstaunlicherweise hat GLM-4.5 ein relativ vollständiges Ergebnis geliefert, die festgelegten Funktionen realisiert und dies auch recht schnell. Innerhalb von etwa zwei Minuten hat es die Entwicklung von drei Kernseiten abgeschlossen. Das Ergebnis der Endausführung sieht wie folgt aus:

Dieses Ergebnis ist möglicherweise auf den klaren Denkprozess von GML-4.5 vor der Codegenerierung zurückzuführen: Es hat genau die Projektart erkannt und gewusst, welche Dateien erstellt werden sollten, was eine klare Anleitung für die anschließende Entwicklung bot. Der Denkprozess war auch nicht umständlich, sondern einfach und klar.

Teil der Dialogaufzeichnung: https://chat.z.ai/s/50e0d240-2034-407b-a1b3-94248dd5f449

Das offizielle Demo von Zhipu zeigt noch mehr Fähigkeiten von GLM-4.5. Beispielsweise kann es die UI-Oberflächen von Websites wie YouTube, Google und Bilibili genau nachbauen, was für Demonstrationszwecke nützlich ist.

Dialogaufzeichnung: https://chat.z.ai/s/01079de2-a76d-41ee-b6ee-262ea36c4df7

Oder es kann eine Website erstellen, auf der Benutzer selbst Labyrinthe entwerfen können und das System den Weg sucht.

Dialogaufzeichnung: https://chat.z.ai/s/94bd1761-d1a8-41c9-a2f4-5dacd0af88e9

Diese Full-Stack-Fähigkeiten können nicht nur in der praktischen Produktion eingesetzt werden, sondern auch für Spaß verwendet werden. Das offizielle Zhipu hat eine "Quanten-Güteschenke-Kiste" erstellt, die tatsächlich interagieren kann und die Daten im Hintergrund speichert.

Allerdings ist der Entwicklungsprozess von GML-4.5 für die obigen Projekte möglicherweise noch interessanter. Wenn man sich die Ausführungsverläufe der Agenten ansieht, kann man sehen, dass GLM-4.5 Aufgaben end-to-end besser erledigen kann, nachdem es mit Entwicklungstools kombiniert wurde. Es erstellt zunächst eine To-Do-Liste, erledigt dann Schritt für Schritt die Aufgaben, fasst den Entwicklungsfortschritt zusammen und führt bei Änderungsvorschlägen des Benutzers eine umfassende Überprüfung und Fehlersuche durch.

Dialogaufzeichnung: https://chat.z.ai/s/1914383a-52ac-48b7-9e92-fa105be60f3e

GLM-4.5 hat auch in der PPT-Erstellung gute Fähigkeiten gezeigt. Es kann eine vollständige und ansprechende PPT gemäß den Seitenanzahl- und Inhaltsanforderungen des Benutzers erstellen und die visuelle Erfahrung der PPT mit Suchtools verbessern. Beispielsweise hat GLM-4.5 für den legendären Sprintläufer Usain Bolt eine PPT zur Rückschau auf seine Karriere erstellt, wie in der folgenden Abbildung zu sehen ist.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Ein weiteres chinesisches Flaggschiff-Modell wird open source gemacht. Ausländische Internetnutzer sagen: Die vier großen chinesischen AI-Open-Source-Unternehmen haben sich gebildet.

01. Echtzeit-Test von GLM-4.5: Ein Satz für eine vollständige Datenbank, klarer Denkprozess