Nachdem ich das kürzlich von Zhipu veröffentlichte GLM-5 ausprobiert habe, verstehe ich endlich, warum es in Silicon Valley so viel Kopfzerbrechen verursacht.
Die Gerüchte über das mysteriöse Modell "Pony Alpha" haben bereits eine Woche lang im Internet um sich greifen.
Manche sagen, es sei ein Pseudonym von Claude 5, andere behaupten, es sei die geheime Waffe einer großen Firma. Gerade jetzt hat sich das Geheimnis gelüftet: Das neue Modell mit dem Code-Namen "Pony Alpha" ist tatsächlich die Osterwunderwaffe von Zhipu AI - GLM-5.
Screenshot des offiziellen Zhipu-Kanals
Und das beste: Es ist direkt Open Source.
Wenn man sagt, dass das Jahr 2025 das Jahr war, in dem KI das Schreiben von Code lernte, dann steht am Anfang des Jahres 2026, wie der ehemalige Leiter der KI bei Tesla, Andrej Karpathy, prophezeit hat, möglicherweise das Zeitalter des "Agent - Engineering" bevor.
Nur dass es der chinesische Open Source - KI - GLM-5 war, der zuerst ein solches System als Open Source - Infrastruktur umgesetzt hat, anstatt GPT - 5.3 - Codex oder Claude Opus 4.6.
Hier sind die Testadressen:
- Z.ai: https://chat.z.ai
- Zhipu Qingyan APP/Web - Version: https://chatglm.cn
Das Pony Alpha, das Silicon Valley täuschte, war tatsächlich ein Pseudonym von Zhipu GLM - 5
Heute ist es für KI kein Problem mehr, einen Snake - oder Tetris - Code zu schreiben. Wenn man es testen will, muss man etwas Herausfordernderes wählen.
Wir haben an GLM - 5 eine sehr spezifische Anforderung für eine physikalische Simulation gestellt:
Erstelle ein interaktives Simulationsprogramm für ein Satellitensystem mit HTML, CSS und JavaScript. Das Programm soll den Prozess simulieren, in dem ein Satellit Signale an Bodenempfänger sendet. Es soll einen Satelliten um die Erde kreisen lassen und in regelmäßigen Abständen Signale senden, die von mehreren Bodenempfängern empfangen werden.
Anstatt sofort Code zu schreiben, "pause" es kurz (simuliert das Denken) und generierte schließlich eine HTML - Seite, die unseren Anforderungen entsprach. Auf dem Bildschirm bewegte sich der Satellit nicht nur im Kreis, sondern die Signalübertragung hatte sogar eine Wellenausbreitungsanimation, die dem Doppler - Effekt visuell entsprach.
Es verstand die physikalischen Gesetze hinter dem Wort "Simulation", nicht nur die Aktion des "Zeichnens".
Dann haben wir die Schwierigkeit erhöht.
Ein Nutzer namens @scaling01 auf X gab eine sehr hohe Bewertung ab: "Pony - Alpha ist entweder eine AGI oder hat meine SVG - Aufgabenbank auswendig gelernt."
Um dies zu überprüfen, haben wir eine sehr abstrakte Python - Aufgabe getestet: "Visualisiere die Funktionsweise von Verkehrsampeln in einer Einbahnstraße, in der Fahrzeuge mit zufälligen Raten eintreten."
In weniger als 3 Minuten erschien ein dynamisches Verkehrsflussschema.
Die Logik war tadellos: Grünlicht, Fahrzeuge fahren; Rotlicht, Fahrzeuge warten. Die Zufälligkeit des Beschleunigens und Verlangsamens der Fahrzeuge wurde auch sehr gut simuliert. Aber die Ästhetik der Benutzeroberfläche... wie soll man das sagen, sie war wirklich ein wenig "einfältig".
Sogar ein Netzanwender namens @anurudhsharmaa hat mit einem einzigen Prompt eine neue Website erstellt.
Der Netzanwender @zakarinoo7 hat einen voll funktionsfähigen Mediaplayer erstellt - mit Unterstützung für MP4/MP3 - Decodierung, Playlist - Verwaltung und sogar einer Benutzeroberfläche im Dark - Mode. Nach der Kompilierung hatte er nur 15 MB.
Dieser Anblick hat mich sehr angespornt. Also habe ich erneut über Claude Code GLM - 5 gebeten, ein Open - World - Spiel mit Pfeilköpfen für mich zu entwickeln.
Anstatt direkt mit dem Codieren zu beginnen, unternahm es eine sehr "menschliche" Aktion: Es begann mit der Technologie - Stack, den Kernmechaniken bis hin zum Stil der Spielwelt, um Schritt für Schritt meine Anforderungen zu erfüllen.
Und während es "baute", konnte ich wie ein anspruchsvoller Auftraggeber meine ursprünglichen Anforderungen erweitern und jederzeit neue Ideen einfügen:
- Laufen alleine zu viel macht langweilig. Es muss ein Wirtschaftssystem geben, und Goldmünzen sollen zufällig auf dem Boden erscheinen.
- Füge einige Aktionselemente hinzu. Drücke die Taste J, um einen Pfeil zu schießen, und die Taste K, um eine Nahkampfattacke auszuführen.
- Wo sollen die gesammelten Gegenstände hingelegt werden? Füge eine Rucksack - Benutzeroberfläche hinzu und rufe sie mit der Taste I auf.
- Die Pfeilköpfe am Straßenrand dürfen keine Schaufiguren sein. Ich möchte mit NPCs sprechen können.
Als das Spiel schließlich lief, war das Ergebnis einfach "perfekt":
Da GLM - 5 als Systemarchitekt gilt, habe ich es auch gebeten, nachdem es auf der offiziellen Website verfügbar war, ein Mac - System zu entwickeln.
Obwohl das Ganze etwas grob war, wurden das klassische Hintergrundbild des Bildschirms, die Zeitanzeige in der oberen Statusleiste und die Anordnung der Symbole in der unteren Dock - Leiste "gezeichnet". Und tatsächlich konnte jede App auf diesem System geöffnet werden.
Die Kompatibilität mit der halben Chip - Branche ist die "Todesglocke" von GLM - 5
Die Ergebnisse der Benchmark - Tests zeigen, dass GLM - 5 in Bezug auf die Fähigkeiten im Coding und Agent - Engineering eine Spitzenleistung im Open - Source - Bereich erreicht hat.
Die Daten lügen nicht. In den beiden anspruchsvollsten Programmierrankings, SWE - bench - Verified und Terminal Bench 2.0, hat GLM - 5 jeweils 77,8 bzw. 56,2 Punkte erreicht, was in der Praxis von echten Programmieraufgaben nahezu an die Leistung von Claude Opus 4.5 herankommt.
Warum kann GLM - 5 das? Wenn man sich die offizielle Bericht anschaut, findet man hinter einer Reihe von Parametern einige Schlüsselpunkte: MoE - Architektur und asynchrone Verstärkungslearning (Asynchronous RL).
Mit einer Gesamtanzahl von 744 Milliarden Parametern und nur 40 Milliarden aktiven Parametern ist es intelligent und gleichzeitig leichtgewichtig. Die wirkliche Waffe ist jedoch das neue "Slime" - Framework, das von Zhipu entwickelt wurde.
Um es einfach zu erklären: Frühere Modelltrainingsprozesse waren wie ein "Examen", bei dem man für jede richtige Antwort einen Punkt bekam, und das Modell lernte die Aufgaben auswendig, um eine hohe Punktzahl zu erreichen. Das Training von GLM - 5 ist eher wie ein "Praktikum". Es lernt in einer Umgebung namens Slime, indem es vollständige, langfristige Projekte abschließt und in ständiger Rückmeldung und Interaktion lernt.
Darüber hinaus integriert es zum ersten Mal DeepSeek Sparse Attention (Sparse Attention - Mechanismus). Das bedeutet, dass es beim Umgang mit Kontexten von hunderttausenden von Codezeilen nicht "verirrt" und die Bereitstellungskosten erheblich senkt.
Was mich am meisten beeindruckt hat, war die lange Danksagungsliste am Ende der offiziellen Ankündigung. Die chinesischen Large Language Model können jetzt auf chinesischen Chip - Clustern stabil mit hohem Durchsatz und geringer Latenz laufen.
Huawei Ascend, Moore Threads, Cambricon, Kunlunxin, Muxi, Suiyuan, Hygon...
Es gibt einen Eindruck wie bei einem großen Truppenaufgebot des Khans.
Dies ist fast die "Hälfte" der chinesischen Halbleiterindustrie. Das bedeutet, dass die Open - Source - Veröffentlichung von GLM - 5 nicht nur ein Sieg auf der Softwareebene ist, sondern dass es ein Zeichen dafür ist, dass die chinesische KI - Ökosystem - von der untersten Chip - Rechenleistung über das mittlere Framework bis hin zum oberen Modell - einen vollständigen geschlossenen Kreis bildet.
Mit der Open - Source - Veröffentlichung von GLM - 5 und seiner Integration mit Mainstream - Tools wie Claude Code und OpenCode stehen wir möglicherweise am Anfang des Software - Engineering 2.0.
Das Zeitalter des "Agent - Engineering", wie es der ehemalige Leiter der KI bei Tesla, Andrej Karpathy, prophezeit hat, kommt schneller als erwartet. In Zukunft musst du vielleicht nicht mehr Zeile für Zeile Code schreiben. Du musst nur das System definieren, die Ästhetik bestimmen und festlegen, was "spannend" und "nützlich" ist.
Dann siehst du, wie ein Large Language Model wie GLM - 5 wie ein Bauleiter die unterste Rechenleistung anleitet, um ein Hochhaus zu bauen.
Das traditionelle Zeitalter der "Code - Arbeiter" könnte wirklich zu Ende gehen.
Aber keine Sorge, das bedeutet nicht, dass der Mensch überflüssig ist. Im Gegenteil, wenn die KI die mühsamen Implementierungsarbeiten übernimmt, werden deine Ästhetik, dein Urteilsvermögen und deine Fähigkeit, eine gute Frage zu stellen, die letzte und stärkste Schutzmauer des Menschen.
Dieser Artikel stammt aus dem WeChat - Account "APPSO". Autor: APPSO, der morgen Produkte entdeckt. 36Kr hat die Veröffentlichung mit Genehmigung durchgeführt.