Mit einem Stundenlohn von 1 US-Dollar kann man einen Full-Stack-Ersatz anstellen. MiniMax M2.5 lässt auch Angestellte das Gefühl haben, wie es ist, ein Chef zu sein.
Im Wettstreit der Modellen im Frühlingsfest-Saison ist wieder ein neues Talentschwein aufgetaucht.
Heute hat MiniMax offiziell das neue Modell M2.5 angekündigt, das bereits zwei Tage früher gestartet ist. Es setzt weiterhin auf Agenten und Vibe Coding und bietet eine Leistung, die mit Claude Opus 4.6 mithalten kann.
Es ist vielseitig und kann auf PC, Mobil-App, React Native und Flutter programmieren. Es ist ein echtes Full-Stack-Modell, das sowohl Frontend als auch Backend mit Datenbank abdeckt.
Frühere Modelle konnten höchstens das Frontend gestalten. M2.5 kann aber sowohl Frontend als auch Backend und die Datenverwaltung liefern.
Es ist für die Agenten-Ökosystem entwickelt und kann in Kombination mit OpenClaw natürliche Sprache in konkrete Computeraktionen umwandeln.
Du musst nur die Geschäftsidee verstehen. Der Rest, die Full-Stack-Implementierung, wird dir mit einer Geschwindigkeit von 100 TPS sofort geliefert, und die Stundenkosten betragen nur 1 US-Dollar.
10 Milliarden aktive Parameter – in die Spitzengruppe aufgenommen
M2.5 steht jetzt in den beiden Schlüsselbereichen Code schreiben und Aufgaben ausführen auf der gleichen Ebene wie Claude Opus 4.6.
Beispielsweise hat es in der anspruchsvollsten Programmierliste SWE-Bench Verified eine Punktzahl von 80,2 % erreicht und hat sogar den ersten Platz in der Multilingual-Taskliste Multi-SWE-Bench errungen.
Darüber hinaus kann es im Vibe Coding-Modus Full-Stack-Entwicklung abdecken und kann von der Benutzeroberfläche bis zur Backend-Logik und Datenbankdesign programmieren und ein komplettes, einsatzbereites Codesystem liefern.
Beispielsweise für die Anforderung einer „luxuriösen Katzen-Tunnel-E-Commerce-Website“ mit minimalistischem Stil, Parallax-Scrolling-Effekt und einem 3D-Konfigurator im Hintergrund.
Das Ergebnis von M2.5 zeigt einen großartigen automatischen Videowiedergabeeffekt. Selbst der interaktive 3D-Konfigurator funktioniert tadellos. Die gesamte Website wirkt sehr hochwertig und ist ein voll funktionsfähiges Projekt.
Dieses Vertrauen kommt von seiner „eingebauten Spezifikations-Verhaltensweise“ – bevor es an den Code schreibt, zerlegt es wie ein Architekt die Funktionsstruktur und die UI-Design.
Seine Fähigkeit, Full-Stack-Entwicklung abzudecken, stammt aus seiner Ausbildung in über 10 Programmiersprachen wie Go, Rust, Python und Hunderten von echten Umgebungen.
Bei der Bearbeitung von langfristigen Aufgaben ist M2.5 speziell optimiert. Es kann problemlos mit gängigen Frameworks und eigenen Skripten zusammenarbeiten.
Hier hat es den Prozess-Belohnungs-Mechanismus eingeführt, der die Qualität der gesamten Bearbeitung überwachen kann und das Problem der Abweichung bei langen Aufgaben löst.
Dieser Mechanismus zeigt seine Stärke besonders bei mühsamen und wiederholten Aufgaben. Beispielsweise bei der Statistik der Forbes-Reichstenliste muss es Nettovermögen, Alter und Vermögensquelle erfassen.
Die von M2.5 erstellte Tabelle ist sehr professionell. Es erstellt automatisch drei Blätter: Cover, BillionairesData und Sources, und trennt die Überschrift, die Datenquelle und die detaillierten Daten klar voneinander. Das Format ist so ordentlich, als wäre es von einem perfektionierten Mitarbeiter erstellt worden.
Trotz seiner enormen Leistung hat M2.5 nur 10 Milliarden aktive Parameter und ist damit das kleinste Flaggschiffmodell in der Spitzengruppe.
Dank der tiefgreifenden Optimierung der Denkprozesse erreicht es eine Inferenz-Durchsatzrate von 100 TPS, was doppelt so viel wie bei gängigen Flaggschiffmodellen ist. Bei der Datenbereinigung oder Bugbehebung bei großen Datenmengen spürt man die Blitzschnelligkeit.
Immerhin kann es Full-Stack-Code schreiben und lokale Systeme steuern
Die ersten beiden Online-DEMOs waren nur der Vorspeise. Jetzt bringen wir M2.5 in die echte Agenten-Umgebung.
Laut MiniMax ist die Anpassung an verschiedene Agenten-Frameworks eine der Stärken von M2.5.
Wenn wir über Agenten-Frameworks sprechen, können wir nicht an OpenClaw vorbeigehen. Also installieren wir es auf meinem Computer und verbinden M2.5 damit.
Da M2.5 erst kürzlich erschienen ist, gibt es in der OpenClaw-Installationsanleitung noch keine Option für es. Also mussten wir die Installation manuell vornehmen. Immerhin ist die Verbindung erfolgreich hergestellt worden.
Aber es ist zu umständlich, über die Backend-Konsole mit OpenClaw zu kommunizieren. Deshalb möchte ich es mit meinem Feishu verbinden.
Das Schlachtfeld ist für M2.5 vorbereitet. Jetzt sehen wir, was es kann.
Ich habe mit Python einen Ordner mit 100 zufälligen Finanzdokumenten erstellt und auf dem Desktop abgelegt. Dann gebe ich OpenClaw die Aufgabe: Alle Dateinamen zu bereinigen und in das Format „Datum + Lieferant + Betrag“ umzuwandeln.
Das ist aber noch nicht alles. Es muss die Daten analysieren, nach Ausgaben kategorisieren und schließlich eine monatliche Finanzanalyse-PPT mit Diagrammen erstellen, die nicht nur informativ, sondern auch ansprechend sein muss.
Schauen wir uns zuerst die Dateien vor der Bearbeitung an:
Jetzt geben wir die Aufgabe über Feishu an OpenClaw weiter, das von M2.5 gesteuert wird.
Plötzlich haben alle Dateien im Ordner die gewünschten Namen.
Gleichzeitig meldet OpenClaw über Feishu seinen Fortschritt und gibt eine Zusammenfassung der monatlichen Ausgaben.
Ich habe keine Lust, im Ordner nach der PPT zu suchen, also lasse ich OpenClaw es mir direkt über Feishu schicken.
Die aufregende Prüfzeit ist fast da.
Das von M2.5 gesteuerte OpenClaw hat ein techniklastiges dunkles Thema gewählt. Die Blau-Grün-Farbe sieht sehr angenehm aus.
Es hat nicht nur die Daten eingefügt, sondern auch die Rechnungen verstanden.
Beispielsweise hat es in der Kreisdiagramm sofort erkannt, dass „Cloud Computing-Services“ fast 90 % der Ausgaben ausmachen und hat auf der Kernindikator-Seite speziell darauf hingewiesen, dass die Ausgaben in der zweiten Woche am höchsten waren.
Auf der letzten Seite hat es Verbesserungsvorschläge gemacht und festgestellt, dass zu viel Geld für „Nebula Cloud Computing“ ausgegeben wird. Es schlägt direkt vor, einen Jahresvertrag zu vereinbaren, um die Kosten zu senken. Diese Fähigkeit, Geschäftsinformationen aus Daten zu gewinnen, geht über die reine Diagrammerstellung hinaus.
Man kann sehen, dass M2.5 in der Agenten-Umgebung ein qualifizierter „Gehirn“ ist und mir das Gefühl gibt, wie ein Chef zu sein ✨(⌐■_■)✨.
Außer der Agenten-Fähigkeit hat MiniMax auch eine andere stolze Fähigkeit, nämlich Vibe Coding.
Hier verbinden wir es über Cline mit VSCode und sehen, ob M2.5 den gesamten Entwicklungsprozess von Backend, Frontend, Kommunikation, Deployment und Debugging in einem Zug erledigen kann.
Ich lasse es mit Java Spring Boot ein System für die Echtzeit-Kollaboration von To-Do-Listen erstellen.
Die Funktionen sind nicht einfach. Es muss WebSocket für die Echtzeit-Synchronisierung auf mehreren Geräten verwenden und die Zugangsberechtigungen streng kontrollieren. Nur der Ersteller einer Aufgabe darf sie ändern.
Außerdem muss die Benutzeroberfläche techniklastig aussehen und einen Hacker-Terminal-Effekt vermitteln.
Nachdem es die Aufgabe erhalten hat, beginnt M2.5 mit den beiden Dateien pom.xml und application.yml.
Diese beiden Dateien sind das „Herz“ und das „Gehirn“ eines Java Spring Boot-Projekts. pom.xml ist wie eine Einkaufsliste für das Build-Tool (Maven). Das heißt, welche Komponenten (Abhängigkeiten) benötigt werden, um das „To-Do-Listen“-Projekt zu erstellen.
application.yml (Betriebsanleitung) ist das Einstellungsfeld für das Programm. Hier werden die Regeln für den Programmstart festgelegt.
Nachdem diese beiden Listen erstellt sind, beginnt es mit dem Hauptcode und den verschiedenen Modulen in Java, sowie dem Frontend-HTML. Außerdem erstellt es eine Datenbankdatei.