Echtzeit-Test: MiniMax M2.7 - KI arbeitet hart, aber wird von sich selbst überholt!

Der Schlüssel für den AI-Arbeitsablauf verschiebt sich von Tools hin zu Modellen.

Nach dem großen Erfolg von Lobster richtet sich die Aufmerksamkeit im gesamten Internet auf die Frage, 「wie man es am besten nutzt」 – ob man es lokal installiert oder in der Cloud betreibt, ob man es mit einem Klick installiert oder Befehle eingibt, ob man es mit WeChat oder Feishu verbindet … Immerhin fragt niemand mehr ernsthaft die alte Frage: Ist das 「Gehirn」, das Lobster antreibt, intelligent genug?

Das ist nicht verwunderlich. Die neuesten Modelle von OpenAI und Google sind durchweg Mini - oder Flash - Versionen. Der stillschweigende Hinweis der Hersteller steht so gut wie geschrieben: Sie sind speziell für Agenten entwickelt, die eine große Anzahl von Token verbrauchen.

Die Fähigkeitsgrenzen des Modells selbst sind stattdessen das am wenigsten diskutierte Thema.

Ein Modell, das wirklich gut zu Lobster passt, muss nicht nur eine große Anzahl von Token bieten, die preiswert und ausreichend sind, sondern auch intelligent genug sein und über starke praktische und Lernfähigkeiten verfügen.

Kürzlich hat MiniMax das neue MiniMax M2.7 - Modell offiziell vorgestellt, das sich auf 「das Starten der Selbstentwicklung von KI」 und das 「stärkste Cowork - Agent - Modell」 konzentriert. Es kann sowohl Code - Arbeiten als auch gängige Office - Aufgaben bearbeiten und kann aktiv lernen, um ein stabiles Agent - System aufzubauen.

Konkret kann es eine breitere Palette von Aufgaben bewältigen als die meisten Modelle. Bei der Code - Entwicklung versteht M2.7 wirklich, was in einem System während des Betriebs passiert. Es erreicht die System - Inferenzfähigkeit auf SRE - Ebene (Site Reliability Engineering), kann Logs lesen, Zeitlinien korrelieren, die Root - Ursache ermitteln und priorisierte Lösungsansätze geben. Das neue Modell hat auf SWE - Pro 56.2% erreicht und ist fast auf Opus 4.6 aufgeschlossen.

Es reicht für die Bürotätigkeit vollkommen aus. Bei der komplexen Bearbeitung und mehrfachen Überarbeitung von Excel -, Word - und PPT - Dateien hat M2.7 deutliche Verbesserungen gezeigt, insbesondere in Szenarien wie Finanzanalysen, die spezielle Fachkenntnisse und eine bestimmte Formatierung erfordern. Man kann nicht sagen, dass es Fachleute vollständig ersetzen kann, aber es kann definitiv als Unterstützung in den Arbeitsablauf integriert werden.

Es bricht nicht bei der Zusammenarbeit von mehreren Agenten ab. Dies ist eine speziell für M2.7 gepolierte Fähigkeit. In Szenarien mit mehreren Rollen ist die Grenze klar definiert, und es kann auch in komplexen Umgebungen mit über 50 Skills eine äußerst hohe Befolgungsrate von Anweisungen aufrechterhalten.

Das Highlight dieser Aktualisierung ist, dass es nun an seiner eigenen Optimierung beteiligt ist. MiniMax sagt, dass M2.7 das erste Modell von ihnen ist, das tief in die eigene Iteration involviert ist, nicht nur 「als Unterstützung bei der Iteration」, sondern 「tief in die eigene Iteration involviert」. Mit der Fähigkeit zur Selbstentwicklung kann M2.7 autonom den Agent - Harness (Intelligent - Agent - Gerüst) iterieren, um die meisten Arbeitsabläufe zu bewältigen.

Die Verbesserung seiner Praxis - Fähigkeiten hat es auch bewirkt, dass MiniMax M2.7 direkt nach der Veröffentlichung schnell in der Lobster - Rankingliste gestiegen ist und nun auf dem vierten Platz der Rangliste der Höchstwerte steht.

Die PinchBench - Rankingliste ist ein Modell - Bewertungsstandard, der speziell für OpenClaw entwickelt wurde. Sie misst die Leistung von Large - Language - Modellen in realen Geschäftsszenarien von OpenClaw. Im Bild ist der Erfolgsrate - Indikator dargestellt. MiniMax M2.7 belegt den vierten Platz hinter Claude Opus 4.6 | https://pinchbench.com/

Wir haben auch in Claude Code und lokal installiertem Lobster das MiniMax M2.7 - Modell sowie das von MiniMax angebotene MaxClaw integriert und dann alle Bugs, langweiligen Finanzdaten und umfangreichen Langzeitaufgaben aus dem realen Entwicklungsprozess an es weitergeleitet.

Nach zwei Tagen Testen haben wir festgestellt, dass nicht nur die Software für die KI neu gestaltet werden muss, sondern auch die KI - Modelle selbst, um die Absicht des Menschen zu verstehen und zufriedenstellende Ergebnisse zu liefern, das Arbeitsverfahren und den Arbeitsablauf der KI verstehen und sich selbst optimieren müssen.

Den Arbeitsablauf der KI als menschlichen Helfer nutzen

Nach der großen Popularität von Agent - Frameworks wie OpenClaw sollte der echte 「Arbeitsablauf der KI - Ära」 sein, dass die KI als zentraler Dreh- und Angelpunkt fungiert, um Dutzende von Tools aufzurufen, andere KI - Teamkollegen zu leiten und sogar ihren eigenen Code zu optimieren.

Bevor ich testete, wie MiniMax M2.7 sich selbst entwickelt, wollte ich zunächst sehen, wie sein KI - Arbeitsablauf ist. Ist es wirklich ein guter Agent - Ansatz, oder ist es nur für Benchmarks gut geeignet, aber in der Praxis enttäuschend?

Wir haben historische Aktiendaten von der Website des renommierten Maschinellen - Lern - Wettbewerbs Kaggle heruntergeladen und MiniMax M2.7 dann gemäß den Wettbewerbsanforderungen angewiesen, die entsprechenden Anforderungen zu erfüllen, d. h. die gegebenen Daten zu verarbeiten, Feature - Engineering durchzuführen und einen visualisierten Analysebericht zu generieren.

Der gesamte Datensatz war sehr umfangreich, mit über 3000 Zeilen Tabellendaten und einer Gesamtgröße von 446,35 MB. Nachdem wir fünf Tabellendateien heruntergeladen hatten, haben wir Claude Code mit integriertem MiniMax M2.7 verwendet, um diese Aufgabe zu erledigen.

Um diese Analyse erfolgreich durchzuführen, muss das Modell in der Lage sein, die Rolle eines Datenanalytikers zu übernehmen, um die Daten zu bereinigen und zu organisieren, die eines Makroanalytikers, um Einblicke in den Finanzmarkt zu gewinnen, die eines Statistikanalytikers, um eine erste mathematische Modellierung durchzuführen, die eines Algorithmus - Ingenieurs, um das entsprechende Modell aufzubauen, und schließlich die eines Web - Ingenieurs, um ein visualisiertes Konzept zu liefern.

Angesichts einer so komplexen Aufgabe nutzte MiniMax M2.7 alle bereits installierten Skills. Zunächst las es die Informationen zur Tabellendatenstruktur mit der von Anthropic offiziell angebotenen xlsx - Funktion aus und begann dann, Python - Code zu schreiben und die Pandas - Bibliothek (häufig zur Verarbeitung von Tabellendaten verwendet) automatisch zu installieren, und arbeitete schrittweise voran.

Schließlich lieferte MiniMax M2.7 auch ein vollständiges visualisiertes Konzept. Es erstellte mehrere Bilder, um die Renditeverteilung, die Wichtigkeit verschiedener Merkmale, die Kategorienrangfolge und ein kombiniertes Dashboard darzustellen.

In der visualisierten Webseite wandelte es die Daten - Skripte mit der Streamlit - Bibliothek direkt in ein interaktives Web - System um, und alle Informationen können direkt dynamisch eingesehen werden.

Wenn MiniMax solche großen Projektaufgaben problemlos bewältigen kann, ist es noch weniger schwierig, die alltäglichen Büro - und Programmieraufgaben zu erledigen.

Wir bedienten zunächst Lobster auf dem Smartphone und ließen es die Dateien auf unserem Computer zusammenfassen. Dann baten wir MiniMax M2.7, anhand dieser Dateien einen Forschungsplan in Word zu schreiben, eine Excel - Datei mit relevanten Forschungsarbeiten zu erstellen und schließlich ein PPT - Dokument für die Teambesprechung zu erstellen, und das alles direkt vom Smartphone aus.

Lobster mit integriertem MiniMax M2.7 kann Anfragen schnell beantworten

Die Bearbeitung der Office - Suite ist kein Problem mehr

Die Vorteile in der Bürotätigkeit haben es auch bewirkt, dass MiniMax M2.7 in der GDPval - AA - Bewertung, die die Fachkenntnisse und die Fähigkeit zur Aufgabenabwicklung misst, einen ELO - Score von 1495 erreicht hat, der höchste Wert unter den chinesischen Modellen.

Vor kurzem war das visuelle Panel des KI - Arbeitshelfers sehr beliebt. Man hat Lobster in ein echtes Büro im Zweidimensionen - Stil platziert und es mit einem Satz in sein eigenes OpenClaw installieren können. Wir haben es auch geschafft, dass dieser Appso - Hummer ein Zuhause hat. Aber was kann ich tun, wenn ich die Layout des Zweidimensionen - Zimmers ändern möchte? Ich überlasse es MiniMax.

In der visuellen lokalen Schnittstelle von OpenClaw sendeten wir einfach die Frage 「Wie kann ich den Stil dieses kleinen Hauses ändern?」. MiniMax M2.7 liest automatisch den Projektcode und sagt uns, welche Stellen geändert werden können und wie.

Da ich die Anforderung für den Stil eines technologischen Redaktionsbüros eingegeben hatte, hat es es in ein Design mit Star - Wars - Postern umgewandelt und noch ein Dutzend Leute am Computer hinzugefügt.

Da wir aber den API - Key von Nano Banana Pro in OpenClaw nicht konfiguriert hatten, hat MiniMax M2.7 in OpenClaw die Methode der Code - Generierung gewählt, um einfache Bilder zu erstellen.

Dann konnten wir auch mit ihm darüber sprechen, ein Redaktions - Tycoon - Spiel zu entwickeln, bei dem derjenige, der die meisten Aufgaben erledigt, das größte Büro bekommt und aufsteigen kann.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Echtzeit-Test von MiniMax M2.7: Wenn KI hart arbeitet, wird auch sie selbst von sich selbst überholt.

Den Arbeitsablauf der KI als menschlichen Helfer nutzen