StartseiteArtikel

Das ist beeindruckend! Zhipu hat den weltweit ersten universellen Agenten für Mobiltelefone entwickelt! Er ist für alle kostenlos, und man kann sogar direkt über die APP einen Cloud-Computer steuern.

量子位2025-08-20 15:31
Über Apps hinweg arbeiten und gleichzeitig chatten.

Gerade jetzt ist der erste globale universelle Agent für Mobiltelefone da!

Stellen Sie sich vor, Sie befinden sich gerade in einer Besprechung. Mit nur einem Satz an Ihr Mobiltelefon können Sie es dazu bringen, dass es „sich von selbst in Bewegung setzt“ und Ihnen ein Liefergericht bestellt:

Hilf mir, auf Meituan Waimai die nächste Luckin Coffee zu finden und einen großen Eiskaffee zu bestellen.

Man kann beobachten, dass die KI sofort nach Erhalt der Aufgabe mit der Ausführung beginnt.

Sie übernimmt direkt Ihr Mobiltelefon und muss nicht zwischen verschiedenen Apps hin- und herspringen, um die Bestellung abzuschließen.

Der Direkte Eindruck ist: Es ist bequem und intelligent.

Woher kommt dieser Agent eigentlich?

Es ist der von Zhipu neu veröffentlichte erste globale universelle Agent für Mobiltelefone, als würde man die Fähigkeiten von Manus auf das Mobiltelefon übertragen.

Wichtig: Es ist kostenlos und für jeden nutzbar!

Vielleicht denken einige von Ihnen jetzt: Es gibt doch schon Agenten, die das Mobiltelefon von selbst in Bewegung setzen?

Nein, diesmal ist es wirklich anders.

Bei Zhipus Agent werden alle Aufgaben in der Cloud ausgeführt, was bedeutet, dass Ihr Gerät quasi mit einem Cloud-Handy oder einer Cloud-Computereinheit versehen wird. Die Aufgaben werden reibungslos ausgeführt, und es beeinträchtigt nicht die Nutzung anderer Apps!

Was noch wichtiger ist: Dies ist auch der erste Agent für den Massenkonsum. Er kann nicht nur auf Mobiltelefonen (sowohl Android als auch iOS) eingesetzt werden, sondern kann sogar eine Cloud-Computereinheit steuern, um Ihnen zu helfen.

Vielleicht ist dies der beste Zeitpunkt, um sich kostenlos mit Agenten vertraut zu machen und ihre Vorteile zu erfahren.

Was kann es noch tun?

Wir geben zunächst eine kurze Einführung in die Bedienung von AutoGLM.

Nach dem Öffnen der App stehen zwei Arten von Aufgaben zur Auswahl: „Lebensassistent“ und „Büroassistent“.

Nehmen wir den Lebensassistenten als Beispiel. Wenn Sie ihn öffnen, sehen Sie ein normales Dialogfenster mit der KI. Zunächst müssen Sie aber auf das „Handy“ in der oberen rechten Ecke klicken:

Dann klicken Sie auf „Handy übernehmen“ am unteren Bildschirmrand, und Sie gelangen in die zuvor erwähnte „Cloud-Smartphone“-Oberfläche:

Hier können Sie wie auf einem normalen Mobiltelefon vorgehen, in die erforderlichen Apps gehen, sich anmelden und Ihre eigenen Konten einrichten.

Nachdem Sie alles eingerichtet haben, können Sie AutoGLM aktivieren. Diesmal wählen wir eine etwas komplexere Aufgabe:

Ich möchte eine Thermoskanne für etwa 200 Yuan kaufen. Hilf mir, die Preise auf Taobao, JD.com und Pinduoduo zu vergleichen.

Man kann beobachten, dass AutoGLM selbst für aufwändige Aufgaben wie den Preisvergleich zwischen verschiedenen Anbietern reibungslos und präzise zwischen Apps hin- und herspringen kann.

Alles, was wir tun müssen, ist, „Aufgabe starten → auf das Ergebnis warten“.

Außer diesen Funktionen für den täglichen Gebrauch ist AutoGLM auch besonders gut darin, Aufgaben im Arbeits- und Lernkontext zu automatisieren.

Im Gegensatz zu den derzeitigen Agenten auf PC-Webseiten ruft AutoGLM direkt eine Cloud-Computereinheit auf Ihrem Mobiltelefon auf, um die Arbeit zu erledigen!

Wir wechseln zunächst in den „Büroassistent“-Modus. Die Oberfläche sieht so aus:

Man kann sehen, dass über der Eingabezeile die Zugänge zu Funktionen wie „KI-Video“, „KI-Präsentation“ und „KI-Webseite“ bequem angezeigt werden.

Diesmal lassen wir AutoGLM zunächst eine Recherchestudie über Agenten erstellen:

Hilf mir, eine Recherchestudie über Agenten zu erstellen.

Wir müssen keine weiteren Aktionen ausführen. AutoGLM nutzt die Cloud-Computereinheit, um Daten zu sammeln und zu organisieren. Nach ein paar Minuten liegt eine Studie mit Tausenden von Wörtern und nahezu 100 Referenzen vor:

Darüber hinaus können wir AutoGLM bitten, die Studie in eine Präsentation umzuwandeln:

Wandle diese Studie in eine ansprechende Präsentation um.

Ehrlich gesagt: Aufgaben, die zuvor mindestens einen Tag in Anspruch genommen hätten, werden von AutoGLM in nur wenigen Minuten erledigt.

Wie funktioniert das?

Aus den obigen Tests ist ersichtlich, dass AutoGLM im Gegensatz zu herkömmlichen Chatbots nicht nur sagt, „wie man etwas macht“, sondern „es direkt für Sie erledigt“.

Das Wichtigste ist, dass es fast keine lokalen Ressourcen beansprucht.

Dies ist der entscheidende Upgrade-Schritt von AutoGLM: Jeder Benutzer erhält eine Cloud-Handy- und eine Cloud-Computereinheit, ähnlich wie ein Cloud-Reservegerät (mit vorinstallierten Apps).

Mit diesem Setup können Benutzer AutoGLM direkt nutzen, um Aufgaben auszuführen, ohne zusätzliche Apps installieren oder Geräte verbinden zu müssen. Darüber hinaus beeinträchtigt die Arbeit von AutoGLM nicht die normale Nutzung des eigenen Geräts.

Besonders praktisch ist es, dass auch Apps, die man zwar nicht oft nutzt, aber dennoch installieren muss, direkt in das Cloud-Reservegerät gelegt werden können, um lokal Speicherplatz zu sparen und die Leistung des Geräts zu verbessern.

Zusammenfassend lässt sich sagen, dass die reibungslose Funktionsweise von AutoGLM auf Mobiltelefonen und PCs auf der Cloud-basierten Ausführung beruht.

Aus einer breiteren Perspektive betrachtet trifft die „Cloud-Ausführung“ nicht nur die Branchenprobleme genau, sondern entspricht auch einem aufkommenden Trend.

Seit Anfang dieses Jahres ist die Popularität von Agenten unübersehbar. Aber wenn es um die Umsetzung geht, stoßen die Unternehmen auf Probleme:

Erstens haben lokale Geräte begrenzte Rechenleistung. Normale Mobiltelefone und Computer können die hohen Anforderungen an die Konkurrenzfähigkeit und Rechenleistung von Agenten nicht erfüllen. Mit einfachen Aufgaben klarkommen sie zwar, aber bei komplexen Aufgaben besteht die Gefahr eines Absturzes.

Zweitens beanspruchen Agenten auch bei einfachen Aufgaben kontinuierlich die lokale CPU, den Arbeitsspeicher und sogar die Betriebsberechtigungen, was die normale Nutzung des Geräts stark beeinträchtigt und die Benutzererfahrung verschlechtert.

Die „Cloud-Ausführung“ löst genau diese Probleme: Sie beansprucht keine lokalen Ressourcen und stört nicht die normale Nutzung des Geräts.

Deshalb können wir bereits beobachten, dass immer mehr Branchenakteure an der Entwicklung von Cloud-Agenten arbeiten.

Beispielsweise hat Alibaba Cloud auf der Welt-Künstliche-Intelligenz-Konferenz ein „Superhirn“ für intelligente Agenten namens Wuying AgentBay vorgestellt, das Aufgaben in Form einer Cloud-Computereinheit ausführt.

Darüber hinaus haben Cloud-Anbieter wie PPIO Produkte wie die „Agent-Sandbox“ entwickelt, um speziell für Agenten eine Cloud-Umgebung bereitzustellen.

All diese Schritte zeigen, dass die Branche die Wichtigkeit der Cloud-Ausführung für die Entwicklung von Agenten erkannt hat und Ressourcen in die Forschung und Entwicklung investiert.

AutoGLM von Zhipu hebt sich dank dieser Technologie von einfachen Agenten ab und hat seinen Weg in die Arbeits- und Privatleben der Menschen gefunden.

Alles kann AutoGLM werden

AutoGLM ist nicht auf Mobiltelefone und Computer beschränkt. Es kann auch in andere Geräte integriert werden, wie z. B. in intelligente Lautsprecher, Fahrzeugsysteme oder sogar Stofftierchen. Das Motto lautet: Alles kann AutoGLM werden.

Um die breite Anwendung von AutoGLM zu ermöglichen, hat Zhipu ab sofort einen Antragskanal für die mobile API und ein „AutoGLM-Entwickler-Ökosystem-Bauplan“ online gestellt. Durch die Öffnung der API können Entwickler die Fähigkeiten von AutoGLM in ihre Produkte integrieren.

Es ist offensichtlich, dass Zhipu bei der Entwicklung von AutoGLM über einen langfristigen Plan verfügt.

Seit ihrer Gründung hat das Unternehmen die allgemeine Künstliche Intelligenz (AGI) als Ziel gesetzt und später die Vision formuliert, dass Maschinen wie Menschen denken sollen.

Um dieses Ziel zu erreichen, hat Zhipu einen AGI-Roadmap von L1 bis L5 entwickelt: Von der Vorhersage von großen Modellen über die Anpassung der Inferenz, das Selbstlernen, das Selbstbewusstsein bis hin zur Bewusstseinsintelligenz.

AutoGLM ist ein wichtiger Schritt auf dem Weg von Zhipu zu L3, dem „selbstlernenden intelligenten Agenten“. Indem es die Fähigkeiten von Agenten an eine breitere Öffentlichkeit bringt, wird die Machbarkeit der aktuellen Technologie bestätigt, und es können Erfahrungen und Rückmeldungen gesammelt werden, um das Selbstlernen des Modells zu fördern.

Diese Fähigkeit zum Selbstlernen ermöglicht es der Maschine, sich nicht nur auf historische Daten zu verlassen, sondern auch neue Erkenntnisse und Methoden in der Interaktion mit Benutzern und der Umwelt zu entwickeln, was wiederum die eigene Leistung verbessert und einen positiven Zyklus zwischen Technologie und Anwendung schafft.

Wenn dieser Zyklus in Gang kommt, wird die führende Position von Zhipu in der Agenten-Branche weiter gestärkt.

Ein neuer Aspekt ist, dass ähnlich wie GPT - 5 auch AutoGLM eine „All - in - One“ - Funktionalität bietet.

Unterstützt von Zhipus neuesten Open - Source - SOTA - Sprachenmodell GLM - 4.5 und dem visuellen Inferenzmodell GLM - 4.5V (rein chinesischer Agent) integriert AutoGLM erstmals Fähigkeiten wie Inferenz, Nicht - Inferenz, Codierung, Forschung, Agentik und GUI - Agenten in einem Modell