Erfahrung mit Tencent's "Lobster" QClaw: KI arbeitet mit WeChat zusammen, aber ist noch unausgereift

Hat Tencent die Hummer losgelassen und können sie noch zurückkehren?

Am 18. März hat Tencent endlich QClaw (Tencents Hummer) vorgestellt.

Es war keine Pressekonferenz, auch keine umfangreiche Vorankündigung. Es wurde einfach in Form eines „eingeladenen Tests“ in einem bestimmten Rahmen für die Nutzung geöffnet. Aber schnell verbreitete sich die Nachricht in der KI - Szene – der Grund ist einfach: Dies ist das erste Mal, dass Tencent die „Fähigkeiten wie OpenClaw - Agent“ in ein Produkt für normale Benutzer umgewandelt hat.

Was noch wichtiger ist: Es ist mit WeChat verbunden.

QClaw in WeChat, Bildquelle: Lei Technology

In den letzten Monaten hat OpenClaw (Hummer) vielen Nicht - Technikern gezeigt, dass KI nicht nur chatten kann, sondern tatsächlich „Dinge für dich erledigen“ und sogar den Computer bedienen kann. Aber es ist auch offensichtlich, dass diese Fähigkeiten bisher in der Nerd - Szene geblieben sind – die Installation ist komplex, die Schwelle sehr hoch und das Risiko nicht unerheblich. Die meisten Menschen wissen nicht einmal, wie man es installiert.

Genau hier liegt die Wichtigkeit von QClaw. Obwohl es so aussieht, als wäre es eine „Umhüllung von OpenClaw“, hat Tencent QClaw nicht einfach nur eingepackt, sondern es in eine Produktform umgestaltet, die eher den Gewohnheiten der chinesischen Massenbenutzer entspricht: out - of - the - box, WeChat - Interaktion und sicherer lokaler Betrieb.

Du musst nicht verstehen, was ein Agent ist, und keine Umgebung konfigurieren. Mit einem Satz in WeChat kannst du QClaw auf deinem Computer arbeiten lassen. Deshalb wurde es sofort nach dem Start stark beachtet.

Aber ist es wirklich gut? Ist es auch für normale Benutzer geeignet? Zumindest aus der Erfahrung der aktuellen Version ist es schwer, eine einheitliche Meinung zu haben.

KI kann tatsächlich arbeiten, aber die Verbindung mit WeChat ermöglicht nicht viel

Desktop - Version, Bildquelle: Lei Technology

„Ein allumfassender Computer - KI - Assistent, den du rund um die Uhr und überall abrufen kannst.“

Aus der offiziellen Beschreibung ist QClaw leicht zu verstehen: Eine KI, die auf deinem Computer „für dich arbeitet“. Seine Kernfähigkeiten lassen sich grob in drei Dinge zerlegen: Befehle verstehen, Tools aufrufen und Aktionen ausführen.

Wenn du in WeChat einen Satz schreibst, z. B. Dateien ordnen, Inhalte herunterladen oder Tabellen bearbeiten, beginnt QClaw auf deinem lokalen Computer damit, die Aufgabe Schritt für Schritt zu erledigen. Im Gegensatz zu traditionellen KIs, die nur „Antworten geben“, arbeitet es eher „für dich“.

Dies ist auch der am besten sichtbare und am wahrscheinlichsten für normale Benutzer attraktive Aspekt.

In der tatsächlichen Nutzung auf einem Mac stimmt diese „Erfahrung“ tatsächlich, und in einigen relativ standardisierten Szenarien ist der Abschlussgrad sogar recht hoch. Zum Beispiel Dateiorganisation, einfache Informationszusammenstellung und grundlegende Datenverarbeitung. Diese Aufgaben haben klare Pfade und feste Schritte, und QClaw kann sie in der Regel problemlos erledigen.

Insbesondere in einer lokalen Umgebung kann es nicht nur die Situationen lokaler Dateien und Ordner direkt kennen, sondern auch direkt damit umgehen.

„Befehlen“ direkt in WeChat, Bildquelle: Lei Technology

Aber für komplexere Aufgaben wird es schwierig. Stell dir einen Szenario vor: Du bist unterwegs und brauchst eine Datei auf deinem Computer, die nicht synchronisiert wurde oder der Synchronisierungsversuch fehlgeschlagen ist. Du kannst QClaw in WeChat bitten, sie zu finden und an dich zu senden. Aus den tatsächlichen Ergebnissen kann es diese Aufgabe tatsächlich erledigen:

Die Desktop - Datei finden, hochladen, einen Teilen - Link generieren und an WeChat senden. Mit einem Klick kannst du die Datei sehen.

Aber tatsächlich war meine genauere Anforderung, dass es die Datei direkt an den „Dateiübertragungsassistenten“ senden soll.

In der Standardkonfiguration hat QClaw überhaupt keine Möglichkeit, auch wenn ich es in Tests dazu gebracht habe, alle erforderlichen Skiil (wie Midscene) zu installieren, alle Arten von Systemberechtigungen wie Hilfsfunktionen, Bildschirmaufzeichnung und Dateizugang angefordert habe und verschiedene Lösungen wie CLI (Befehlszeile), Skripts und Kopieren/Einfügen von Dateien versucht habe.

Jedoch kann QClaw selbst mit allen „bewaffneten“ Skill und Berechtigungen nicht nur Dateien kopieren und WeChat öffnen, sondern auch die Suchleiste anklicken, aber es schafft es nicht, Dateien zu senden.

Bildquelle: Lei Technology

Hier gibt es auch ein ziemlich „mysteriöses“ Problem. Bei jeder Suche wird oft „aaa/aaaaaa“ eingegeben. Ehrlich gesagt verstehe ich bis jetzt nicht, warum.

Natürlich ist diese Aufgabe vielleicht für das aktuelle QClaw zu anspruchsvoll.

Aber ein anderer Test für die Aufgabe „Xiaohongshu“ hat die Unvollkommenheiten von QClaw als Produkt aufgezeigt. Hier muss ich kurz erwähnen, dass QClaw standardmäßig eine Reihe von Skill konfiguriert hat, darunter Skill, die von dem QClaw - Team selbst entwickelt wurden, sowie dritte - Parteien - Skill, darunter auch das Skill von Xiaohongshu. Die Beschreibung besagt, dass es möglich ist, „die Hot - Topics von Xiaohongshu zu verfolgen“ und „die Diskussionen auf Xiaohongshu über XX zu teilen“ und so weiter.

Bildquelle: Lei Technology

Ich habe versucht, QClaw zu bitten, „die Diskussionen auf Xiaohongshu über QClaw zu recherchieren“ und am Ende einen Bericht auszugeben. Der Denkprozess zeigt, dass QClaw das Xiaohongshu - Skill normalerweise aufgerufen hat, aber es ist direkt an:

dem QR - Code hängen geblieben.

Unabhängig davon, ob es um Anti - Crawler - Maßnahmen oder Benutzerstrategien geht, wissen viele Leute, dass man fast immer mit dem Handy scannen muss, um die Web - Version von Xiaohongshu zu nutzen. Es ist also nicht verwunderlich, dass QClaw aufgehalten wurde. Was seltsam ist, dass es weder Chrome noch einen passenden Browser öffnen kann, um die Anmeldeseite von Xiaohongshu anzuzeigen, damit ich scannen kann. Es erinnert mich nur daran, dass ich scannen muss, aber gibt keinen QR - Code.

Bildquelle: Lei Technology

Das ist ziemlich abstrakt. Ich habe die Original - Version von OpenClaw und andere „Hummer“ - Umhüllungen aus China genutzt. Tatsächlich können sie direkt Chrome öffnen, um die Anmeldung zu ermöglichen, und dann nach „QClaw“ suchen.

Ich habe auch versucht, dass QClaw den QR - Code auf der Anmeldeseite als Einzelbild speichert. Tatsächlich kann es ihn speichern, damit ich scannen kann. Aber in der Realität kann ich nicht anmelden, egal wie ich scanne und bestätige. Ganz zu schweigen von der Suche, dem Browsing von Notizen und der Ausgabe eines Berichts am Ende.

Trotz dieser Probleme hat QClaw meiner Meinung nach dennoch einige positive Aspekte. Das Wichtigste ist, dass es das „Agent“ - Konzept erstmals in eine Produktform umgewandelt hat, die normale Benutzer tatsächlich erleben können.

Du musst keine Umgebung einrichten und keine komplexen technischen Konzepte verstehen. Du musst nur deinen Computer einschalten, mit WeChat verbinden und die KI kann versuchen, Dinge für dich zu erledigen.

Selbst wenn die aktuelle Testversion noch nicht stabil genug ist, stimmt die Erfahrung an sich. Es ist nur noch ein Stück Weg bis hin zu einem „zuverlässigen Helfer“.

Alle „Hummer“ sind noch recht primitiv, aber KI wird sicherlich das Zentrum der Mensch - Maschine - Beziehung sein

Um zu verstehen, warum QClaw in seinem jetzigen Zustand ist, müssen wir zu seinem ursprünglichen Modell zurückgehen: OpenClaw (Hummer).

Auf den ersten Blick scheint diese Art von Produkt etwas sehr Einfaches zu tun: Die KI soll den Computer für dich bedienen. Aber technisch gesehen ersetzen sie nicht den Computer, sondern fügen eine neue „Proxy - Schicht“ über dem bestehenden Betriebssystem hinzu.

Diese Proxy - Schicht ist für drei Dinge verantwortlich: Deine Befehle verstehen, die Aufgabe in Schritte zerlegen und dann das System und Tools aufrufen, um die Aktionen auszuführen. Das klingt vernünftig, aber das Problem ist, dass sie die Systemfähigkeiten nicht wirklich übernimmt, sondern immer noch „nutzt“ das System.

Dies bestimmt ihre Obergrenze. Und es erklärt auch, warum es oft „scheint zu können“, aber die Aufgabe nicht gut erledigen kann.

In der aktuellen Generation von Agent - Produkten ist die „Verständnisfähigkeit“ des großen Modells eigentlich kein Problem. Ob es um die Dateiorganisation, die Inhaltsanalyse oder die Zerlegung von mehrstufigen Aufgaben geht, kann das Modell in den meisten Fällen einen vernünftigen Weg aufzeigen.

Aber sobald es in die Ausführungsphase geht, treten Unsicherheiten auf. Erstens kann die „Illusion“ des Modells nicht vollständig beseitigt werden, und es ist eine systematische „Validierung“ und „Korrektur“ erforderlich. Es weiß auch nicht, ob die aktuelle Seite tatsächlich erfolgreich geöffnet wurde, ob der Klick erfolgreich war oder ob die Eingabe korrekt ist. Alle Aktionen basieren im Wesentlichen auf einem „wahrscheinlichsten nächsten Schritt“.

Deshalb kann es passieren, dass die Schritte scheinbar richtig sind, aber das Ergebnis möglicherweise nicht „die Aufgabe erledigen“ kann.

Bildquelle: Tencent

Wenn man genauer hinsieht, ist dies nicht nur ein Problem des Modells. Die heutigen Betriebssysteme haben zwei Schnittstellen: die grafische Benutzeroberfläche (GUI) für normale Benutzer und die Befehlszeile (CLI) für Entwickler. Aber keine davon ist speziell für Agent - Produkte entwickelt. Agent - Produkte nutzen die „Mensch - Oberfläche“, um „maschinelle Dinge“ zu tun.

Deshalb können wir sehen, dass Agent - Produkte Anwendungen aufrufen, aber nicht stabil steuern können, und Aktionen ausführen, aber der Status oft nicht synchronisiert ist. Hinzu kommt, dass die Schnittstellen verschiedener Plattformen unterschiedlich sind, die Anmeldemechanismen, Berechtigungssysteme und Anti - Crawler - Strategien eigenständig sind. Viele Prozesse, die bei der manuellen Bedienung ganz natürlich sind, sind für Agent - Produkte Bruchstellen.

Wenn man nur diese Probleme betrachtet, ist es leicht, zu dem Schluss zu kommen, dass dieser Weg nicht geht. Aber in der Realität investieren fast alle großen Unternehmen in diese Richtung.

Der Grund ist einfach. Denn die Bedeutung dieser Sache liegt nicht nur darin, wie gut es jetzt funktioniert, sondern darin, dass es die tiefere Mensch - Maschine -

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Erfahrung mit Tencent's "Lobster" QClaw: Künstliche Intelligenz kann jetzt mit WeChat zusammenarbeiten, aber insgesamt ist es noch recht unausgereift.

KI kann tatsächlich arbeiten, aber die Verbindung mit WeChat ermöglicht nicht viel

Alle „Hummer“ sind noch recht primitiv, aber KI wird sicherlich das Zentrum der Mensch - Maschine - Beziehung sein