StartseiteArtikel

Warum erscheint „Lobster“ zuerst auf dem Computer und nicht auf dem Handy?

爱范儿2026-03-05 21:08
In der Zeit der Ergebnisbezahlung liegt der Wert des Menschen in der "Richtungssinn".

Redaktionelle Anmerkung:

Smartphones haben die digitale Ökosystem der letzten Jahrzehnte dominiert. Sie sind die Senke für unsere Aufmerksamkeit und unser intimstes Begleitobjekt. Aber von Anfang an wurden Smartphones für die Interaktion mit Menschen entwickelt - ihre gesamte Logik endet am Bildschirm.

Die Anforderungen an Künstliche Intelligenz (KI) sind genau das Gegenteil: Sie muss die physische Welt kontinuierlich wahrnehmen - sehen, was Sie sehen, hören, was Sie hören, und jederzeit anwesend sein, anstatt erst aufzuwachen, wenn Sie den Bildschirm entsperren.

Wenn KI wirklich zu einer grundlegenden Fähigkeit wird, wird sie früher oder später aus dem Bildschirm herausbrechen und ihre eigene Form finden. Dies wird ein langwieriger Prozess der Erforschung und Evolution sein.

So entstand die Rubrik "KI-Gegenstände". iFanr möchte zusammen mit Ihnen beobachten, wie KI die Hardwaregestaltung verändert, wie sie die Mensch - Maschine - Interaktion neu formt und vor allem, in welcher Form KI in unseren Alltag eindringt.

Es war überraschend, dass in dieser neuen Ära, in der jeder nach dem nächsten KI - Hardware - Gerät sucht, der Computer, als "Endgerät der alten Ära", das stärkste KI - Trägergerät zu Beginn dieses Jahres geworden ist.

Der Grund ist einfach - "Lobster" OpenClaw eignet sich besser für die Installation auf Computern.

Plötzlich ist der Mac mini, der beste Container für OpenClaw, das begehrteste Tech - Produkt dieser Zeit geworden. Entwickler und Tech - Enthusiasten aus der ganzen Welt versuchen, einen eigenen KI - Agenten auf ihm zu installieren. Selbst wenn die Funktionen noch begrenzt sind, wollen sie die zukünftige Interaktion mit einem automatisierten KI - Assistenten erleben.

Die Frage ist: Warum wird in der neuen KI - Ära der Computer, als "Endgerät der alten Ära", der Vorreiter, anstatt das Smartphone, das von vielen als Träger der Veränderung erwartet wird und das fast jeder besitzt?

Der Computer behält die unterliegende Logik der "Maschinen - Interaktion"

Der Grund ist eigentlich einfach: Im Gegensatz zum Smartphone, das von Anfang an für die "Mensch - Interaktion" entwickelt wurde, behält der Computer die unterliegende Logik der "Maschinen - Interaktion" bei.

Erinnern Sie sich noch? Bevor es Mauszeiger, Symbole und Schaltflächen gab, hatte der Computer nur "Zeichen", also die sogenannte "Befehlszeile", schwarzer Hintergrund, weiße Schrift und ein blinkender Cursor. Nur wenige Menschen, die die "Computer - Sprache" beherrschten, konnten diese Maschine bedienen.

Mit der Entstehung von Mehrbenutzer - Betriebssystemen und der Erhöhung der Festplattenkapazität mussten die Computersysteme angepasst werden. Unix brachte ein Dateisystem mit einer baumförmigen Verzeichnisstruktur, das bis heute die modernen Computer beeinflusst.

Aus Gründen der Vereinfachung und Verbreitung der Computer wurde schließlich die grafische Benutzeroberfläche entwickelt, die heute das Aussehen unserer Computersysteme bestimmt.

Es ist jedoch bemerkenswert, dass selbst nach Jahrzehnten der Entwicklung die grafische Betriebssystemoberfläche immer noch die "Befehlszeile" als Interaktionsmethode beibehält. Das Dateispeichersystem ist die Grundlage für die Nutzung und den Betrieb von Computern, was sich deutlich von Smartphones unterscheidet.

▲ Der "Terminal" von macOS

Der Computer, oder genauer gesagt der "Rechner", wurde ursprünglich als "Produktionswerkzeug" geschaffen. Ein vollständiges Dateispeichersystem ist für die Produktivität unerlässlich, und viele spezialisierte Entwicklungsarbeiten erfordern die Verwendung der Befehlszeile. Nachdem Benutzer einen Computer erworben haben, müssen sie die benötigten Tools und die Produktionsumgebung selbst konfigurieren, auswählen oder entwickeln. Daher bleibt die "Maschinen - Interaktion" erhalten.

Das Smartphone, das erst im 21. Jahrhundert entwickelt wurde, hat die gesamte Interaktionslogik direkt auf die grafische Benutzeroberfläche "übersprungen". Das Designziel war es, die Bedienung so einfach, intuitiv und zugänglich wie möglich zu gestalten.

Heute sind sowohl Computer als auch Smartphones Konsumprodukte für Endbenutzer. Das Smartphone ist jedoch ein reineres Konsumprodukt, während der Computer weiterhin als Produktionswerkzeug, insbesondere als Entwicklungsinstrument, fungiert.

Um die Benutzerfreundlichkeit zu gewährleisten und gleichzeitig die Interessen der Entwickler zu berücksichtigen, sind die Apps auf Smartphones in einem geschlossenen, sofort einsatzbereiten Modus konzipiert. Obwohl die Apps weiterhin über API - Schnittstellen miteinander kommunizieren können, sind im Wesentlichen jede App eine unabhängige und funktionsfähige Insel.

Dies führt dazu, dass die Produktionsaufgaben auf Smartphones in gewissem Maße in die "App - Einzäunung" eingeschränkt sind und es schwierig ist, die Effizienz eines Computers zu erreichen.

Wenn auch das grafische Computersystem die frühen "Befehlszeilen" und Schnittstellen sowie andere "Maschinen - Interaktions" - Methoden beibehält, wurde das Smartphone von Anfang an nur für die intuitivste "Mensch - Interaktion" entwickelt.

Was noch wichtiger ist, die hohe Anpassbarkeit und Programmierbarkeit des Computers, obwohl sehr mächtig, birgt auch die Gefahr von Viren, Hackern und bösartigen Skripten.

Das Smartphone hingegen muss in Bezug auf Sicherheit und Datenschutz streng kontrolliert werden. Die Kernrechte sind gesperrt, und das System verwaltet den Handlungsspielraum der Apps streng.

Darum wird der Computer nicht vom Smartphone "getötet" und warum das iPad den Mac nie ersetzen kann, liegt auch hier.

▲ Großes Smartphone vs. richtiger Computer, Quelle: Tom's Guide

Diese beiden völlig unterschiedlichen Betriebsweisen haben sich über Jahrzehnte hinweg problemlos entwickelt, bis die KI - Ära anbrach.

Es ist schwer vorstellbar, dass man durch das Herunterladen einer App aus dem App Store Anweisungen geben kann, um automatisch Lieferdienst - Anrufe zu entgegennehmen, Termine zu überprüfen und Einkäufe zu tätigen, da die Rechte und Fähigkeiten der Smartphone - Apps fast ausschließlich auf die App - interne Ebene beschränkt sind.

Deshalb gibt es Lösungen wie den "Doubao - Smartphone - Assistenten", der die multimodale Bilderkennung nutzt, um die "Mensch - Interaktion" zu imitieren und die Automatisierung der App - Bedienung zu erreichen. Dies ist im Wesentlichen eine "Umweg - Lösung" - und auch diese wurde bald von den App - Anbietern streng verboten.

▲ Der Doubao - Smartphone - Assistent hilft mir, Shampoo in verschiedenen Apps zu entdecken und die Preise zu vergleichen

Aber bevor die KI entwickelt wurde, konnten Menschen bereits Skripte schreiben, um Browser zu steuern, Excel mit Python zu bedienen und Server über die Befehlszeile zu verwalten. Wir mussten jedoch immer die "Sprache und Methode der Maschine" verwenden, um diese Aufgaben zu erfüllen.

OpenClaw und verschiedene Agenten mit unterschiedlichen Zwecken, aber ähnlicher Grundstruktur, fungieren wie Dolmetscher. Sie empfangen Anweisungen in natürlicher Sprache und übersetzen sie in die Sprache der Maschine, um mit dem Computer zu interagieren.

▲ Quelle: Tencent Technology

Außerdem hat der Computer im Vergleich zum Smartphone mit relativ begrenzter Leistung und strenger Hintergrund - Steuerung deutliche Vorteile bei der Rechenleistung, dem Kontext und der Akkulaufzeit.

Die wichtigste Frage ist: Braucht das Smartphone als "Konsumträger" wirklich einen vollautomatischen KI - Assistenten, um unsere "Effizienz" zu erhöhen?

Wenn der KI - Agent tatsächlich für uns arbeiten soll, wird er sich eher auf die Seite des Computers bewegen, der näher an dem "Produktionswerkzeug" ist.

Der Computer, der die alte "Maschinen - Interaktions" - Methode beibehält, hat in der neuen KI - Ära das Smartphone, das auf die "Mensch - Interaktion" ausgerichtet ist, überholt und wird zum vielversprechendsten Ausgangspunkt für die Veränderung des KI - Arbeitsablaufs.

Was wird der Computer, wenn die grafische Benutzeroberfläche in den Hintergrund tritt?

Aus OpenClaw können wir erneut eine Möglichkeit erkennen: Eines Tages werden die übereinanderliegenden und voneinander getrennten Fenster in einem Dialogfeld zusammengefasst werden.

Die Art und Weise, wie wir den Computer nutzen, wird sich strukturell verändern.

Für die meisten Menschen besteht die Nutzung von KI momentan nur darin, dass sie als ein Fenster jederzeit bereitsteht, um uns beim Schreiben, Suchen und Organisieren zu helfen. Im Wesentlichen ist es nur ein isoliertes Hilfsmittel.

OpenClaw deutet auf die zweite Stufe hin: Wir überlassen die Kontrolle teilweise und können für komplexere Aufgaben einfach Anweisungen geben und die KI die Arbeit erledigen lassen und das Ergebnis abholen.

Nehmen wir die Arbeit eines Redakteurs als Beispiel. Früher mussten wir bei der Erstellung des Morgen - und Wochenberichts zwischen verschiedenen Medien hin und her wechseln, um Nachrichtenquellen zu sammeln. Dieser Prozess musste manuell durchgeführt werden, bevor wir die Nachrichten an die KI zur Organisation und Schreibung übergeben konnten.

Künftig brauchen wir nur in einem Dialogfeld "Hilf mir, eine Zusammenfassung der heutigen Tech - Exclusiv - Nachrichten zu erstellen" einzugeben. Der KI - Agent kann alle Aufgaben erledigen - er sammelt automatisch Nachrichten aus den Quellen, organisiert und schreibt sie, und wir müssen nur das Endergebnis prüfen. Dieser Arbeitsablauf kann sogar vollständig automatisiert werden.

Die Art und Weise, wie Menschen Computer nutzen, ist nie statisch. Viele Leute installieren heute "Lobster" auf einem Mac mini, sitzen aber möglicherweise nicht direkt davor. Stattdessen ist es häufiger, dass man auf dem Smartphone in Telegram oder Feishu einem Roboter eine Anweisung gibt, um Skripte auf dem Computer auszuführen, Informationen zu sammeln und Dateien zu generieren, und das Ergebnis zurückzusenden.

Dies ähnelt einer neuen Art von SSH. Die Ausführung findet auf der Maschine statt, aber die Steuerungsoberfläche kann überall erscheinen. Der Unterschied besteht nur darin, dass wir früher die Anweisungen in die B