StartseiteArtikel

Ein AI-Browser, der 200 US-Dollar kostet, will mich neu beibringen, wie man im Internet surft.

极客公园2025-07-15 07:47
Der Ehrgeiz des KI-Browsers besteht nicht darin, Chrome zu ersetzen, sondern darin, die Beziehung zwischen Menschen und Informationen neu zu überdenken.

Der Kampf um die AI-Browser hat bis heute geführt. Vom frühen Versuch von Arc, die Interaktion neu zu gestalten, über die „Proxy“-Fähigkeiten, die Opera Neon gezeigt hat, bis hin zum angeblich kommenden Browser von OpenAI – jeder bedeutende Akteur in der Branche versucht, diesen uns allerbekannten Internet-Eingang neu zu definieren.

Diese Woche ist endlich Perplexity, berühmt für seinen AI-Suchmotor, mit ihrer Antwort auf den Markt gekommen – Comet, ein Browser, der sich selbst als „AI-Agent-nativ“ bezeichnet.

Dennoch hat Comet auf den Sozialen Medien nicht genug Furore gemacht, da Comet derzeit nur für Abonnenten von Perplexity Max und einige Nutzer mit begrenzten Einladungscodes zugänglich ist ( ein monatliches Abonnement kostet 200 US-Dollar). Später wird der Nutzerkreis schrittweise über eine Warteliste erweitert.

Glücklicherweise konnte GeekPark dank eines Einladungscodes schnell die AI-Agent-Browser von Perplexity testen.

Der CEO von Perplexity, Aravind Srinivas, hat große Pläne für Comet: „Wir haben Comet entwickelt, damit das Internet das tun kann, was es schon immer wollte: unsere Intelligenz erweitern.“ Das Kerngedanke von Comet lautet: „Vom Blättern zum Denken“ (From Browse to thinking).

Klingt sehr ambitioniert, aber was kann Comet eigentlich für die bestehende Browser-Nutzungserfahrung bringen? Wie unterscheidet es sich von dem AI-fähigen Dia-Browser oder dem baldigen Chrome mit Gemini?

Kann Perplexity, das mit AI-Suche anfing, mit Comet seinen Unternehmenswert noch weiter in die Höhe treiben?

Was ist ein „Denkpartner“?

Um Comets Ambitionen und seine derzeitige „Stärkste Seite“ zu verstehen, muss man immer noch von der Frage ausgehen: „Was sind die Bedürfnisse der Nutzer eines AI-Agent-Browsers aus der Sicht von Perplexity?“

Wenn man sagt, dass der traditionelle Browser das Problem des „Zugangs“ zu Informationen gelöst hat, dann versucht Comet, das Problem des „Verstehens“ und des „Anwendens“ von Informationen zu lösen. Es geht davon aus, dass das Problem darin liegt, dass jede Registerkarte eine Informationsinsel ist. Und seine Lösung besteht darin, diese Inseln zu einem Kontinent mit einheitlicher Intelligenz zu verbinden.

Dieser Gedanke spiegelt sich in allen Aspekten von Comet wider. Es sieht nicht so aus wie die Homepage eines traditionellen Browsers. Vielmehr ähnelt es dem Desktop eines Smartphones, auf dem alle benötigten Apps angeordnet sind.

Der Comet-Browser-Desktop | Bildquelle: GeekPark

Ein traditioneller Browser ist wie ein riesiges Gebäude aus unzähligen unabhängigen Zimmern (Registerkarten), in denen unterschiedliche Informationen gespeichert sind. Man muss selbst in jedes Zimmer gehen, um die Informationen zu sammeln und zu organisieren. Comet hingegen versucht, dieses Gebäude in ein intelligentes Wesen mit einem einheitlichen Zentralnervensystem zu verwandeln. Man muss nur im Foyer (Comet-Assistent) Befehle geben, und dieses intelligente Wesen geht für einen in alle Zimmer und bringt alles, was man möchte. Dies ist ein Paradigmenwechsel von der „Raumverwaltung“ zur „Intelligenzdelegation“.

Das Kernwerkzeug, mit dem Comet seine großen Pläne verwirklicht, ist der Comet-Assistent (Comet Assistant) in der Seitenleiste. Seine Magie beruht auf der tiefen Integration von zwei Fähigkeiten: einerseits auf dem „Situationsbewusstsein“ über eine einzelne Seite hinaus, andererseits auf der „Agentenausführung“, die ähnlich der von Manus AI ist und Informationen in Aktionen umwandelt.

Diese Erfahrung unterscheidet sich von den bisherigen AI-Browsern, die auf der Informationsauswertung einer einzelnen Webseite basieren. Die Fähigkeit von Comet hat das Potenzial, unsere Art, mit komplexen Informationsströmen umzugehen, weiter zu verändern.

Stellen Sie sich vor, Sie machen sich Gedanken über den Kauf einer neuen Kamera. In Ihrem Browser sind mehrere Registerkarten geöffnet: die Produktseiten von E-Commerce-Websites, ausführliche Tests auf professionellen Fotoseiten, Videos auf YouTube, ein Blogartikel, der die Kamera mit Konkurrenzprodukten vergleicht, und ein Forumbeitrag über die Mängel der Kamera. In einem traditionellen Arbeitsablauf wäre dies sicherlich ein mühsamer Kampf, der das ständige Hin- und Herwechseln zwischen verschiedenen Seiten und das Notieren und Vergleichen mit Hilfe des Gehirns oder eines Notizbuchs erfordert.

Aber in Comet wird dieser Prozess komplett neu strukturiert.

Sie können direkt dem Assistenten fragen: „Zusammenfassen Sie anhand der geöffneten Seiten umfassend die Vor- und Nachteile dieser Kamera. Insbesondere: Wie unterscheidet sich die Videofunktion und die Bedienbarkeit im Vergleich zu einem anderen Konkurrenzprodukt? Stellen Sie das Ergebnis in einer Tabelle dar. Was meinen die professionellen Testseiten über das Problem der schlechten Bildqualität bei geringer Beleuchtung, über das die Nutzer im Forumbeitrag klagen?“

Der Comet-Assistent spielt hier die Rolle eines erstklassigen professionellen Assistenten | Bildquelle: GeekPark

Er kann schnell alle Seiten lesen und verstehen, einschließlich Videountertiteln und Forenbeiträgen, und dann einen strukturierten, umfassenden Bericht erstellen, der die Ansichten aller Seiten zusammenfasst. Dies ist die Macht des „Situationsbewusstseins“, das isolierte Registerkarten zu einer einheitlichen, dynamischen Browser-Sitzung (Browse Session) integriert, die sein Gedächtnis und Arbeitsraum ist.

Ich muss nicht mehr selbst browsen, sondern lasse es meinen intelligenten Agenten erledigen | Bildquelle: GeekPark

Diese Fähigkeit ist nicht nur für die Kaufberatung nützlich, sondern zeigt sich besonders in komplexeren Arbeitsaufgaben im Bereich der Fachwissensforschung.

Angenommen, Sie schreiben einen Marktanalysebericht. In Ihren Registerkarten befinden sich eine PDF-Industrieforschung, eine Google-Sheet-Datenbank und ein Entwurf Ihres Google-Docs-Berichts. Sie können direkt an Comet eine Reihe von aufeinanderfolgenden Agentenbefehlen geben: „Extrahieren Sie aus dem dritten Kapitel der PDF alle Schlüsselangaben zum Marktvolumen und zur Wachstumsrate und füllen Sie sie in mein geöffnetes Google-Docs-Dokument ein. Generieren Sie dann drei zentrale strategische Empfehlungen.“

Bei dieser Reihe von aufeinanderfolgenden Befehlen kann der Comet-Assistent nach der Generierung des entsprechenden Inhalts auf eine AI-Agenten-Art und Weise mein Online-Dokument in der richtigen Formatierung ausfüllen.

Der Comet-Assistent kann gleichzeitig mehrere Webseiteninformationen lesen und handeln | Bildquelle: GeekPark

Sie können natürlich auch weitere Anforderungen stellen: die Formatierung feinabstimmen, die Details erweitern oder sogar einen Titel vorschlagen lassen und automatisch ändern.

Comet kann komplexere Aufgabenanforderungen erfüllen, indem es mehrere Webseiten gleichzeitig überwacht und handeln kann | Bildquelle: GeekPark

Um eine nahtlose Erfahrung zu gewährleisten, bittet Comet auch um die Berechtigung, den Kalender und die E-Mails einzusehen, um eine personalisierte Agentenhilfe zu bieten.

Comet bittet den Nutzer zu Beginn um die Erteilung verschiedener Berechtigungen | Bildquelle: GeekPark

Darüber hinaus ist der AI-Agent eine wichtige Funktion, die Perplexity in Comet integriert hat. Comet ermöglicht es dem AI-Agenten, direkt im lokalen Browser Aufgaben auszuführen (z. B. Massenwebseitenoperationen, automatisierte Formulare, plattformübergreifende Operationen usw.), ohne auf eine Cloud-Umgebung angewiesen zu sein. Der Prozess ist reibungslos und erfordert kein erneutes Anmelden.

Sie können direkt Ihre Anforderungen stellen, und Comet versteht automatisch und öffnet die entsprechende Website, um Ihre persönlichen Informationen zu ändern. Dies ist der Grund, warum Comet am Anfang viele sensible Zugangsdaten benötigt – aber Sie müssen sich keine Sorgen um die Datensicherheit machen, da alle Bearbeitungen von Webseiteninformationen lokal erfolgen.

Hier hat Comet die Rolle des Informationsintegrators überwunden und ist zum Ausführenden des Arbeitsablaufs geworden. Es hilft einem nicht nur zu „sehen“, sondern auch zu „tun“.

Der größte Verkaufspunkt von Perplexity Comet besteht darin, dass es Browser-Level-Automatisierung und tiefe AI-Integration wirklich umsetzt und „AI wirklich für uns im Internet surfen und Aufgaben erledigen lassen“ zu einer real nutzbaren Szene für die neue Produktivität macht.

Die „Strategische Entscheidung“ der AI-Browser

Was die praktische Erfahrung betrifft, ist Comet einer der am besten entwickelten AI-Agent-Browser. Nachdem ich Arc kennengelernt habe, ist Comet wieder ein Browser, der mich dazu bringt, meinen Standardbrowser von Chrome zu wechseln. Aber bedeutet dies wirklich, dass Comet in der Welle der AI-Browser überleben kann?

Angesichts der AI-Welle haben die Browserprodukte auf dem Markt tatsächlich drei verschiedene Entwicklungspfade gewählt. Die Wahl von Comet bestimmt seine einzigartige Position und weist auch auf die Herausforderungen hin, denen es gegenüberstehen wird.

Der am häufigsten gewählte und konservativste Pfad kann als „Werkzeugverbesserer“ bezeichnet werden. Repräsentiert werden diese von Chrome mit Gemini und Edge mit Copilot. Ihr Kerngedanke lautet: „Browser + AI“. Die AI wird als eine mächtige neue Funktion integriert, die es einfacher macht, Webseiten zusammenzufassen und Texte zu verbessern. Dies ist nützlich, aber die Grundform des Browsers und die Nutzungshabits der Nutzer bleiben unverändert. Die AI ist nur ein besseres neues Werkzeug.

Die Implementierung von Gemini in Chrome ist ein berühmtes Beispiel für diese Richtung | Bildquelle: GeekPark

Ein weiterer Schritt ist die „Agentenausführung“. Repräsentiert werden diese von einigen experimentellen Projekten, die es der AI ermöglichen, basierend auf unscharfen Nutzerabsichten aktiver mit dem Browser zu interagieren und sogar Berichte oder Anwendungen in der Cloud zu generieren. Hier hat die AI ihre Rolle von einem „Werkzeug“ zu einem „primären Assistenten“ mit einer gewissen Autonomie erweitert.

Comet hat sich für den dritten, am radikalsten und phantasiereichsten Pfad entschieden – die „Umgebungsrekonstruktion“. Die Forscher auf diesem Weg glauben, dass in der AI-Zeit die AI nicht nur eine Funktion des Browsers sein sollte, sondern der Browser selbst sollte eine AI-Umgebung sein. Ihr Ziel ist es, die Form des Browsers vollständig neu zu definieren und die getrennten Webseiteninformationsströme in eine kontinuierliche, dialogfähige und intelligente Interaktionsumgebung zu vereinigen.

Perplexity glaubt, dass sich mit der zunehmenden Nutzung von AI-Chatbots zur Informationsbeschaffung die traditionellen Such- und Browsemuster ändern. Comet will diesen Trend nutzen, indem es eine effizientere und intelligenterere AI-gesteuerte Erfahrung bietet, um Nutzer anzuziehen.

Deshalb hat Comet sich entschieden, zur „Umgebungsrekonstruktion“ zu gehören. Dies bedeutet, dass Com