Die 100-tägige rasante Entwicklung von Meituan Tabbit
In der Vergangenheit waren die medizinischen und hygienischen Bedingungen schlecht. Neugeborene starben innerhalb von 100 Tagen leicht. Nach 100 Tagen sank das Risiko des Ablebens deutlich. Allmählich hat sich in der Bevölkerung die Tradition des "100-Tage-Festes" gebildet.
So ist es mit Menschen, und so ist es auch mit Produkten.
Am 2. März startete das Team von Guangnianzhiwai unter Meituan die öffentliche Beta-Phase des AI-Native-Browsing-Tabbit. Nach 100 Tagen und 12 Versionen stellte es am 9. Juni, in der Zeit des Hochschulaufnahmeprüfungskreislaufs, die Version 1.0 vor.
Ein Insider teilte früher der Guangzi Xingqiu mit, dass das Team viele Ideen hatte, aber nicht wusste, welche die Benutzer tatsächlich kaufen würden. Sie konnten nur durch häufige Iterationen ausprobieren. Jetzt, nach der kontinuierlichen Rückmeldung des Marktes und der Benutzer, ist die Version 1.0 endlich die vorläufige Testphase abgeschlossen. Durch eine Reihe neuer Funktionen können wir auch klarer die Produktform dieses AI-Browsers sehen:
Unterstützung der freien Umschaltung zwischen mehreren Modellen, neue Funktion der Antworten von mehreren Modellen. Maximal können 5 Modelle gleichzeitig dieselbe Frage beantworten;
Verbesserte Kontextverstehen, einschließlich des Gedächtnisses über mehrere Gespräche hinweg, der Anbindung lokaler Verzeichnisse und der Unterstützung des Cloud-MCP-Protokolls;
Das System der benutzerdefinierten Makrobefehle "Clever Tricks" ist weiter verbessert. Der "Clever Tricks Platz" bietet eine Vielzahl von Lösungen für das Einfügen mit einem Klick;
Das unterliegende Kernsystem ist auf Chromium 148 aktualisiert, und die UI und die vertikale Tab-Leiste sind synchron optimiert.
In Bezug auf den Preis ist die Standardversion von Tabbit 1.0 dauerhaft kostenlos. Der wöchentliche Token-Kontingent wird automatisch zurückgesetzt; die Pro-Version erhöht das Kontingent um das 10-fache. Interessanterweise, obwohl Tabbit "dauerhaft kostenlos" auf den Bildschirm schreibt, ist der Kernverkaufspunkt dieses AI-Browsers nie der "Browser" selbst, sondern die von ihm getragene AI-Fähigkeit.
100-Tage-Tabbit
Seit seiner Entstehung war der Browser immer eine "Nebenrolle".
1995 war der IE-Browser mit Windows gebunden. Das war die 1.0-Era der Browser; 2008 tauchte Chrome auf, und das Thema der 2.0-Era wurde die tiefe Bindung zwischen Browser und Suche. In der mobilen Ära regierten die Apps unabhängig voneinander. Der Wert des Browsers als Einstiegspunkt wurde geschwächt, und er konnte sich nie aus dem Schatten der Suche befreien.
2025 hat die amerikanische Browserfirma The Browser Company ihren eigenen Arc-Browser beendet und den AI-Browser Dia veröffentlicht, was den Anfang der 3.0-Era der Browser markierte. Kurz darauf wurde das Mutterunternehmen von OpenAI übernommen. Im ausländischen Markt rennen AI-native Browser und traditionelle, AI-umgewandelte Browser parallel voran.
In China wird auch die AI-Umgestaltung der Browser durchgeführt, aber insgesamt bleibt die Form der 2.0-Era erhalten. Beispielsweise tragen sie Suche, Community, SaaS und Plugins, aber es ist nur eine andere Formel.
Der Raum für traditionelle Browser mag begrenzt sein, aber für AI-Browser ist es anders.
Große Sprachmodelle haben die Angebote auf Webseiten stark bereichert. Die Kernträger der generierten Artikel, Berichte und Bilder sind fast alle Webseiten. Der traditionelle Browser ist bereits durch verschiedene SaaS-Produkte, Plugins und kleine Fenster überlastet und kann die neuen Angebote nicht aufnehmen. Dagegen hat der AI-Browser das Potenzial, ein neuer Container zu werden.
Wichtiger ist, dass weder der traditionelle Browser noch die AI-Tools das Problem der Trennung der Benutzer-Szenarien gut lösen können. Beispielsweise lösen die Desktop-Intelligenzen auf dem Markt nicht das Problem, dass viele repetitive Aufgaben wie Kopieren, Einfügen, Hochladen, Ausschneiden und Eingeben die begrenzte Zeit beanspruchen und auch einen gewissen Informationsverlust verursachen. Der Browser kann natürlich den Kontext mit den Benutzern teilen. Nach der Einbettung von großen Sprachmodellen und Agenten kann er gut als AI-Träger fungieren.
Es gibt auch viele Herausforderungen. Es ist nie einfach, die Gewohnheiten der Benutzer zu ändern. Es braucht nicht nur Zeit, sich an die neue Betriebs- und Interaktionsform des AI-Browsers zu gewöhnen. Das erste, was Tabbit getan hat, ist die Bereitstellung einer Migration mit niedriger Schwelle. Nach der Installation der App wird die Option zum Migrieren des Standardbrowsers angeboten.
Beim Produktdesign hat Tabbit nicht alles von Grund auf neu entwickelt. Es hat zwei Kernmodule des traditionellen Browsers, die Tab-Leiste und das Lesezeichen, beibehalten, aber sie mit AI umgestaltet.
Wenn die AI arbeitet, muss sie oft mit Webseiten interagieren, wie das Ausfüllen von Formularen und das Klicken auf Links. Dies kann leicht die Maus und die Tab-Leiste übernehmen. Dies ist eine Situation, die viele Menschen beim Verwenden von AI-Browsern und Agenten oft erleben. Tabbit hat durch technische Mittel die Tab-Leiste in Tab-Gruppen umgewandelt. Die Benutzer können die Gruppen nach ihren Gewohnheiten selbst erstellen oder die AI die intelligente Organisation überlassen, um die Nutzung der Benutzer und die Arbeit des Agenten voneinander zu trennen.
Nachdem der Benutzer eine Aufgabe an den Agenten gibt, erstellt die AI eine unabhängige Tab-Seite und führt die Aufgabe automatisch auf dieser Seite aus. Der Benutzer kann auf einer anderen Tab-Seite normal surfen und arbeiten, ohne sich gegenseitig zu stören.
Das Lesezeichen des traditionellen Browsers speichert nur URLs. Tabbit speichert den gesamten Text und erstellt einen RAG-Index, um den Kontext für den Betrieb des Agenten bereitzustellen.
Um das Problem der Trennung von AI-Chat-Produkten von der Benutzer-Arbeitsablauf zu lösen, hat Tabbit die Funktion "Clever Tricks" entwickelt und in Kombination mit der Fragebox in der Seitenleiste dem Browser die Fähigkeit gegeben, zu sprechen und zu handeln. Beispielsweise kann er Fragen in Kombination mit Bildern und dem Webseitenkontext beantworten, den Inhalt der aktuellen Seite erfassen, sogar kommentieren und als CSV-Datei exportieren.
Offensichtlich gibt es für neue Benutzer immer noch Schwierigkeiten, diese Funktionen zu nutzen. Daher wurde in der Version 1.0 der "Clever Tricks Platz", der verschiedene Funktionen integriert, stark erweitert.
"Clever Tricks" ist eine benutzerdefinierte Funktionseinheit, die verschiedene Fähigkeiten enthält. In gewissem Sinne ähnelt es einem AI-verstärkten Makrobefehl. Die Clever Tricks der Prompt-Vorlagen entsprechen Skills, die eine komplexe Prompt in einen Tastaturkurzbefehl komprimieren und mit einem Klick senden können; die automatischen Aufgabenausführungsklassen sind hauptsächlich die Agent-Aufgaben, die der Benutzer einmal oder mehrmals ausgeführt hat und die als Clever Tricks gespeichert werden können, um sie mit einem Klick wiederzuverwenden.
Darüber hinaus kann Clever Tricks mit Hilfe von AI JavaScript-Skripte generieren und das DOM oder das Verhalten der Webseite ändern, um die einzigartige Fähigkeit zur Neuüberschreibung von Webseiten-Skripten zu haben. Beispielsweise kann die Startseite von Xiaohongshu in die Form des TikTok-Feed-Stroms, die Form einer Excel-Tabelle usw. umgewandelt werden.
Funktions-Puzzle
Die Modellfähigkeit ist die "Grenze" des AI-Browser-Erlebnisses. Bisher haben fast alle AI-Browser ein Modell tiefgehend gebunden. Die Nützlichkeit des Browsers hängt ganz davon ab, wie leistungsfähig das Modell ist.
Dia hat sich an ChatGPT gebunden, Quark an Qwen. Diese tiefe vertikale Integration hat es ihnen ermöglicht, frühzeitig das Vertrauen der Benutzer aufzubauen. Aber in diesem Modell ist der Browser eher ein "Fenster" des Modells und ist nur für alltägliche Gespräche und einfache Generierung verantwortlich.
Spätere Browser haben erkannt, dass der Browser viel mehr tun kann. Darüber hinaus ermöglicht das "mehr ist besser" -Konzept mit mehreren Modellen, dass der Browser die Fähigkeitsgrenzen eines einzelnen Modells überschreiten kann. Ab dem QQ-Browser wurde versucht, die Bindung zu brechen. Von Anfang an mit den beiden Modellen Hunyuan und DeepSeek bis heute, wo die Benutzer die Konfiguration selbst anpassen können.
Tabbit hat die Route mit mehreren Modellen des QQ-Browsers fortgesetzt. Die offizielle Erklärung ist, dass die Benutzer je nach Modellfähigkeit ständig umschalten und dass die SOTA-Modelle sich oft ändern. Darüber hinaus gibt es auch Kostenerwägungen. Die Preise der Modelle ändern sich monatlich dynamisch. Der Preis einiger Modelle wird immer teurer. Als Anbieter von begrenztem kostenlosen Zugang kann Tabbit die Modellaufrufe dynamisch anpassen, um die Kosten zu kontrollieren.
Bis jetzt hat Tabbit zwölf Modelle wie Kimi, MiniMax, DeepSeek, GLM, LongCat, Qwen usw. integriert und auch die Funktion der Antworten von mehreren Modellen hinzugefügt. Die verschiedenen Modelle haben unterschiedliche Fähigkeiten, und tatsächlich fragen viele Benutzer verschiedene Modelle an, um die Ergebnisse zu verifizieren. Das Team hat diese Anforderung erkannt und diese Funktion entwickelt.
Die Strategie, alles anzubieten, ist etwas einfach. Aus der Sicht der Benutzer geht es nicht darum, viel zu haben, sondern darum, welches Modell für Coding geeignet ist und welches für die Bildgenerierung. Das System kann sogar die beste Wahl für mich treffen.
Die Einführung von mehreren Modellen ermöglicht Tabbit, auf den Schultern von Riesen zu stehen und bessere Fähigkeiten anzubieten. Ein weiterer Innovation, der auf den Schultern von Vorgängern aufbaut, ist die Umgestaltung der Suchleiste.
Die Suchleiste spiegelt die Entwicklung des Browsers in drei Phasen wider. In der frühen Zeit konnte die Adressleiste des IE-Browsers nur URLs eingeben. Bis 2008, als Chrome veröffentlicht wurde, ersetzte Google die Adressleiste und die Suchleiste des traditionellen Browsers durch eine sogenannte allumfassende, einheitliche Eingabebox OmniBox, mit der die Menschen Schlüsselwörter suchen konnten.
In fast 20 Jahren kann die OmniBox die neuen Anforderungen nicht mehr erfüllen. Die Informationen, die die Benutzer eingeben, werden immer reicher, einschließlich Text, Bilder, Dokumente, Webseiten und vieles andere.
Tabbit hat das Denken von Chrome fortgesetzt und die Grenzen des Browsers erweitert, ohne die Gewohnheiten der Benutzer zu ändern. Dies umfasst insbesondere: Hinzufügen der Zitierfunktion, Unterstützung des Hochladens lokaler Dateien und der Auswahl lokaler Ordner für die Massenverarbeitung; Unterscheidung zwischen "Fragen und Antworten" und "Aufgaben", die jeweils der leichten Generierung und der langfristigen Aufgabe entsprechen.
Aus diesen Upgrades kann man sehen, dass Tabbit zwei Hauptlinien bei der Erstellung des AI-Browsers verfolgt: die Verarbeitungsfähigkeit und die Kontext-Vervollständigung. Die Aggregation von mehreren Modellen löst das Problem, "ob es möglich ist, etwas zu tun"; und die neuen Funktionen wie Cloud-MCP, Anbindung lokaler Verzeichnisse und Gedächtnis neben Webseiten, Lesezeichen, alltäglichen Gesprächen und Aufgaben-Gesprächen ermöglichen Tabbit, die Situation der Benutzer besser zu verstehen.
Im Vergleich zu Desktop-Agenten hat das Cloud-MCP-System von Tabbit mehrere offensichtliche Vorteile. Es ist nicht erforderlich, Python und andere Umgebungs-Tools lokal zu installieren, was Platz spart und die lokale Umgebung nicht verschmutzt; die Ausführung der Aufgaben erfolgt vollständig in der Cloud, und die AI sendet nur das endgültige Ergebnis an das angegebene Verzeichnis zurück. Die Anbindung des lokalen Verzeichnisses ist wie ein sicherer Bereich, in dem der Agent sich bewegen kann.
Die Antworten von mehreren Modellen, die Clever Tricks und eine Reihe von Kontext-bildenden Puzzleteilen machen das Gesamtbild von Tabbit allmählich klarer. Tabbit weiß auch, dass ein einzelnes Feature nicht ausreicht, um eine Wettbewerbsvorteil zu schaffen. Deshalb muss es sich an häufigen Iterationen beteiligen, um sicherzustellen, dass ein einzelnes Feature immer drei Monate früher als die Konkurrenz ist.
Meituans Haltung: Weniger Eingriffe, mehr Vorstellungskraft?
Nach der Übernahme von Guangnianzhiwai durch Meituan haben beide internen Teams ihre offiziellen Produkte vorgestellt.
Das Modellteam ist in das LongCat-Projekt integriert und treibt weiterhin die Iteration des großen Sprachmodells voran; die verbleibenden Mitglieder konzentrieren sich auf AI-Anwendungen. Laut Informationen hat dieses kleine Team seit 2023 verschiedene Produktformen ausprobiert und erst nach einer Weile entschieden, sich auf den AI-Browser zu konzentrieren.
Die Entwicklung eines "neuen Spezies" ist riskant und kostspielig, während der Browser relativ sicher ist. Angesichts der Tatsache, dass die Cloud-Riesen AI-Copilot-Produkte auf den Markt bringen, sieht Tabbit viel bescheidener aus: Solange die Informationen schließlich in Form von Webseiten übertragen und gespeichert werden, kann der Browser die alltägliche Arbeit übernehmen. Dann ist es möglich, dass dieser Weg zu einem breiteren Raum führt.
Wenn der AI-Browser einen vollständigen Kontext und die Automatisierungsfähigkeit des Agenten hat, wird es viele Überschneidungen mit AI-Copilot geben. Beide haben allgemeine Fähigkeiten, die Automatisierungsfähigkeit des Agenten ist ähnlich, und die Grenzen des Eingangspunkts sind unklar. Der einzige Unterschied könnte der Kontext-Hauptplatz sein. Der Hauptplatz des Browser-AI-Agenten ist die Internet-Webseiten-Ökosystem, während der AI-Copilot auf dem lokalen Desktop arbeitet. Tabbit 1.0 hat einen kleinen Schritt in Richtung AI-Copilot gemacht.
Um Tabbit zu beurteilen, ist es schwierig, Meituans Pers