Gerade jetzt wurde der erste KI-Browser von OpenAI veröffentlicht! Er ist nicht wie Chrome, aber er will die Art und Weise, wie Sie im Internet surfen, verändern. | Mit Praxis-Test
Gerade jetzt hat OpenAI den ersten Browser ChatGPT Atlas offiziell vorgestellt.
In den letzten zehn Jahren war Chrome im Wesentlichen der Standardzugang für alle, die ins Internet gehen. Aber wenn es jetzt einen AI-Browser gibt, der ChatGPT direkt integriert hat und auch über Gedächtnis- und Agentenfähigkeiten verfügt, würden Sie ihn gerne ausprobieren?
Das ist es, was der heute vorgestellte Atlas leisten soll.
OpenAI erklärt, dass Atlas ein um ChatGPT herum gebauter Browser ist, nicht einfach nur ChatGPT in einen Browser gepackt. Das Kernkonzept ist die umfassende Integration:
Die Seitenleiste jederzeit aufrufen: Klicken Sie auf die Schaltfläche „Ask ChatGPT“, und die ChatGPT-Seitenleiste öffnet sich rechts auf jeder beliebigen Seite. ChatGPT, das immer den Kontext versteht, kann die detaillierten Inhalte der Seite, auf der Sie sich befinden, lesen, Ihnen die Inhalte zusammenfassen, Informationen erklären oder direkt in diesem Fenster Aufgaben bearbeiten.
AI-Hilfsfunktionen: Wenn Sie in einem beliebigen geöffneten Textfeld etwas eingeben, kann ChatGPT Echtzeitkorrekturvorschläge und intelligente Vervollständigungen bieten und Ihnen helfen, effizienter zu schreiben.
Agentenmodus: Dadurch kann ChatGPT im Browser selbstständig mehrstufige Aufgaben ausführen.
Ab heute können macOS-Benutzer ihn nutzen. Benutzer der kostenlosen, Plus-, Pro- und Go-Versionen von ChatGPT können ihn herunterladen und testen. Die Windows-, iOS- und Android-Versionen werden bald erscheinen.
Hier ist der Downloadlink: chatgpt.com/atlas
Der Agentenmodus ist derzeit nur für Plus-, Pro- und Business-Benutzer zugänglich und befindet sich noch in der frühen Phase. Bei der Bearbeitung komplexer Aufgaben kann es zu Fehlern kommen. Wenn Sie Atlas als Standardbrowser festlegen, können Sie außerdem sieben Tage lang ein kostenloses Mitgliedschaftstestabo nutzen und haben ein höheres Nutzungslimit.
Die Gedächtnisfunktion des Atlas-Browsers ist ziemlich interessant. Sie ermöglicht es ChatGPT, den Kontext der von Ihnen besuchten Websites zu merken und diese Informationen bei Bedarf abzurufen.
Sie können es beispielsweise fragen: „Finde alle Stellenanzeigen, die ich letzte Woche gelesen habe, und fasse die Branchentrends zusammen, damit ich mich auf ein Vorstellungsgespräch vorbereiten kann.“
Dies könnte vielleicht die vollständige Verwirklichung der Vision eines „AI-Personalassistenten“ sein: Er weiß, wer Sie sind und was Sie getan haben, und kann Aufgaben für Sie ausführen.
Natürlich können Sie bei Fragen der Privatsphäre vollständig kontrollieren, was ChatGPT sehen und merken darf, während Sie surfen. Sie können die Aufzeichnungen einer bestimmten Seite löschen, das gesamte Browsingverlauf leeren oder ein „Inkognito-Fenster“ öffnen, um temporär zu surfen, ohne sich bei ChatGPT anzumelden.
OpenAI behauptet, dass standardmäßig die Inhalte der von Ihnen besuchten Webseiten nicht für das Modelltraining verwendet werden.
Außerdem unterstützt Atlas ebenfalls die Funktion der Eltenkontrolle. Wenn Eltern die Eltenkontrolle für ChatGPT eingerichtet haben, werden diese Einstellungen automatisch auch in Atlas übernommen. OpenAI hat auch neue Eltenkontrolloptionen speziell für Atlas hinzugefügt. Beispielsweise können Eltern das Browsergedächtnis deaktivieren oder den Agentenmodus ausschalten.
Atlas = Google + ChatGPT?
Wenn Sie die Startseite von Atlas öffnen, sieht es immer noch ziemlich ähnlich wie ChatGPT aus.
Nachdem Sie eine Frage eingegeben haben, öffnet Atlas ein Auswahlfenster, in dem die Optionen Google und Chat sowie einige spezifische Links angeboten werden.
Wie der Name schon sagt, führt die Option Google direkt zur Seite eines herkömmlichen Suchmaschinensuchfelds, während die Option Chat ähnlich einem herkömmlichen AI-Chatassistenten ist und das ChatGPT-Modell aufruft, um direkt eine Antwort zu geben. Jede Frage, die Sie auf Atlas stellen, wird in Ihrem ChatGPT-Kontaktverlauf gespeichert.
Neben den Antworten im Dialogfeld können Sie auch die Registerkarten wechseln und sich Suchlinks, Bilder, Videos und Nachrichten ansehen. Die meisten davon haben weiterhin die Option, zur Google-Suchmaschine zu springen.
Beim Fragen stellen gibt es Unterschiede in der Leistung der verschiedenen Modelle.
Zum Beispiel habe ich gefragt: „Dürfen Haustiere jetzt mit dem Hochgeschwindigkeitszug fahren?“ Obwohl man beim Anklicken der Suchquelle direkt auf der offiziellen Website den Link finden kann, der dies erlaubt, hat GPT-5 Instant es nicht geschafft, die richtige Antwort zusammenzufassen.
Im Gegensatz dazu hat GPT-5 Thinking eine korrekte und präzise Antwort gegeben.
Das Interaktionsdesign von Atlas ist ein Pluspunkt.
Traditionelle AI-Plugins werden hauptsächlich in Form von Seitenleisten oder Pop-up-Fenstern angezeigt und umfassen Funktionen wie AI-Chat, Übersetzung und Webseitenzusammenfassung.
Ähnlich wird die Suchergebnisseite von Atlas standardmäßig geteilt mit ChatGPT angezeigt. Wenn Sie auf Ask ChatGPT in der oberen rechten Ecke klicken, ist es wie das Hinzufügen eines AI-Plugins. Die ursprüngliche Webseite wird links angezeigt, und rechts können Sie mehrmalige Dialoge mit ChatGPT führen, anstatt wie bei herkömmlichen Suchmaschinen nur eine einmalige Suche auszuführen.
Wenn Sie beispielsweise ein Wort markieren, kann die Webseite rechts direkt nach diesem Wort suchen oder es erklären, oder Sie können es bitten, einen Artikel zusammenzufassen.
Bei der Live-Show in der Nacht von heute hat ein OpenAI-Mitarbeiter einen Film gesucht und die Filmkritiken auf Websites wie Roger Ebert gelesen. Dann hat er ChatGPT gebeten, die Filmkritik in weniger als fünf Worten zusammenzufassen. Dies ist eine relativ einfache Aufgabe.
Es kann sogar die Texte auf Webseiten optimieren, Titel verbessern usw. Der gesamte Vorgang ist ziemlich reibungslos.
Bei der heutigen Demonstration hat ein OpenAI-Mitarbeiter bei der Schreibung einer E-Mail an die Teamdesigner einfach einen Textabschnitt markiert, auf die ChatGPT-Schaltfläche geklickt und den Befehl „Sprache optimieren“ eingegeben.
ChatGPT hat den Text direkt an Ort und Stelle optimiert. Der Benutzer kann dann weiter bearbeiten und am Ende auf die Schaltfläche „Aktualisieren“ klicken, um den neuen Text zu ersetzen. Diese Funktion vereinfacht die mühsame Prozedur, die früher darin bestand, ständig zwischen Dokumenten und ChatGPT zu kopieren und einzufügen.
Bei der praktischen Tests hat sich gezeigt, dass es auch möglich ist, Videoinhalte zusammenzufassen.
Außerdem unterstützt Atlas auch das Hochladen von Screenshots. Wenn Sie auf das Pluszeichen rechts klicken und „Screenshot hinzufügen“ auswählen, können Sie einen Screenshot hochladen. Ich habe ein Foto von Elon Musk genommen und so vorgegangen, und es hat ihn richtig erkannt.
In Kombination mit dem Agentenmodus in der Seitenleiste kann es auch sehr spaßig sein. Der Nutzer @mteamisloading hat den Agenten auf einer Zeichnungswebsite dazu gebracht, eine Blume zu zeichnen, und der gesamte Vorgang hat nur vier Minuten gedauert.
Es ist erwähnenswert, dass Atlas auch die Möglichkeit bietet, Webseiten-Tabs über @ aufzurufen. Aber Dia kann mehrere Webseiten-Tabs gleichzeitig aufrufen, während Atlas nur einen bereits geöffneten Tab aufrufen kann. Das ist etwas unbefriedigend, aber vermutlich wird es in Zukunft aktualisiert werden.
Der Agentenmodus ist das Highlight des Atlas-Browsers.
Bei der heutigen Demonstration wollte ein OpenAI-Mitarbeiter für ein Essen mit acht Personen kochen und hat eine Rezeptwebsite geöffnet. Er hat ChatGPT gefragt, welche Zutaten er vorbereiten muss. ChatGPT hat die Webseiteninhalte automatisch analysiert, die Mengen berechnet und die Einkaufsliste auch nach den Supermarktsortimenten sortiert, basierend auf den vorher genannten Präferenzen des Nutzers.
Nachdem der Nutzer bestätigt hat, hat der Agent automatisch die Einkaufswebsite Instacart geöffnet, die benötigten Artikel gesucht und in den Warenkorb gelegt. Der gesamte Vorgang hat nur zwei Minuten gedauert. Obwohl es am Ende keine automatische Bestellung gegeben hat, hat der vorbereitete Warenkorb schon viel Zeit gespart. Der Nutzer kann sich die Artikel selbst ansehen und dann entscheiden, ob er sie kaufen möchte.
Zum Beispiel können Sie in der Arbeitsumgebung ChatGPT bitten, vergangene Teamdokumente zu öffnen und zu lesen, eine neue Konkurrenzanalyse durchzuführen und daraus eine Teamzusammenfassung zu erstellen.
Was die praktische Erfahrung betrifft, wenn ich beispielsweise die Anfrage „Kaufe mir ein iPhone 17 Pro Max auf der Apple-Website“ stelle, wird beim Ausführen der Aufgabe im Agentenmodus ein „Kontrolle übernehmen“-Button und ein roter „Stopp“-Button angezeigt. Sie können jederzeit die Kontrolle übernehmen.