StartseiteArtikel

Kontextaggregation ist der eigentliche Schlachtfeld für Künstliche Intelligenz.

王建峰2025-11-10 10:40
Kontextaggregation ist der eigentliche Schlachtfeld der Künstlichen Intelligenz.

Je mehr Kontextinformationen ein Künstliche-Intelligenz-Modell beherrscht, desto besser ist die Benutzererfahrung. Wenn ein Unternehmen für Künstliche Intelligenz über 100-mal mehr Kontextinformationen über Sie verfügt als andere Unternehmen, hat es einen enormen Wettbewerbsvorteil. Der Wettlauf um Kontextinformationen ist wichtiger als der Wettlauf um eine Reihe von KI-Browsern.

I. Was ist Kontext?

Nehmen wir an, Sie sind seit 30 Jahren verheiratet, haben drei Kinder und wohnen in Peking. Denken Sie darüber nach, wie viel Wissen Sie in diesen 30 Jahren über Ihr Leben, Ihre Familie, ihre Vorlieben, Wünsche, Probleme usw. gesammelt haben. Wer ist besser geeignet, Fragen über Ihre Lebenserfahrungen der letzten 30 Jahre zu beantworten? Google, Amazon, Meta, DeepSeek? Oder Ihr Ehepartner/Ehefrau? Natürlich Ihr Ehepartner/Ehefrau. Sie haben jahrzehntelange Lebenserfahrungen.

Fragen Sie ein Sprachmodell (LLM):

„Wie sollte ich mein Hauptbadzimmer renovieren?“

Wiederholen wir: Wenn Sie nur diese Frage stellen, haben sie keine Hintergrundinformationen. Sie wissen nicht, wie Ihr aktuelles Badzimmer aussieht und ob es zum Stil der anderen Teile Ihres Hauses passt. Eine solche Antwort würde nicht als gut oder relevant angesehen werden. Deshalb werden Menschen, die skeptisch gegenüber Künstlicher Intelligenz sind, diese als nicht so gut empfinden, wenn sie versuchen, so zu antworten. Aber wenn Sie diese Frage Ihrem Ehepartner/Ehefrau stellen, werden Sie eine relevantere Antwort erhalten.

Um genaue, schnelle und nützliche Antworten zu generieren, benötigen KI-Modelle Hintergrundinformationen, die mit der Situation, der Frage oder dem Gespräch zusammenhängen. Hintergrundinformationen können Folgendes umfassen:

• Chatverläufe

• Benutzerabsichten. Welches Ziel möchten Sie erreichen?

• Bereich oder Aufgabe. Handelt es sich um Inhalte aus dem Bereich Programmierung, Schreiben, Medizin, Geschichte usw.?

• Externe Daten: Daten und Informationen auf Smartphones, Google Drive, gedruckten Materialien usw.

• Weltwissen. Fakten über Zeit, Ort, Personen, relevante Entitäten.

Es geht nicht nur um Big Data. Der Kontext ist reiches, vernetztes, zeitbasiertes, ortsbewusstes und sich ständig entwickelndes Wissen über die Welt, in der Sie leben. Denken Sie an das Beispiel der verheirateten Ehepartner: Der Kontext ist Information, ist Erfahrung. Es ist ein tiefes Verständnis Ihrer Vorlieben, Gewohnheiten und vergangenen Erfahrungen. In diesem Sinne kann der Kontext als eine digitale Ehefrau/Ehemann angesehen werden … eine KI, die Sie wirklich kennt. (Nun, das klingt jetzt ein bisschen gruselig.)

Bei JD.com können Sie die Anwendung von Kontextinformationen persönlich erleben. Es weiß, was Sie gekauft und gesucht haben. Wenn Sie also erneut besuchen, sehen Sie die Meldung „Fortsetzen Sie Ihren letzten Einkauf“ oder erhalten Empfehlungen für Produkte, die Ihnen gefallen könnten. Darüber hinaus wird Ihnen empfohlen, Produkte erneut zu kaufen, die Sie bereits einmal bestellt haben.

Beispielsweise führt Instagram Reels jede Sekunde einen komplexen Algorithmus aus, der Ihnen basierend auf Ihren bisherigen Ansichten mehr kurze Videos vorschlägt, die Ihnen gefallen könnten. Aber es weiß nichts über Ihre Amazon-Einkaufsverläufe, Google-Suchverläufe, Gesundheitsinformationen, E-Mails, Reiseverläufe, Freundschaftsbeziehungen und sogar alle Informationen auf Ihrem iPhone. Was wäre, wenn es das wüsste?

Das Startup namens MemO widmet sich der Speicherung von Kontextinformationen. Es ermöglicht es Benutzern, die Interaktionsverläufe mit verschiedenen Sprachmodellen (LLM) zu speichern und diese Erinnerungen zwischen verschiedenen LLMs zu teilen, um die Token-Nutzung und das wiederholte Lernen zu minimieren. In diesem System haben die Benutzer jedoch die volle Kontrolle über ihren eigenen Erinnerungskontext.

II. Nicht alle nutzen heute Künstliche Intelligenz

Trotz der Medienpräsenz und des Marktdrucks hat nicht jeder Künstliche Intelligenz zugestimmt. Für KI-Unternehmen besteht die Herausforderung nicht darin, fortgeschrittene Benutzer zu überzeugen, sondern die skeptische Mittelschicht zu gewinnen. Diese Gruppe von Benutzern ist der Hauptbestandteil des Marktes und bietet die größten Chancen.

Für diejenigen, die skeptisch sind, gelten die gleichen Fragen wie bei jeder neuen Technologie: Was sind die Vorteile? Wie ist es besser als meine aktuelle Methode? Verwenden meine Kollegen/Freunde es? Warum sollte ich mich ändern?

Die skeptische Mittelschicht wird Künstliche Intelligenz nicht akzeptieren, nur weil das Modell qualitativ hochwertig ist. Sie wird es erst akzeptieren, wenn die KI für sie persönlich relevant, nützlich und reibungslos ist. Und sie wird es akzeptieren, wenn die KI über genügend Kontextinformationen verfügt, um für die Aufgaben, die die Mittelschicht erledigen möchte, eine einzigartige Benutzererfahrung zu bieten.

III. Kontextaggregation

Kontextaggregation bedeutet, dass kontinuierlich alle Aspekte des Benutzerlebens – was sie kaufen, sehen, lesen, schreiben und sagen – gesammelt und verbunden werden, um ein einheitliches Verständnis zu bilden. Der Lohn ist eine hochgradig personalisierte Erfahrung, die fast wie Telepathie wirkt. Jede ausgezeichnete Antwort wird Sie dazu bringen, mehr Informationen bereitzustellen, was einen Kompoundvorteil schafft, der möglicherweise weit über die heutigen Such- oder Soziale-Medien-Schutzbarrieren hinausgeht.

Dieser Vorteil bringt Sie dazu, ständig mehr Informationen an den Kontextaggregator zu liefern, sodass er scheint, Sie besser kennen zu können als Sie selbst. Dies bildet eine enorme Wettbewerbsbarriere, deren Größe möglicherweise alle anderen Schutzbarrieren in der Verbrauchergüterbranche bisher übertrifft.

Kontextaggregation ist die Methode, um ein neues, auf Künstliche Intelligenz ausgerichtetes Aggregatorunternehmen zu werden, wie Ben Thompson in der Aggregationstheorie definiert hat.

Durch die Integration von Benutzerkontextinformationen können auf KI ausgerichtete Unternehmen eine einzigartige und hervorragende Benutzererfahrung (über dem besten Stand der Branche) bieten, die die Benutzer noch nie zuvor erlebt haben. Es kann Antworten liefern und den Benutzern helfen, ihre Arbeit effizienter zu erledigen, besser als je zuvor und sogar über ihre Vorstellungskraft hinaus.

Heutige Plattformen weisen bereits ein gewisses Maß an Inhaltsaggregation auf. Das Problem ist, dass jede Plattform nur einen Teil Ihres Lebens abdeckt.

Ihre Informationen sind derzeit auf viele verschiedene Technologieunternehmen verteilt. Google und Meta sind beide Informationsaggregatoren. Sie wissen aufgrund Ihrer Interaktionen mit ihren Diensten viel über Sie. Aber es gibt auch viel, was sie nicht wissen.

Sie suchen über Google nach Reisezielen. Sie können möglicherweise die Bestätigungs-E-Mails für Flug- und Hotelbuchungen sehen, aber sie wissen nicht alle Details Ihrer Reise. Ihre Mobiltelefonfotos hingegen könnten alles aufzeichnen.

Stellen Sie sich vor, Sie suchen auf ChatGPT nach Reisezielen und tragen dann ein OpenAI-Kontextaufzeichnungssystem, das alle Orte aufzeichnet, an denen Sie waren, das Essen, das Sie aßen, und die Unterkünfte, in denen Sie übernachteten. Mit diesen Informationen könnten sie Ihnen besser zukünftige Reiseziele empfehlen, oder? Vielleicht würden sie Ihnen auch Flug- und Hotelangebote an den Orten senden, die Sie interessieren. Wenn Ihre Vorschläge und Details Sie überraschen würden, würden Sie dann eher bereit sein, mehr Informationen bereitzustellen? Und wenn alles kostenlos wäre?

IV. Das Problem der Reibung: Warum multimodale Künstliche Intelligenz von entscheidender Bedeutung ist

Aktuelle Sprachmodelle (LLM) sind Texvorhersagemodelle. Das Eingeben und Lesen von Texten ist eine große Herausforderung für die Anwendung von Künstlicher Intelligenz auf dem Massenmarkt.

Multimodale Eingaben können die Entwicklung von Künstlicher Intelligenz beschleunigen. Jede neue Eingabemethode – Sprache, Fotos, Kamera, Sensoren – senkt die Kosten für die Bereitstellung von Kontextinformationen. Deshalb wird die Verbreitung von multimodaler KI viel schneller voranschreiten als die von Internet- oder Mobiltechnologien.

Für diejenigen, die skeptisch sind, scheinen Sprache und Fotos eher akzeptabel zu sein. Sie können jetzt Fotos hochladen und um Ratschläge zur Umgestaltung eines Raumes bitten. Aber nicht jeder weiß das. Ein Foto zeigt auch nicht das gesamte Haus und kann nicht die Vorlieben des Bewohners in Bezug auf das Innenausbauen widerspiegeln. Fotos helfen zwar, aber sie sind nur die Spitze des Eisbergs. Sie zeigen nicht das gesamte Haus, kennen Ihre früheren Entscheidungen nicht und wissen auch nichts über die Vorlieben Ihres Partners.

Wiederholen wir: Wenn das Gerät, das Sie tragen, während Sie sich bewegen Fotos von Ihrem Haus machen kann und Sie erlaubt, bei Bedarf eine Sprachkommentierung hinzuzufügen, können so mit weniger Widerstand mehr relevante Kontextinformationen erfasst werden.

Das Reduzieren der Reibung ermöglicht nicht nur ein schnelleres Aufbauen des Kontextes, sondern verstärkt auch die Netzwerkeffekte. Jeder neue Benutzer trägt mehr sinnvolle Kontextinformationen zum System bei.

V. Der Vorteilsflughrad

Vorhandene Aggregatorplattformen wie Google, Netflix, Amazon, Meta und Airbnb bedienen sich einem sehr breiten horizontalen Markt. Wie Ben Thompson in der Aggregationstheorie feststellte, wird die Qualität ihrer Dienste umso besser, je mehr Benutzer sie bedienen.

Es gibt hier einige Unterschiede. Vertrauen und Datenschutz werden eine größere Rolle spielen, wenn es darum geht, ob Benutzer bereit sind, mehr Hintergrundinformationen bereitzustellen. Und zweifellos müssen die von der KI gelieferten Ergebnisse zumindest in bestimmten Bereichen hervorragend sein, damit dieser virtuelle Zyklus funktioniert.

Wie würde sich die Situation entwickeln, wenn die Kontextaggregationstechnologie eingesetzt würde? Können KI-Unternehmen genügend Kontextinformationen aggregieren, um neuen Benutzern eine einzigartige Benutzererfahrung zu bieten, ohne dass diese viel Kontextinformationen bereitstellen müssen? Vielleicht können sie genügend Kontextinformationen von neuen Benutzern sammeln, um viele Kontextinformationen vorherzusagen, die die Benutzer nicht bereitgestellt haben? Dies würde es KI-Unternehmen ermöglichen, ihre aggregierten Informationen schneller zu integrieren.

Zusammenfassung

Natürlich wirft die Kontextaggregation viele tiefe ethische und datenschutzrechtliche Fragen auf. Dies ist an sich ein umfangreiches Thema, das separat diskutiert werden sollte. Natürlich ist auch die Regulierung ein Thema, das umfassend besprochen werden muss.

Im Kampf um die KI wird der endgültige Sieger nicht diejenigen sein, die das größte Modell oder den besten KI-Browser haben, sondern diejenigen, die über die reichhaltigsten und vertrauenswürdigsten Kontextinformationen verfügen, die meisten Benutzern dienen und diese Informationen in eine bisher nie dagewesene, einzigartige Benutzererfahrung umwandeln. Diese Benutzererfahrung kann nicht nur die Bedürfnisse der Benutzer präzise erfüllen, sondern auch eine noch reichhaltigere Erfahrung bieten, als erwartet. Eine solche Erfahrung wird die Stellung des Kontextaggregators im Bereich der Künstlichen Intelligenz als „fast alles beherrsender“ festigen.

Aber um erfolgreich zu sein, muss diese Benutzererfahrung den Menschen, insbesondere der skeptischen Mittelschicht, helfen, Dinge schneller, einfacher und kostengünstiger zu erledigen, als sie es je für möglich gehalten haben. Und wie ich schon sagte, muss es auf eine Weise präsentiert werden, die die Benutzer verblüfft und über ihre Vorstellungskraft hinausgeht.

Welche Art von Diensten und Geräten sollte ein auf KI ausgerichtetes Unternehmen entwickeln, um den Kontextkampf zu gewinnen? Welche Rolle spielt dies im Kontextkampf, wenn Sam Altman über das Erreichen der Superintelligenz spricht? Müssen die Benutzer das Gefühl haben, dass sie Superintelligenz besitzen, um eine Verbindung zu einem KI-Partner mit reichhaltigen Kontextinformationen herzustellen?

Abschließend führen wir ein Gedankenexperiment durch: Versuchen Sie, sich vorzustellen, welche Dinge eine superintelligente KI für Sie tun würde, damit Sie ihr mehr Informationen über sich selbst geben würden.

Für Softwareentwickler ist das Codieren ein gutes mikroskopisches Beispiel. Tools wie Claude Code (und andere ähnliche Tools) kennen Ihre gesamte Codebasis, Dokumentation, Tests und Einreichungsverläufe. Sie vertrauen ihnen, weil die von ihnen gelieferten Ergebnisse oft erstaunlich sind.

Dieser gleiche Vertrauenszyklus, in dem der Kontext bessere Ergebnisse bringt, was wiederum mehr Vertrauen schafft, wird den Sieger im Kampf um die Kontextaggregation bestimmen.

Dieser Artikel stammt aus dem WeChat-Account „Data-driven Intelligence“ (ID: Data_0101), Autor: Xiaoxiao, veröffentlicht von 36Kr mit Genehmigung.