StartseiteArtikel

Jahresrückblick von a16z: Im Konsumenten-AI-Bereich gewinnt der Stärkste alles. Die Chancen für 2026 liegen in diesen 3 Bereichen.

AI深度研究员2025-12-30 08:40
Im Jahr 2025 ist die Konkurrenz im Bereich KI (Künstliche Intelligenz) sehr heftig, aber die Chancen liegen in erfolgreichen Formaten, Multimodalität und tiefgehenden Benutzerbeziehungen.

Im Jahr 2025 war die Aufregung um konsumentenorientierte KI wie nie zuvor.

OpenAI hat innerhalb eines Jahres mehrere Dutzend Updates veröffentlicht und ChatGPT zu einer Super-Eingangspforte gemacht: Gespräche, Bilder, Gruppenchats, Sora-Videos - alles wird in einer einzigen App gebündelt. Google, Anthropic und Grok kämpfen ebenfalls um die Eingangspforte, und Nano Banana sowie Veo dominieren die Bildschirme nacheinander.

Aber ein Investor von a16z hat die Realität auf den Punkt gebracht:

Es gibt viele Produktveröffentlichungen, aber nur wenige, die das Verhalten der Nutzer wirklich verändern.

Schauen wir uns die Zahlen an: ChatGPT hat 800 bis 900 Millionen wöchentliche aktive Nutzer, während Gemini nur 30 bis 40 Prozent davon erreicht. Weniger als 10 Prozent der Nutzer haben mehrere Plattformen besucht, und nur 9 Prozent sind bereit, für mehrere gleichzeitig zu bezahlen. Die meisten Menschen nutzen nur ein KI-Tool, und das Muster des Sieger-Takes-All-Managements hat sich bereits herausgebildet.

Heißt das, dass es keine Chancen für KI-Startups im Jahr 2026 gibt? a16z meint, dass dies nicht der Fall ist. Der Schlüssel liegt nicht in den Modellen, sondern in diesen 3 Bereichen.

Erstellen Sie das richtige Produkt: erfolgreiche Stile und multimodale Ansätze;

Ergreifen Sie die Nutzer: die Tiefe der professionellen Nutzer;

Vermeiden Sie die Großkonzerne: Rechenleistungslast und organisatorische Blindflecken.

Keiner dieser Bereiche gewinnt durch die Fähigkeit des Modells, sondern durch ein Produkt, das die Nutzer besser versteht.

Erster Bereich | Senken Sie die Schaffensschwelle mit erfolgreichen Stilen

ChatGPT hat sich über Gespräche als Eingangspforte etabliert, aber die Nutzer sind nicht wirklich an den Gesprächen, sondern an der Schaffenskraft interessiert.

Justine Moore, Partnerin von a16z, sagte bei der Rückschau auf das Jahr 2025, dass die am meisten verbreiteten KI-Produkte dieses Jahres nicht neue Modelle waren, sondern Bilder oder Videos, die die Menschen dazu brachten, etwas Ähnliches zu erstellen.

Sie nannte zwei Beispiele: die Ghibli-stiligen Bilder von OpenAI und Nano Banana von Google. Ihr Gemeinsames ist, dass sie einen klaren Stil haben und es ermöglichen, sofort etwas zu erstellen.

Diese Art von Produkten gibt Ihnen nicht die Möglichkeit, darüber nachzudenken, was Sie tun können, sondern bietet Ihnen direkt einen Ausgangspunkt. Sie müssen nur darauf klicken, den Namen ändern, die Rolle verändern und können es in der nächsten Sekunde in sozialen Netzwerken veröffentlichen.

Investoren von a16z nennen dies "Senken der Schwelle mit Vorlagen": Statt auf die Fähigkeit des Modells zu setzen, setzen sie auf einen guten Gestaltungsstil, der es den Nutzern erspart, sich über den Anfang Gedanken zu machen. Beispiel:

Die Bildseite von ChatGPT zeigt nicht mehr nur ein leeres Eingabefeld, sondern präsentiert aktive Beispiele wie Festtagskarten, Skizzen von Gesichtern, verkleidete Tiere und vieles mehr;

Start-up-Tools wie Krea ermöglichen es den Nutzern, Charaktere und Stilmaterialien zu speichern und beim nächsten Mal direkt wiederzuverwenden;

Die Schwierigkeit bei diesen Produkten liegt nicht in der Technologie, sondern in Ästhetik, Komposition und kulturellem Verständnis. Ein anderer Partner, Bryan Kim, fasste es in einem Satz zusammen:

Stile sind stärker einprägsam als Technologie.

Diese Zusammenfassung ist beachtenswert. Denn viele Start-up-Unternehmen können nicht auf der Grundlage des zugrunde liegenden Modells gewinnen, aber wenn Sie einen Stil, ein Videokonzept oder eine Charaktervorlage früher als ChatGPT so gestalten können, dass die Nutzer sie sofort nutzen, können Sie die Aufmerksamkeit der Menschen erregen.

Diese erfolgreichen Vorlagenstile werden auch intelligenter.

Nano Banana Pro kann bereits ein Video ansehen und automatisch Infografiken, Marktpläne und sogar passende Symbole und Farbschemata generieren; Claude nutzt ebenfalls die "artifacts"-Funktion, um es den Nutzern zu ermöglichen, den Stil und die Struktur der generierten Inhalte zu bearbeiten. Sie können nicht nur die Ergebnisse betrachten, sondern auch an der Verbesserung mitwirken.

Deshalb gehen sie davon aus, dass der nächste Schritt bei Bild- und Videomodellen nicht die Realismussteigerung ist, sondern die Möglichkeit, dass die Nutzer den Stil beliebig ändern können. Es geht nicht darum, die Schaffenskraft zu ersetzen, sondern die Art und Weise, wie man mit der Schaffung beginnt, neu zu definieren.

Zweiter Bereich | Verbinden Sie die Schaffenswege mit Multimodalität

KI-Funktionen wie Bilder und Videos scheinen nur zur Inhaltserstellung zu dienen, aber die Investoren von a16z sehen ein größeres Potenzial: Wenn die multimodalen Fähigkeiten kombiniert werden, könnten diese Funktionen den gesamten Schaffungsprozess neu gestalten und sogar neue Produkt-Eingangspforten werden.

Justine sagte in einem Rundetischgespräch, dass bereits die Hälfte der Inhalte in sozialen Netzwerken, die sie sieht, KI-generierte Videos sind, insbesondere Veo und Sora, die so real aussehen, dass sie sogar über eine emotionale Kamerasprache verfügen. Diese Inhalte sind so erfolgreich, weil es nicht mehr einfach um die Generierung von Bildern aus Bildern geht.

Sie können die Struktur einer Geschichte verstehen, die Konsistenz von Charakteren aufrechterhalten und sogar Rhythmus und Stil imitieren.

Das Wichtigste ist, dass sie interaktiv sind.

Bryan gab ein Beispiel: "Ich lade ein YouTube-Video hoch und bitte das Modell, mir eine Erklärgrafik zu zeichnen. Und tatsächlich zeichnet es eine. Das Eingabematerial ist ein Video, das Ergebnis ist eine Grafik; ich gebe die URL einer Unternehmenswebsite ein, und es generiert einen vollständigen Werbeentwurf."

Das ist das, was sie als Multimodalität bezeichnen: Sie können alle Arten von Inhalten verarbeiten und alle Arten von Ergebnissen generieren.

Früher waren KI-Tools wie kleine Helfer bei der Beantwortung von Fragen, jetzt beginnen sie eher wie Schaffungswerkzeuge für die Produktentwicklung zu wirken. Sie können alte Fotos, Webseiten, Audioaufzeichnungen hineinwerfen und Bilder, Kurzvideos, Präsentationen, Texte und sogar direkt veröffentlichbare Inhalte erhalten.

Das interne Experimentprodukt Pamelli von Google ist ein typisches Beispiel. Es kann automatisch die Inhalte einer Website abrufen, die Unternehmenspositionierung erkennen, auch den Tonfall der Werbung, die Farbpalette und die Zielgruppe berücksichtigen und direkt drei vollständige Marketingmaterialien generieren.

Die Partnerin Olivia Moore sagte: "Es geht nicht darum, einen Vorschlag zu machen, sondern direkt ein fertiges Produkt zu liefern."

Das ist die kürzeste Distanz zwischen einem großen Modell und den Nutzern. Wenn ein Tool es den Nutzern ermöglicht, von der Idee direkt zum fertigen Produkt zu gelangen, ohne zwischen mehreren Apps zu wechseln, wird es natürlich zum Ausgangspunkt des Arbeitsablaufs.

Die Investoren von a16z haben auch darauf hingewiesen, dass diese Fähigkeit die Grenzen der bisherigen Inhaltserstellung überschreitet.

Claude unterstützt bereits die gemischte Eingabe von Bildern und Texten, und Sora und Veo arbeiten an der Bearbeitung von Videos mit Sprachhinweisen. All das ist sehr beeindruckend, aber am Ende entscheidet, ob die Nutzer bleiben oder gehen, ob die KI ihnen hilft, ihre Aufgaben zu erledigen.

Sie sind der Meinung, dass der Höhepunkt im Jahr 2026 nicht unbedingt ein neues Modell, sondern eine neue Kombination sein wird.

Wer es den Nutzern ermöglicht, sich weniger Gedanken zu machen, weniger zwischen Apps zu wechseln und direkt das gewünschte Ergebnis zu erhalten, der kann ein echtes Produkt schaffen.

Dritter Bereich | Greifen Sie die Tiefe der professionellen Nutzer

Die Investoren von a16z haben ein überraschendes Phänomen beobachtet: Konsumenten von KI-Produkten geben je mehr sie nutzen, desto mehr Geld aus.

Das bedeutet, dass ein Teil der Nutzer nicht nur ein Abonnement abschließt, sondern auch gerne zusätzliche Funktionen kauft und weiterhin Geld ausgibt.

Wer zahlt diese Gelder? Nicht die Menschen, die nur aus Neugierde probieren, sondern diejenigen, die KI wirklich als Werkzeug nutzen.

Sowohl Olivia als auch Bryan haben auf diese Gruppe professioneller Verbraucher hingewiesen, die in den letzten 12 Monaten am schnellsten gewachsen ist. Es sind nicht Forscher oder Ingenieure, sondern diejenigen, die KI in ihrem täglichen Arbeitsablauf nutzen: Betriebswirte, Redakteure, Freiberufler, Kreative.

Diese Nutzer lassen die KI arbeiten. Sie nutzen nicht die Basisversion von ChatGPT, sondern:

Der Comet-Browser von Perplexity: Sie können Daten recherchieren und gleichzeitig die KI bitten, diese automatisch in Notizen oder Grafiken zu übersetzen;

Der 11 Labs Reader: Er wandelt den Text eines Artikels in gesprochene Sprache um, so dass Sie während der Pendelfahrt Zeit sparen können;

Granola: Es protokolliert automatisch Meetings, ordnet historische Inhalte und bereitet sich so auf das nächste Meeting vor;

Cursor: Sie können direkt in Ihrem Code-Editor die KI aufrufen, um Code zu schreiben und ihn dann zu testen;

Gamma: Es generiert direkt aus einem Dokument eine Präsentation, ohne dass Sie PowerPoint öffnen müssen.

Das Gemeinsame an diesen Tools ist, dass sie über ein Gedächtnis verfügen. Die KI schaut sich an, was Sie in der Vergangenheit gesagt oder getan haben, und setzt dann die Arbeit fort.

Olivia sagte, dass sie die Connector-Funktion von ChatGPT getestet hat, die es dem Modell ermöglicht, Kalender, E-Mails und Dateien zu lesen, um innerhalb eines bestimmten Zeitraums nützliche Materialien zu finden, Gedanken zu sammeln und Vorschläge zu machen. Obwohl diese Funktion noch nicht stabil ist, ist sie der Meinung, dass, sobald diese Art von Produkten reibungslos funktioniert, es nicht mehr so einfach ist, auf ein anderes KI-Tool umzusteigen, sondern dass man es gar nicht mehr will.

Diese Szenarien haben ein gemeinsames Merkmal: Sie werden täglich genutzt.

Bryan sagte, dass er ChatGPT im Durchschnitt etwa 24 Mal pro Woche nutzt, was etwa drei bis vier Mal pro Tag entspricht. Im Vergleich dazu öffnen die meisten Nutzer andere Tools nur ein bis zweimal pro Woche. Nur wenn ein Tool täglich genutzt wird, hat es sich wirklich in den Arbeitsablauf integriert.

Deshalb sind sie der Meinung, dass der Wettlauf um diese Gruppe professioneller Nutzer das nächste Schlachfeld im Bereich der Konsumenten-KI sein wird. Das Ziel der Produkte ist nicht mehr, dass möglichst viele Menschen sie herunterladen, sondern dass die Nutzer bleiben, sich häufig und intensiv nutzen und weiterhin bezahlen.

Wenn diese Gruppe professioneller Nutzer sich an ein Tool gewöhnt hat, ist der Wechselaufwand sehr hoch.

Vierter Abschnitt | Großkonzerne sind schneller, Start-ups sind mutiger

Da es so schwierig ist, diese professionellen Nutzer zu gewinnen und die Bindung so stark ist, wer hat die besseren Chancen: die Großkonzerne oder die Start-ups?

In diesem Jahr haben die Großkonzerne ihre Produkte rasant aktualisiert, und es gibt immer mehr davon.

OpenAI hat Sora, Gruppenchat, Pulse, ein Bildtool, den Browser Atlas und einen App-Store vorgestellt;

Google hat zwischen Gemini, Labs und AI Studio eine Vielzahl von experimentellen Funktionen eingeführt;

Anthropic hat drei Routen für Claude eingeführt: "artifacts", "skills" und "Claude Code".

Justine sagte: "Große Unternehmen haben in der Konsumentenebene Dutzende von Richtungen getestet, aber nur wenige Produkte haben sich bewährt."

Im Gegenteil, einige KI-Start-ups haben zwar einfache Funktionen, aber eine hohe Akzeptanz bei den Nutzern.

Das beste Beispiel ist der Comet-Browser, der eine höhere tägliche Aktivität und eine bessere Retention hat als ChatGPTs Atlas. Selbst wenn seine Funktionen noch nicht vollständig sind, wird er von den frühen Nutzern wiederholt genutzt. Auch Lovable hat sich für die Richtung der App-Generierung entschieden. Es kann nicht alles, aber es macht einige gängige Anwendungen besonders benutzerfreundlich.

All diese Produkte haben ein gemeinsames Merkmal: Sie konzentrieren sich auf ein Szenario und gehen tief und konkret darauf ein.

Der Grund ist einfach: Die Großkonzerne kämpfen um die Eingangspforte, während die Start-ups um die Richtung kämpfen. Die ersteren müssen Milliarden von Nutzern bedienen, die Einhaltung der Vorschriften gewährleisten und die Plattform im Auge behalten; die letzteren wollen nur ein häufiges kleines Szenario identifizieren und es perfektionieren.

Darüber hinaus haben die großen Unternehmen eine versteckte Belastung: die Verteilung der Rechenleistung.

Justine sagte, dass Unternehmen wie OpenAI und Google ständig zwischen der Schulung neuer Modelle und der Unterstützung der Nutzerwahrnehmung abwägen müssen. Sobald eine Bildanwendung zu beliebt wird, werden die Ressourcen für die Rückschlussfolgerung im Hintergrund schnell aufgebraucht, was möglicherweise den Schulungsplan für das nächste große Modell verzögern kann.

Bei Start-ups gibt es dieses Problem nicht. Sie können flexibel zwischen Claude, GPT, Gemini und sogar lokalen Modellen wählen, um nur einem Ziel zu dienen: Was der Nutzer in diesem Moment braucht, wird ihm gegeben.

Bryan sagte:

"Je weiter man auf der Anwendungs-Ebene voranschreitet, desto weniger muss man sich direkt mit den Großkonzernen messen. Wenn man ein wirklich nützliches Produkt schafft, bleiben die Menschen von allein."

Deshalb sind a16z besonders optimistisch in Bezug auf die neuen Geschäftsmöglichkeiten in der Konsumenten-KI: Es geht nicht darum, einen neuen ChatGPT zu erschaffen, sondern darum, auf der Grundlage der bereits vorhandenen Modellfähigkeiten ein Frontend-Produkt zu entwickeln, das umsetzbar, wiederverwendbar und nutzerbindend ist.

Es ist besser, ein Produkt zu schaffen, das ChatGPT nicht gut macht, als den nächsten ChatGPT zu werden.

Abschluss | Wer wird 2026 ein Produkt schaffen, das die Nutzer nicht missen können?

ChatGPT hat sich bereits als Eingangspforte etabliert, und die Modellfähigkeiten sind ausreichend.

Von nun an liegt die echte Chance nicht darin, ein stärkeres Modell zu entwickeln, sondern darin, ein Produkt zu schaffen, das die Nutzer nicht missen können.

Die Investoren von a16z haben drei Richtungen aufgezeigt:

Der Stil sollte bereits vorhanden sein, damit die Nutzer nicht von einer leeren Seite starten müssen;

Der Weg sollte reibungslos sein, so dass die Nutzer von der Idee direkt zum fertigen Produkt gelangen können, ohne zwischen mehreren Tools zu wechseln;

Die Tiefe sollte ausreichen, damit die professionellen Nutzer es täglich nutzen und weiterhin bezahlen.

Die Großkonzerne kämpfen um die Eingangspforte, während die Start-ups um die Richtung kämpfen. Konzentrieren Sie sich auf ein Szenario und gehen Sie es tief und konkret an. Die Modelle gehören den Großkonzernen, aber wer die Nutzer gewinnt, ist noch nicht entschieden.

Das Produkt muss nicht groß sein,