StartseiteArtikel

Traum von 2026: Teil 1

神译局2026-01-17 08:00
Was ist das wichtigste Problem, das Entwickler in 2026 lösen müssen, aus der Sicht von Venture-Capital-Partnern?

Das Übersetzungsbüro von Shenyi ist ein Übersetzungsteam unter der Flagge von 36Kr. Es setzt sich für Technologie, Geschäft, Arbeitswelt und Lebensbereiche ein und stellt vor allem neue Technologien, neue Ansichten und neue Trends aus dem Ausland vor.

Herausgeberhinweis: Im Jahr 2026 ist die Bildschirmnutzungszeit tot, und die Aufzeichnungssysteme treten zurück. Wenn KI beginnt, Infrastrukturen für KI zu entwerfen, verschiebt sich die ultimative Schutzmauer des Geschäfts von Traffic hin zu Zusammenarbeit und Individualisierung. Dies ist der erste Teil einer Serienbeiträge. Der Artikel stammt aus einer Übersetzung.

Als Anleger ist es unsere Aufgabe, jeden Winkel der Technologiebranche gründlich zu erforschen und zukünftige Entwicklungstrends wahrzunehmen. Daher laden wir jedes Jahr im Dezember unser Investmentteam ein, ein wichtiges Thema zu teilen, das sie glauben, dass Technologieentwickler im kommenden Jahr anpacken werden.

Heute werden wir die Einsichten von Teams aus den Bereichen Infrastruktur, Wachstum, Bio + Gesundheit sowie dem Speedrun - Team teilen. Die Ansichten der anderen Teams werden später veröffentlicht. Bitte bleiben Sie dran.

Infrastruktur

Jennifer Li: Startup - Unternehmen bewältigen das Durcheinander multimodaler Daten

Unstrukturierte, multimodale Daten sind seit jeher die größte Hürde für Unternehmen und zugleich ihr noch unerschlossener Schatz. Jedes Unternehmen ertrinkt in einer "Schlammlandschaft" aus PDFs, Screenshots, Videos, Protokollen, E - Mails und halbstrukturierten Daten. Obwohl die Modelle immer klüger werden, werden die Eingabedaten immer ungeordneter. Dies führt dazu, dass RAG - Systeme (Retrieval - Augmented Generation) Halluzinationen erzeugen, Agenten auf subtile und kostspielige Weise fehlschlagen, und kritische Arbeitsabläufe immer noch stark auf manuelle Qualitätskontrolle (QA) angewiesen sind. Der momentane limitierende Faktor für KI - Unternehmen ist die "Datenentropie": In der unstrukturierten Welt, die 80 % des Unternehmenswissens enthält, verschlechtern sich die Echtzeitfähigkeit, die Strukturierung und die Authentizität der Daten ständig.

Deshalb ist die Ordnung von unstrukturierten Daten eine einmalige Gelegenheit für unsere Zeit. Unternehmen brauchen eine kontinuierliche Methode, um ihre multimodalen Daten zu reinigen, zu strukturieren, zu validieren und zu verwalten, damit die nachgelagerten KI - Aufgaben tatsächlich umgesetzt werden können. Die Anwendungsfälle gibt es überall: Vertragsanalyse, Einarbeitungsprozesse, Schadenregulierung, Compliance - Prüfungen, Kundensupport, Einkaufsmanagement, technische Suche, Vertriebsbeschleunigung, Analysepipelines und jeder Arbeitsablauf von Agenten, der auf zuverlässigem Kontext angewiesen ist. Wenn Startup - Unternehmen Plattformen schaffen können, die strukturierte Informationen aus Dokumenten, Bildern und Videos extrahieren, Konflikte beilegen, Pipelines reparieren oder die Daten aktuell und durchsuchbar halten, besitzen sie den Schlüssel zur Schatzkammer des Unternehmenswissens und - prozesses.

Joel de la Garza: KI revolutioniert die Rekrutierung im Bereich Netzwerksicherheit

Während des größten Teils des letzten Jahrzehnts war die Rekrutierung die größte Herausforderung für Chief Information Security Officers (CISO). Zwischen 2013 und 2021 stieg die Anzahl der offenen Stellen im Bereich Netzwerksicherheit von weniger als einer Million auf drei Millionen. Der Grund dafür ist, dass Sicherheitsteams hochqualifizierte Techniker anstellen, aber sie den ganzen Tag mit ermüdenden Basisarbeiten an der Frontlinie (z. B. Protokollüberprüfung) beschäftigen, und niemand möchte diese Arbeit machen. Das Kernproblem besteht darin, dass Sicherheitsteams Produkte kaufen, die alles detektieren können, wodurch sie künstlich eine hohe Arbeitslast schaffen - das bedeutet, dass das Team jede Warnung prüfen muss, was wiederum zu einer scheinbaren Personalknappheit führt. Dies ist ein Teufelskreis.

Bis 2026 wird KI diesen Kreislauf durch die Automatisierung der meisten wiederholenden und überflüssigen Aufgaben für Sicherheitsteams durchbrechen und die Rekrutierungslücke schließen. Jeder, der in einem großen Sicherheitsteam gearbeitet hat, weiß, dass die Hälfte der Arbeit vollständig automatisiert werden kann. Aber wenn man mitten in der Hektik steckt, hat man keine Zeit, darüber nachzudenken, welche Schritte automatisiert werden können. KI - native Tools, die diesen Problemen für Sicherheitsteams auf den Grund gehen, werden sie schließlich von lästigen Dingen befreien und ihnen ermöglichen, das zu tun, was sie wirklich tun wollen: Bösewichte verfolgen, neue Systeme aufbauen und Sicherheitslücken beheben.

Malika Aubakirova: Agent - native Infrastruktur wird zur Zugangsvoraussetzung

Bis 2026 wird der größte Infrastruktur - Schock nicht von außen kommenden Unternehmen ausgehen, sondern von innen. Wir gehen von einer vorhersagbaren, wenig parallelen "menschlichen Geschwindigkeit" des Traffics hin zu einer rekursiven, plötzlichen und riesigen Last im "Agenten - Tempo".

Die heutigen Unternehmensbackend - Systeme sind für ein 1:1 - Verhältnis von "eine menschliche Aktion entspricht einer Systemantwort" ausgelegt. Sie berücksichtigen nicht, dass ein "Ziel" eines Agenten innerhalb von Millisekunden 5000 Teilaufgaben, Datenbankabfragen und interne API - Aufrufe in einer rekursiven Ausbreitung auslöst. Wenn ein Agent versucht, ein Code - Repository neu zu strukturieren oder Sicherheitslogfiles zu reparieren, verhält er sich überhaupt nicht wie ein normaler Benutzer. Für herkömmliche Datenbanken oder Strombegrenzer sieht dies eher wie ein DDoS - Angriff aus.

Das Aufbauen von Systemen für Agenten im Jahr 2026 bedeutet, dass die Steuerungsebene neu strukturiert werden muss. Wir werden den Aufstieg von "Agent - native" Infrastrukturen erleben. Die nächsten Generationen von Systemen müssen das "Thundering Herd" - Muster als Standardzustand ansehen. Die Kaltstartzeiten müssen verkürzt, die Latenzschwankungen müssen eliminiert und die Parallelitätsgrenzen müssen um Größenordnungen erhöht werden. Die Engpässe werden sich auf die Koordination verlagern: Routing, Sperren, Zustandsverwaltung und Strategieausführung bei massiv paralleler Ausführung. Die Siegerplattformen werden die einzigen sein, die der Flut von Werkzeugausführungen überleben können.

Justine Moore: Kreativtools werden multimodal

Wir haben jetzt die Grundlagen, um mit KI Geschichten zu erzählen: generative Stimme, Musik, Bilder und Videos. Aber außer dem Erzeugen von einzelnen Fragmenten ist es oft zeitaufwändig, frustrierend und fast unmöglich, ein gewünschtes Ergebnis zu erzielen - insbesondere, wenn man die Kontrolle eines herkömmlichen Regisseurs erreichen möchte.

Warum können wir nicht einem Modell ein 30 - Sekunden - Video geben und es bitten, basierend auf Referenzbildern und - tonen einen neuen Charakter hinzuzufügen, um die Geschichte fortzusetzen? Oder ein Fragment neu aufnehmen, damit wir die Szene aus einem anderen Winkel sehen oder die Bewegung mit dem Referenzvideo übereinstimmt?

Das Jahr 2026 wird das Jahr sein, in dem KI in die multimodale Welt eintritt. Man kann einem Modell jegliche Art von Referenzinhalt geben und mit ihm zusammenarbeiten, um neue Werke zu erstellen oder bestehende Szenen zu bearbeiten. Wir haben bereits einige frühe Produkte wie Kling O1 und Runway Aleph gesehen. Aber es bleibt noch viel Arbeit zu tun. Wir müssen sowohl auf der Modell - als auch auf der Anwendungs Ebene innovieren.

Die Inhaltserstellung ist einer der Killer - Anwendungsfälle für KI. Ich sehe voraus, dass es für verschiedene Benutzergruppen und Anwendungsfälle, von Meme - Erstellern bis hin zu Hollywood - Regisseuren, mehrere erfolgreiche Produkte geben wird.

Jason Cui: Die KI - native Datenebene entwickelt sich weiter

Im vergangenen Jahr haben wir eine Vielzahl von Integrationen im Bereich "Moderne Datenebene" gesehen. Datenunternehmen wandeln sich von einer spezialisierten Arbeitsteilung bei der Dateneingabe, - transformation und - berechnung hin zu einheitlichen, gebündelten Plattformen. Beispielsweise die Fusion von Fivetran und dbt sowie der anhaltende Aufstieg von einheitlichen Plattformen wie Databricks.

Obwohl das Ökosystem bereits erheblich reifer erscheint, befinden wir uns immer noch in der frühen Phase einer echten KI - nativen Datenarchitektur. Was uns aufregt, ist, dass KI weiterhin viele Teile der Datenebene verändern wird, und wir beginnen auch zu sehen, dass Daten und KI - Infrastruktur immer enger miteinander verbunden werden.

Einige Richtungen, die uns interessieren, sind:

  • Wie werden Daten parallel zu herkömmlichen strukturierten Daten kontinuierlich in leistungsstarke Vektordatenbanken fließen?

  • Wie lösen KI - Agenten das "Kontextproblem"? Indem sie kontinuierlich auf den richtigen Datenkontext und die semantische Ebene zugreifen, robuste Anwendungen (z. B. "Datenkonversationen") aufbauen und sicherstellen, dass in mehreren Aufzeichnungssystemen immer die richtigen Geschäftsdefinitionen vorliegen.

  • Wie werden herkömmliche Business - Intelligence - Tools (BI) und Tabellenkalkulationen sich verändern, wenn Datenarbeitsabläufe intelligenter und automatisierter werden?

Yoko Li: Das Jahr des Eintritts in das Video

Bis 2026 wird Video nicht mehr nur etwas sein, das wir passiv anschauen, sondern eher ein Raum, in den wir tatsächlich eintreten können. Videomodelle können endlich die Zeit verstehen, sich an den gezeigten Inhalt erinnern und auf unsere Aktionen reagieren, indem sie eine innere Konsistenz wie in der physischen Welt gewährleisten. Diese Systeme erzeugen nicht mehr nur paar Sekunden lang unterbrochene Bilder, sondern können über einen längeren Zeitraum Charaktere, Objekte und physikalische Gesetze aufrechterhalten, sodass Handlungen sinnvoll werden und Ergebnisse sichtbar werden. Diese Veränderung verwandelt Video in ein medium, das entwickelt werden kann: Roboter können darin trainieren, Spiele können sich darin entwickeln, Designer können Prototypen erstellen und Agenten können durch Praxis lernen. Das Ergebnis ist nicht mehr nur ein Fragment, sondern eher eine lebendige Umgebung, die die Kluft zwischen Wahrnehmung und Handlung zu schließen beginnt. Wir werden erstmals das Gefühl haben, dass wir in generierten Videos "wohnen" können.

Wachstum

Sarah Wang: Die Aufzeichnungssysteme verlieren die Vorherrschaft

Im Jahr 2026 liegt die eigentliche Revolution in der Unternehmenssoftware darin, dass die "Systeme der Aufzeichnung" (System of Record) endgültig ihre zentrale Stellung verlieren werden. KI verkürzt die Distanz zwischen Absicht und Ausführung: Modelle können jetzt direkt über Unternehmensdaten lesen, schreiben und schließen, wodurch ITSM - (IT - Service - Management) und CRM - (Customer - Relationship - Management) Systeme von passiven Datenbanken zu eigenständigen Arbeitsablaufmaschinen werden. Mit den jüngsten Fortschritten im Bereich Inferenzmodelle und Agentenarbeitsabläufen können diese Systeme nicht nur reagieren, sondern auch vorhersagen, koordinieren und end - to - end - Prozesse ausführen. Die Benutzeroberfläche wird sich zu einer dynamischen Agentenschicht entwickeln, während die herkömmlichen Aufzeichnungssysteme zu einer allgemeinen persistenten Speicherschicht im Hintergrund zurücktreten - ihre strategische Hebelwirkung wird an diejenigen gehen, die die intelligenten Ausführungsumgebungen kontrollieren, die die Mitarbeiter tatsächlich nutzen.

Alex Immerman: Vertikale KI entwickelt sich von Informationssuche und - schlussfolgerung hin zu einem "Mehrpersonen - Kooperations" - Modell

KI treibt das Wachstum von Software für vertikale Branchen mit einer bisher nie dagewesenen Geschwindigkeit voran. Unternehmen in den Bereichen Medizin, Recht und Immobilien haben in nur wenigen Jahren einen Jahresumsatz (Annual Recurring Revenue, ARR) von über 100 Millionen US - Dollar erreicht; die Finanz - und Buchhaltungsbranchen folgen dicht hinterher. Diese Entwicklung begann zunächst mit der Informationssuche: das Finden, Extrahieren und Zusammenfassen der richtigen Informationen. Im Jahr 2025 kamen die Schlussfolgerungsfähigkeiten hinzu: Hebbia begann mit der Analyse von Finanzberichten und der Modellierung, Basis verglich die Kontenrahmenübersichten über verschiedene Systeme, und EliseAI diagnostizierte Reparaturprobleme und schickte passende Lieferanten.

Im Jahr 2026 wird das "Mehrpersonen - Kooperations" - Modell starten. Vertikale Software profitiert von branchenspezifischen Benutzeroberflächen, Daten und Integrationen. Aber die Arbeit in vertikalen Branchen ist von Natur aus von mehreren Parteien beteiligt. Wenn Agenten die Arbeitskräfte repräsentieren sollen, müssen sie kooperieren. Von Käufern, Verkäufern bis hin zu Mietern, Beratern und Lieferanten hat jede Partei einzigartige Zugangsberechtigungen, Arbeitsabläufe und Compliance - Anforderungen, die nur vertikale Software verstehen kann.

Aktuell verwenden alle Parteien KI isoliert voneinander, was zu einer mangelnden Autorität bei der Übergabe von Aufgaben führt. Die KI, die Einkaufsvereinbarungen analysiert, spricht nicht mit dem Chief Financial Officer (CFO), um das Modell anzupassen; die KI, die sich um Reparaturen kümmert, weiß nicht, was die Mitarbeiter vor Ort den Mietern zugesagt haben. Das Mehrpersonen - Kooperationsmodell wird die Situation ändern, indem es die Interessengruppen koordiniert: Weiterleitung an Fachleute, Aufrechterhaltung der Kontextkonsistenz, Synchronisierung von Änderungen. Die KI der anderen Seite wird innerhalb der Parameter verhandeln und die Informationsasymmetrien markieren, um sie manuell prüfen zu lassen. Die Anmerkungen von erfahrenen Partnern werden das System des gesamten Unternehmens trainieren. Aufgaben, die von KI ausgeführt werden, werden eine höhere Erfolgsrate haben.

Wenn der Wert durch die Zusammenarbeit von mehreren Personen und mehreren Agenten steigt, wird auch die Wechselkosten erhöht. Dann werden wir die bisher fehlende Netzwerkeffekte von KI - Anwendungen sehen: Die Kooperationsschicht wird die Schutzmauer für Unternehmen werden.

Stephenie Zhang: Entwurf für Agenten, nicht für Menschen

Bis 2026 werden Menschen beginnen, über ihre eigenen Agenten mit dem Netzwerk zu interagieren. Was in der Vergangenheit für den menschlichen Konsum wichtig war, spielt für den Agentenkonsum möglicherweise nicht mehr in derselben Weise eine Rolle.

Seit Jahren haben wir uns auf vorhersagbares menschliches Verhalten hin optimiert: hohe Platzierung in Google - Suchergebnissen, Anzeige in den ersten Amazon - Suchergebnissen oder der Beginn mit "TL;DR" (zu lang; nicht gelesen). Als ich in der Schule Journalismusunterricht hatte, hat uns der Lehrer beigebracht, dass Nachrichten 5W + H enthalten sollten und Feature - Artikel mit einem aufsehenerregenden "Haken" beginnen sollten. Menschen können tiefgehend relevante und aufschlussreiche Aussagen, die auf der fünften Seite versteckt sind, übersehen, aber Agenten nicht.

Dieser Wandel zeigt sich auch in der Software. Apps waren für menschliche Augen und Klicks entwickelt, und die Optimierung bedeutete schöne Benutzeroberflächen und intuitive Prozesse. Mit der Übernahme der Suche und Interpretation durch Agenten wird die visuelle Gestaltung für das Verständnis weniger wichtig. Es ist nicht mehr erforderlich, dass Ingenieure auf Grafana - Dashboards starren, KI - Betriebsingenieure (SRE) können Telemetriedaten interpretieren und Erkenntnisse in Slack veröffentlichen. Es ist nicht mehr erforderlich, dass Verkaufsteams CRM - Systeme durchsuchen, Agenten können automatisch Muster erkennen und Zusammenfassungen erstellen.

Wir entwerfen nicht mehr für Menschen, sondern für Agenten. Die neue Optimierungsrichtung ist nicht mehr die visuelle Hierarchie, sondern die "Maschinenlesbarkeit" - dies wird unsere Schaffensweise und die