StartseiteArtikel

WPS Lingxi, eine völlig andere Agenten - Stichprobe

晓曦2025-07-29 17:30
Die nächste Generation von KI-Software ist die Agentic Software.

Die am 26. Juli eröffnete WAIC 2025 war von zahlreichen Besuchern bevölkert und äußerst lebhaft. Im Vergleich dazu gab es diesmal viel weniger Gerüchte über die Aufsehen erregenden AI-Produkte.

Die "zurückhaltende" Präsenz der Produkte ist ein Spiegelbild der aktuellen Phase der großen Modelle. In der Anfangsphase, als es darum ging, einfach so viele Parameter wie möglich zu stapeln, stiegen die Popularitäten vieler aufsehenerregender Produkte rapide an, doch waren sie auch bald wieder vergessen. Auf der diesjährigen WAIC war deutlich spürbar, dass "Nützlichkeit" "Aufsehenerregung" abgelöst hat. Die Frage, ob die tatsächlichen Bedürfnisse der Nutzer erfüllt werden, steht im Fokus der AI-Hersteller.

Zum Beispiel zeigte der Stand von StepStar, einem der Unicorns auf dem Gebiet der großen Modelle, neben den üblichen Funktionen wie AI-Schreiben auch die Funktion "Eingehende Prüfung", die gezielt das Problem der fehlenden Nachverfolgbarkeit und der gefälschten Inhalte bei der AI-Generierung löst. Mobvoi stellte das AI-Hardwareprodukt TicNote vor – es ist nur 3 Millimeter dünn, kann magnetisch am Smartphone befestigt werden und verfügt über Funktionen wie die Aufzeichnung und Transkription von Audio sowie die Organisation von Gedanken in Verbindung mit der Smartphone-Software.

In dieser Atmosphäre hat Kingsoft Office auch sein neues, "praktisches" Produkt vorgestellt – den nativen Office-Intelligent Agent WPS Lingxi und eine Reihe von Produkten, darunter WPS AIPPT, WPS persönliches Wissensrepository und Lingxi Sprachassistent.

Heutzutage wird viel über Agenten gesprochen, aber Kingsoft Office hat einen anderen Ansatz als die auf dem Markt erhältlichen Agenten verfolgt.

Tian Ran, stellvertretender Präsident von Kingsoft Office, sagte, dass es derzeit zwei Situationen bei AI-Software gibt. Einerseits steht der Nutzer vor der Software, während die AI-Fähigkeiten hinter der Software versteckt bleiben und somit nicht voll ausgeschöpft werden können. Andererseits steht der Nutzer vor der AI, die dann die Software aufruft, doch der Nutzer hat das Problem, seine Bedürfnisse nicht klar ausdrücken zu können.

"Deshalb ist es die Vorgehensweise von Kingsoft Office, dass Software und AI ineinander integriert und voneinander verändert werden müssen. Die nächste Generation von AI-Software ist die Agentic Software." sagte Tian Ran.

Im Wesentlichen ist ein Agent eine Fähigkeit, nicht die endgültige Produktform. Es ist ein langwieriger Prozess, dass die Nutzer ihre Verhaltensgewohnheiten an Agenten anpassen. Als Softwareprodukte, die den Nutzern näher sind, sollten sie sich selbst weiterentwickeln, um den Nutzern zu helfen, sich an Agenten zu gewöhnen.

Von "Funktionsbeschleunigung" zur "Prozessumgestaltung"

Das Schreiben von Artikeln und anderen Inhalten mit Hilfe von großen Modellen ist die am weitesten verbreitete Anwendung von AI. Doch in diesem Szenario gibt es ein verborgenes Problem – egal, ob es sich um Text oder Bilder handelt, wie hoch ist die Wahrscheinlichkeit, dass Sie das erste Ergebnis, das das große Modell generiert hat, direkt übernehmen? Nahezu null.

Deshalb brauchen die Nutzer bei der Inhaltsgenerierung tatsächlich kontinuierliche Dialoge und Änderungen, damit die AI eine zweite, dritte Version usw. liefert. Dies entspricht im Grunde dem Szenario, wie Nutzer mit Kollegen Inhalte bearbeiten: Sie müssen nicht nur in Echtzeit miteinander kommunizieren, sondern auch das Dokument vor sich haben.

Diese Art der Interaktion, die einer Zusammenarbeit mit Kollegen ähnelt, ist der Durchbruch von WPS Lingxi. Im Gegensatz zum einseitigen "Einsatz von einem Satz" der herkömmlichen AI ermöglicht WPS Lingxi Interaktion, Änderungen und mehrstufige Dialoge.

Bei der Live-Demo hatte Lingxi die Form einer gleichzeitigen Zusammenarbeit, wobei links das Office-Suite und rechts der AI-Assistent angezeigt wurden. Wenn der Nutzer in den WPS-Komponenten Lingxi aufruft und seine spezifischen Bedürfnisse direkt ausspricht, kann die AI den linken Dokumentbereich ändern, die Änderungen anzeigen und dabei das Dokumentformat nicht beeinträchtigen.

Bei den Änderungen erkennt Lingxi intelligent die Absicht des Nutzers und den Änderungsbereich und führt präzise Änderungen nur an den erforderlichen Teilen durch, um Fehlbedienungen und unnötige Neuanordnungen des gesamten Dokuments zu vermeiden.

Darüber hinaus hat Kingsoft Office auch WPS AIPPT vorgestellt. Das interaktive, änderbare und mehrstufige Dialogmodell wird auch hier angewendet. Nutzer können während des Dialogs mit der AI den PPT-Grundriss ändern, und jeder Schritt ist kontrollierbar.

Ein unterschiedlicher Aspekt ist, dass bei Kingsofts AI-PPT, wenn der Nutzer detaillierte Änderungen am vom AI erstellten PPT vornehmen möchte, das Template an der geänderten Stelle automatisch gleich bleibt, ohne dass der Nutzer "manuell Rahmen zeichnen" muss.

Lu Weijun, Produktmanager von WPS AIPPT, sagte, dass die AI-PPT-Produkte auf dem Markt aus frei gestapelten Objekten bestehen, während WPS Lingxi die Formatierung und Struktur des PPTs merkt und daher auf einer stabilen Struktur basierende Änderungen vornehmen kann.

Die Gedächtnisfunktion ist eine der nützlichsten Eigenschaften von AI-Chatbots. Sie macht die Dialoge individueller und ermöglicht es den Nutzern, sich nicht mit der "Lernkurve der Prompt-Wörter" herumschlagen zu müssen. Wenn ein Satz nicht ausreicht, können sie einfach weiter reden und die AI schrittweise an ihre Bedürfnisse heranführen.

Betrachtet man die Branche insgesamt, so gibt es zwar seit diesem Jahr zahlreiche Fortschritte bei den Office-Agenten in China, und die Produkte mit einzelnen Fähigkeiten konkurrieren um die technischen Indikatoren. Doch trotz des rapiden Anstiegs der technischen Indikatoren werden die "echten Bedürfnisse" vieler Nutzer immer noch nicht erfüllt. Beispielsweise kann es nur eine Sekunde dauern, um ein Dokument oder ein PPT zu generieren, aber die anschließende Bearbeitung kann Tage dauern.

Dies liegt daran, dass die Digitalisierung der meisten Bürosoftware nicht tief genug in die Prozesse eingedrungen ist, und die meisten AI-Hersteller nicht erkannt haben, in welchen Schritten die Nutzer am meisten Zeit und Mühe verbringen.

WPS Lingxi hat den Fokus von der "Funktionsbeschleunigung" auf die "Prozessumgestaltung" verlagert, was eine wirklich problemauflösende Herangehensweise ist.

Der "Alleskönner" der Bürodigitalisierung?

Es ist nicht überraschend, dass Kingsoft Office in der heftigen Konkurrenz auf dem Büromarkt ein solches Produkt entwickelt hat.

Als ein Bürosoftwareunternehmen mit 37 Jahren Geschichte hat Kingsoft Office die meisten hochwertigen Büroszenarien gesammelt und gleichzeitig die drei Hauptkomponenten beherrscht. Die Unternehmensphilosophie geht daher von den konkreten Bedürfnissen der Nutzer in den realen Szenarien aus, anstatt sich nur auf technische Wettbewerbe zu konzentrieren.

Im Grunde geht es bei Kingsoft Office darum, die Technologie an die Szenarien anzupassen, und nicht die Szenarien an die Technologie anzupassen.

Die Phase, in der sich der Fokus von der Trainingsphase zur Inferenzphase verschiebt, ist ein guter Zeitpunkt für Softwareunternehmen, die mit den Szenarien vertraut sind, einzusteigen. Tian Ran betonte, dass das von außen diskutierte Konzept, dass "in diesem Jahr die vertikalen Modelle die Basis-Modelle ablösen und schnell wachsen", ein falsches Konzept sei. Genauer gesagt, wachsen die vertikalen Szenarien.

Bei der Umsetzung von Anwendungen hat derjenige, der die Szenarien besser versteht, einen der Schlüssel für den Erfolg.

Ein weiterer Faktor ist die Ingenieurskapazität. Technisch gesehen, wenn die Entwicklung der großen Basis-Modelle einen relativ stabilen Zustand erreicht hat, geht es bei der weiteren Verbesserung der Produkte um die Ingenieurskapazität.

Dank der tiefen Einsicht in die Szenarien und der Ingenieurspraxis hat Kingsoft Office Produkte entwickelt, die andere Unternehmen nicht herstellen können.

Am Beispiel des AI-PPT sagte Tian Ran, dass es auf der Ingenieursebene schwieriger ist, ein PPT mit AI zu erstellen als HTML und Markdown, da in den Daten, mit denen das große Modell trainiert wird, die Menge an PPTs unzureichend ist.

Das Problem, das das WPS-Team hauptsächlich angeht, ist, wie man die Layoutfähigkeit und Kreativität der AI zum Tragen bringt und gleichzeitig die AI so steuert, dass sie den menschlichen Anforderungen entspricht. Es geht also darum, die AI auszuschöpfen und gleichzeitig zu begrenzen.

"Beide Seiten erfordern viel Ingenieurarbeit. Wir müssen in den Komponenten eine neue API entwickeln, die speziell für die AI dient, und sicherstellen, dass wenn die AI diese API aufruft, die AI-Wissen mit dieser API in Beziehung steht." erklärte Tian Ran.

Das Lehren der AI, tiefgreifend mit der Software zu kommunizieren, ist eine der wichtigen technischen Barrieren in Kingsofts Agentic Software-Strategie.

In Bezug auf das Verständnis der Szenarien hat Tian Ran auch eine andere Meinung als die Marktmeinung. "Viele denken, dass ein Agent eine Person ersetzt und die Rolle eines digitalen Mitarbeiters spielt. Wir denken jedoch, dass ein Agent jedem Mitarbeiter dient. Er löst die Anforderungen nicht direkt, sondern arbeitet gemeinsam mit dem Mitarbeiter an den Anforderungen."

Kingsofts Produktvorstellung war sehr praktisch und verzichtete auf technische Showmanship. Stattdessen zielte es darauf ab, die Probleme der Nutzer zu lösen. Doch angesichts der beeindruckenden Ergebnisse ist dies auf eine andere Art und Weise auch eine Art "Show der Technik" – die Erfahrungen der vergangenen dreißig Jahre spiegeln sich tatsächlich in den Produkten wider, was für viele Mitbewerber möglicherweise schwer zu übertreffen ist.

Lingxi ist noch nicht perfekt. Wie das WPS-Team sagt, kann ein AI-Produkt nie "perfekt" sein. "AI-Produkte werden nicht einfach entwickelt und freigegeben, sondern entwickeln sich." sagte Tian Ran. Die Veröffentlichung eines AI-Produkts ist nur der Anfang, und die anschließende Weiterentwicklung und das Wachstum sind noch wichtiger.

"Wir werden nicht nur den Grundriss während des Dialogs ändern, sondern auch die Templates, die Titelseiten und jede Seite des PPTs." sagte Lu Weijun.

Dies ist eine lange Reise. WPS Lingxi bietet als Ausgangspunkt ein Branchenbeispiel. Vielleicht hat erst jetzt der Kampf um die Bürodigitalisierung begonnen.