StartseiteArtikel

Mehr als nur Protokollierung: Sineo lässt die KI nach dem Meeting weiterarbeiten

晓曦2026-06-23 21:22
Da KI-Konferenz-Tools bereits Aufzeichnungen, Transkriptionen und Protokolle erstellen können, verlagert sich das eigentliche Problem auf die Umsetzung nach der Besprechung.

iFlytek hat OfficeClaw in die Unternehmens-Agent-Fähigkeiten von Tencent Cloud integriert und Echtzeit-Insights, aktive Intelligenz, Berechtigungsverteilung und Prozessverfolgung in den Bürokontext eingebracht, um die Konferenzinformationen aus archivierten Inhalten in Arbeitsressourcen zu verwandeln, die weiterverfolgt werden können.

Die Bürokonferenzen haben in den letzten Jahren eine peinliche Veränderung erfahren: Die Tools können immer besser aufzeichnen, aber die Menschen werden dadurch nicht viel entspannter. Audioaufnahmen, Transkriptionen und Protokolle sind längst keine Neuigkeiten mehr. Das Problem tritt oft nach der Beendigung der Konferenz auf: Nachdem das Protokoll versandt wurde, muss jemand immer wieder nachfragen.

Ma Binbin, der Chefproduktmanager von iFlytek, hat diesen Engpass ganz direkt benannt: "Eine Konferenz ist nur der Anfang eines Vorgangs, die Durchführung ist der Hauptteil und das eigentliche Problem."

Ma Binbin, Chefproduktmanager von iFlytek

Yuan Huiyin, der Generalmanager der Region Suzhou und Anhui von Tencent Cloud, hat auch ein sehr realistisches Szenario beschrieben: "Nachdem eine Konferenz beendet ist, muss ich noch mehr Konferenzen abhalten, um die offenen Aufgaben dieser Konferenz zu lösen." Dies klingt zwar etwas absurd, aber viele Berufstätige sollten es nicht fremd sein.

Schwieriger zu handhaben ist die Fragmentierung des Kontexts. Die Informationen zu einem Projekt sind verteilt in Videokonferenzen, Unternehmens-IMs und Dokumenten auf verschiedenen Plattformen. Es ist für KI schwierig, die Ursache und die Folge zu verbinden. Ohne einen vollständigen Kontext ist das Protokoll nur ein weiteres Archivdokument.

iFlytek war bisher eher für seine Fähigkeiten in der Dialog-KI bekannt. Im Bürokontext entwickelt es jetzt eine integrierte Büro-KI aus Hardware und Software: Das Büro-Notizbuch und die Audioaufnahmekarte sammeln zunächst die Konferenzen, Telefonate und spontanen Ideen auf der Straße ein. Die Office AI verbindet die Konferenzprotokolle, die Bürohardware und die Nachbearbeitung nach der Konferenz. Durch die Integration von Hardware und Software werden die Informationen, die vor, während und nach der Konferenz auf verschiedenen Geräten und Systemen verteilt sind, verbunden. Nach der Beendigung der Konferenz kann die KI weiterhin arbeiten.

Die KI auch nach der Konferenz arbeiten lassen

Aber um die KI dazu zu bringen, die Arbeit fortzusetzen, muss zunächst die Konferenz richtig aufgezeichnet werden.

iFlytek hat 19 Jahre lang an der Sprachtechnologie gearbeitet. Ma Binbin betont, dass die Genauigkeit der Audioaufnahme die Obergrenze aller nachfolgenden KI-Fähigkeiten bestimmt. In komplexen Konferenzräumen, bei gleichzeitiger Sprechweise mehrerer Personen oder in Fernkonferenzen, bei denen hinter einem Account mehrere Personen sitzen - in diesen Szenarien ist es für einfache Transkriptionssoftware schwierig, eine gute Leistung zu erbringen.

Darum setzt iFlytek auf die Integration von Hardware und Software. Das AI-Büro-Notizbuch von iFlytek ist für die Hauptszenarien in Konferenzräumen zuständig, die TalkNote-Audioaufnahmekarte ergänzt die mobilen Szenarien. Ideen, die in der Kaffeebar, im Zug oder beim Warten auf die Grünphase des Ampelsignals auftauchen, können alle aufgezeichnet werden und schließlich in dasselbe System gelangen. Ma Binbin ist der Meinung, dass die Hardware die KI in die Nähe der Informationsquelle bringt.

Nach einer genauen Aufzeichnung kann die KI erst weiterarbeiten. Nur wenn der genaue Kontext erfasst wird, hat die nachfolgende Verständnis- und Ausführungstätigkeit eine Grundlage.

Nachdem die Audioaufnahme in das System gelangt ist, wird sie in den gesamten Konferenzprozess eingebunden. Gemäß Ma Binbins Beschreibung kann die Office AI die Zeit vor, während und nach der Konferenz verbinden: Vor der Konferenz die Reservierung und die Erinnerung an die Teilnahme; während der Konferenz die Aufzeichnung und die Echtzeit-Insights; nach der Konferenz die Zusammenstellung des Protokolls, die Extraktion der offenen Aufgaben und die Abfrage, ob der Benutzer die Ausführung fortsetzen möchte.

Ma Binbin nennt diese Fähigkeit in der Office AI "aktive Intelligenz". Die KI beteiligt sich an der gesamten Konferenz und ordnet aktiv die Aufgaben, die sie unterstützen kann, und fragt dann den Benutzer, ob er die Ausführung wünscht. Produktplanung, Marktanalyse, E-Mail-Drafting, die Organisation einer Idee in ein Dokument - sobald der Benutzer "ja" sagt, setzt die KI die Arbeit fort.

Das traditionelle To-Do-Listen-System ist eher wie ein Aufbewahrungsbehälter. Der Benutzer legt die Aufgaben hinein, und das System erinnert ihn nach Zeitplan. Die Office AI geht einen Schritt weiter. Ma Binbin erwähnt, dass die To-Do-Listen und die Notizen von iFlytek miteinander verbunden sind: Man kann von der To-Do-Liste zu den Notizen und von den Notizen zur To-Do-Liste springen und genau auf die damalige Konferenz und die Diskussion zurückverfolgen.

Während der Konferenz führt die KI auch eine andere Aufgabe aus: Echtzeit-Insights. Wenn die Diskussion im Gange ist, gibt die KI Hinweise auf Risikopunkte und erinnert auch daran, wo es lohnend ist, nachzufragen. Ma Binbin unterscheidet klar zwischen "Aufzeichnung" und "Insight": Die Aufzeichnung ist die treue Wiedergabe des Diskussionsinhalts; der Insight ist die Analyse der tatsächlich besprochenen Risiken und potenziellen Probleme durch die KI als dritter, objektiv betrachtender Beobachter.

Ein Investor hat nach der Nutzung der Insight-Funktion von iFlytek berichtet, dass ihm "die Stirn runterlief". Der Grund dafür ist, dass die Projektanalyse, die die KI liefert, wie die eines erfahrenen Beratungsfachmanns mit über 20 Jahren Berufserfahrung ist und ihm bei der Projektbewertung hilft.

Was dem Investor das Gefühl gibt, dass ihm "die Stirn runterläuft", ist genau diese Perspektive des Beobachters: Sie stört nicht, sondern kann die wertvollsten und riskantesten Aspekte eines Projekts herausarbeiten.

Der Agent in einem Unternehmen muss zunächst Grenzen haben

Dass die KI Menschen bei der Arbeit helfen kann, bedeutet nicht, dass sie direkt in den Unternehmensprozess integriert werden kann.

Konferenzen in Unternehmen betreffen oft mehrere Rollen. In einer Konferenz können gleichzeitig Finanzdaten, juristische Meinungen, Geschäftsentwicklungen und Projektentscheidungen behandelt werden. Bei demselben Protokoll können die Finanzabteilung und die Geschäftsentwicklung unterschiedliche Zugangsberechtigungen haben; dieselbe offene Aufgabe kann auch von mehreren Abteilungen parallel bearbeitet werden.

Yuan Huiyin hat erwähnt, dass in der Vergangenheit die Informationsflüsse weitgehend von Menschen entschieden wurden. An wen das Protokoll kopiert wird, welche Inhalte nicht versandt werden dürfen und welche offenen Aufgaben an welche Abteilung weitergeleitet werden sollen, mussten alle manuell bearbeitet werden. Jetzt besteht die Möglichkeit, diese Aufgabe an einen Agenten zu übertragen: Je nach Berechtigungen werden unterschiedliche Inhalte an verschiedene Personen angezeigt. Er fasst diese Veränderung mit einem Satz zusammen: "Früher suchten Menschen nach Daten, jetzt suchen die Daten nach Menschen."

Yuan Huiyin, Generalmanager der Region Suzhou und Anhui von Tencent Cloud

Was Tencent Cloud in dieser Zusammenarbeit beisteuert, ist die Basis, die für den Betrieb eines Unternehmens-Agenten benötigt wird.

iFlytek versteht die Konferenzszenarien und die feinen Bedürfnisse der Bürobenutzer. Tencent Cloud ClawPro muss sich um eine andere Art von Problemen kümmern: In welcher Rolle tritt der Agent in einem Unternehmen auf, welche Daten kann er zugreifen und kann man im Falle eines Problems zurückverfolgen? Yuan Huiyin hat ganz klar gemacht, dass Tencent Cloud die Anwendungen auf der Basis "schnell, stabil und sicher" machen will.

Beispielsweise kann die Entscheidungsfindung über die Berechtigungen nicht nur von Menschen vor Ort getroffen werden. Wenn ein Agent dem Benutzer bei der Bearbeitung von Konferenzprotokollen helfen soll, muss man im Voraus klären, ob er Finanzdaten einsehen kann, Kundendaten abrufen kann und die Ergebnisse an externe Personen senden kann. Tencent Cloud authentifiziert den Agenten und steuert mit minimalen Berechtigungen, was er tun kann, und trennt die Daten durch eine Sandbox.

Diese Basis löst das Problem, wo der Agent anhalten soll. Der Inhalt, der gemäß den Regeln weitergeleitet werden kann, kann das System zunächst in Gang setzen; sobald es um Streitigkeiten, Entscheidungen und Folgen geht, muss die Entscheidung wieder beim Menschen liegen.

Ma Binbin ist ebenfalls sehr vorsichtig bei der Öffnung der Berechtigungen im Bürokontext. Da das Large Language Model noch nicht vollständig ausgereift ist, muss man es im Bürokontext mit Bedacht behandeln. Deshalb nimmt iFlytek bei der Kontrolle der Datenberechtigungen für das Büro-Notizbuch und die Audioaufnahmekarte einen Schritt-für-Schritt-Ansatz: Zunächst nur Leserecht, später die Möglichkeit zur Bearbeitung und zum Schreiben. Bei hochriskanten Aktionen wie dem Löschen wird strenger kontrolliert.

Er betont besonders: "Sie müssen die letzte Entscheidung selbst treffen und die Ergebnisse prüfen." Dies ist die Grenze, die man beim Eintritt in den Unternehmensbereich beibehalten muss. Die KI kann Menschen bei der Aufzeichnung, Verfolgung und Ausführung eines Teils der Aufgaben helfen, aber die Organisation darf die Verantwortung nicht einfach abgeben.

Die Konferenztools können bereits gut aufzeichnen, aber das, was die Menschen am meisten beansprucht, ist der Zeitraum nach der Beendigung der Konferenz. Dies ist auch der Punkt, an dem iFlytek und Tencent Cloud zusammenarbeiten möchten: Die Konferenz hinterlässt nicht nur ein Protokoll, sondern beginnt auch, den nächsten Schritt zu planen.

Der wahre Weg für Büro-Agenten liegt vermutlich hier. Sie können arbeiten und auch von Menschen kontrolliert werden. Dies ist die Voraussetzung für den Eintritt von Agenten in die reale Geschäftswelt.