StartseiteArtikel

Jährliche Bestandsaufnahme von KI-Modellen

IT时报2026-01-05 18:30
Zeugen Sie die Verwandlung von Werkzeug zu Partner.

Wenn das erste Licht des Morgens durch die Vorhänge dringt, beginnt auch ein "KI-Partner", der Ihren Tagesplan kennt und sich um Ihre Wohlbefinden kümmert, seine Arbeit am Tag.

In der duftenden Aroma einer Tasse Kaffee ordnet er Ihre Termine und schreibt sogar die Gliederung für Ihre kurze Ansprache auf der Morgenbesprechung. Auf dem Weg zur Arbeit wird das gestrige unvollendete Projekt-Dokument in eine Sprachausgabe umgewandelt, und die Schlüsselangaben werden automatisch markiert. Vor Ihrem Arbeitsplatz erstellt er binnen Sekunden eine Visualisierung für Ihre komplexen Datenberichte. Vor Ihrem Treffen mit einem Kunden am Nachmittag generiert er aus Ihren Kernideen einen ersten Entwurf für eine Präsentation und passt die Gestaltung und die Bilder an die Markenstimme an. Auf dem Heimweg können Sie ihm Ihre Abendessenwünsche per Sprache mitteilen, und er schlägt Ihnen Rezepte vor, die zu Ihrem vorhandenen Lebensmittelvorrat passen. Er kann sogar Ihre Smart Home-Geräte vorheizen. Wenn Sie sich abends zur Ruhe legen, hat er die wichtigsten Nachrichten für Morgen ausgewählt und sagt Ihnen "Gute Nacht".

Wie Strom und Wasser, die uns immer zur Verfügung stehen, ist die KI heute zu einer selbstverständlichen Infrastruktur geworden. Wenn 2024 ein Jahr der vorsichtigen Erkundung der KI war, leben und arbeiten wir in 2025 tatsächlich zusammen mit der KI. Die KI-Anwendungen gehen durch eine Veränderung, die "alle Szenarien durchdringt und alle Prozesse stärkt". Unsere Wahrnehmung der Zeit, unser Entscheidungsmodell und sogar unser Lebensrhythmus werden allmählich neu geformt. Die KI verändert weit mehr als nur die ArbeitsEffizienz.

Diese Liste ist nicht nur eine Bewertung der Stärken und Schwächen. Sie ist vielleicht nicht perfekt, aber sie möchte aufzeichnen, wie die KI mit erstaunlicher Geschwindigkeit neue Paradigmen schafft. Wenn wir uns diese Liste ansehen, suchen wir nicht nur nach dem zuverlässigsten "Partner" unter den vielen Optionen. Wir fragen uns auch: Wenn die Fähigkeiten der KI in die Kernbereiche vordringen, wie können wir sie beherrschen? Wie können wir die KI so einsetzen, dass sie in einem geregelten Rahmen diese "Intelligenzrevolution" besser unterstützen kann?

Seite A

Doubao: Die "Volks-KI-Anwendung" überwindet Grenzen

Bei der Frühlingsfeier im Jahr des Pferdes, welcher KI-Partner wird die Interaktion mit den Zuschauern und der Bühne übernehmen? Diesmal ist es Doubao. Es wird zusammen mit der Volcengine auf der Bühne der CCTV-Frühlingsfeier 2026 auftreten. In letzter Zeit gab es viele Nachrichten über Doubao. Beispielsweise hat die tägliche aktive Nutzerzahl (DAU) die 100-Millionen-Marke überschritten, die tägliche Token-Aufrufrate des Doubao-Großmodells liegt über 50 Billionen, und über 100 Unternehmen haben insgesamt mehr als 1 Billion Tokens verwendet. Doubao ist damit der am weitesten verbreitete KI-Assistent auf dem chinesischen Markt und eine "Volks-KI-Anwendung".

Diese beeindruckenden Zahlen stammen von seiner technologischen "Evolution". Von der Version 1.5 bis 1.8 des Doubao-Großmodells hat es Doubao etwa ein halbes Jahr gebraucht. In Tests für komplexe logische Schlussfolgerungen, Wettbewerbsmathematik, mehrmalige Dialoge und Befolgung von Anweisungen belegte die Version 1.6-thinking von Doubao eine Spitzenposition weltweit und erzielte 38 beste Ergebnisse in 60 öffentlichen Bewertungsstandards. Mit der Version 1.8 wurden seine Fähigkeiten zur Nutzung von Tools, zur Befolgung komplexer Anweisungen und als OS-Agent verbessert. Es hat jetzt die Fähigkeiten, "zu sehen, zu schreiben, zu handeln und zu planen". Beispielsweise hat sich bei der visuellen Verarbeitung die Anzahl der pro Video verarbeiteten Bilder von 640 auf 1280 verdoppelt. Es kann langfristige Videos mit niedriger Bildrate verstehen und Tools nutzen, um Schlüsselabschnitte mit hoher Bildrate zu analysieren. Diese Fähigkeit kann in vielen Bereichen wie Online-Bildung und Produktqualitätskontrolle eingesetzt werden. In vielen öffentlichen Bewertungen erzielte die Version 1.8 von Doubao die besten oder fast besten Ergebnisse in visuellen Schlussfolgerungen, allgemeinen visuellen Fragen, räumlicher Verständnis und Videoverarbeitung.

Zur gleichen Zeit hat sein Video-Generierungsmodell einen Qualitätssprung von "stummen Bildern" zu "genau synchronisierten Audio- und Video-Inhalten" gemacht. Die Funktion "Draft-Vorlage" bietet eine Vorschau, die sehr ähnlich zum endgültigen Ergebnis ist und kann die Effizienz der Künstler um 65 % verbessern.

Gründe für die Aufnahme in die Liste

Doubao stellt ein einzigartiges Beispiel dar. Es definiert sich nicht durch die "Nummer 1" in einem einzelnen technischen Parameter, sondern verwandelt das "Großmodell" in einen "Handelnden". Über hinausgehend von beeindruckenden Demonstrationen und vom "Dialog" hin zum "Handeln" ist dies eine grundlegendere Paradigmenentwicklung der KI. Wenn die KI nicht mehr nur Texte und Bilder generiert, sondern beginnt, Tools aktiv zu nutzen, Schnittstellen zu steuern und komplexe Prozesse über verschiedene Plattformen hinweg zu verbinden, wird sie in die Realität integriert. Dies wird sicherlich neue Konflikte und Überlegungen auslösen, aber gerade weil es so tief in die Materie eingreift, kann es möglicherweise neue Formen der Zusammenarbeit und Produktivitätssteigerungen hervorbringen.

Tencent Hunyuan: Vom "Aufbrechen" zum "Eingliedern"

Im Jahr 2025 hat sich in vielen Menschens WeChat ein neuer "Freund" - Yuanbao - eingeschlichen. Es definiert auf eine neue Weise die Existenzform von "Intelligenz" in der sozialen Ökosystem. Es ist keine separate App, die man herunterladen, registrieren und bewusst öffnen muss, sondern ein "Partner", der jederzeit im "Volkssozialen Netzwerk" zur Verfügung steht.

Was Yuanbao von Tencent besonders beeindruckt, ist die frühe Implementierung der "Hunyuan + DeepSeek" Doppelmodellkooperation unter den führenden chinesischen KI-Anwendungen. Die Nutzer können je nach Bedarf zwischen den beiden Modellen wechseln. Wenn sie Code schreiben oder mathematische Probleme lösen, können sie das schneller reagierende DeepSeek-Modell nutzen. Wenn sie lange Dokumente analysieren oder tiefe Planungen erstellen, können sie auf das für logische Schlussfolgerungen optimierte Hunyuan-Modell umschalten. So kann die Effizienz in verschiedenen Szenarien maximiert werden.

Angesichts der natürlichen Vorteile der Tencent-Ökosystem penetriert Yuanbao immer nahtloser in verschiedene Szenarien. Wenn Sie ein komplexes PDF-Dokument erhalten, können Sie es direkt an Yuanbao in WeChat weiterleiten und sagen: "Summiere die Kernpunkte und finde die Handlungsempfehlungen heraus". Sofort erhalten Sie eine klare Zusammenfassung. Wenn Sie in einer Besprechung keine Zeit haben, zu notieren, können Sie Yuanbao eine lange Sprachnachricht schicken, und es erstellt schnell eine strukturierte Niederschrift. So wird die KI-Fähigkeit ganz natürlich in den sozialen und beruflichen Alltag integriert. Das Aufrufen der KI wird nicht mehr zu einer "feierlichen" Handlung, sondern zu einer alltäglichen Gewohnheit, so einfach wie das Senden einer Nachricht.

Kürzlich hat Tencent Yuanbao die Funktion "Aufgaben-Erinnerung" eingeführt, die als ein Zeichen für die Entwicklung von einem "Dialog-Assistenten" zu einem "persönlichen Aufgaben-Intelligenten" angesehen wird. Es kann natürliche Sprache verstehen, komplexe Aufgaben zerlegen und deren Ausführung vorantreiben. Wenn Sie beispielsweise sagen: "Erinnere mich montags, mittwochs und freitags an das Training. Wenn es regnet, erinnere mich an das Yoga zu Hause", versteht Yuanbao das und bringt die Nützlichkeit des KI-Assistenten auf ein neues Level.

Gründe für die Aufnahme in die Liste

Von der "Aufbrechung" bis zur "Eingliederung" kann man Tencent Yuanbaos Entwicklung so beschreiben. Wenn die KI sich nahtlos in die am häufigsten genutzten sozialen und beruflichen Szenarien einfügt, wird das Verhalten und die Erwartungen der Nutzer neu geformt. Wenn die Technologie immer reifer wird, hängt ihr ultimatives Wert eher davon ab, wie gut sie die existierenden, komplexen Formen des Menschen verstehen und bedienen kann. Die zukünftigen Führer werden vielleicht diejenigen sein, die es können, die Technologie unsichtbar zu machen.

Tongyi Qianwen: Der "KI-Superstar", der 100 Dokumente versteht

Wer ist der beste in der Verarbeitung von langen Texten? Vielleicht hat Tongyi Qianwen hier eine Stelle.

Tongyi Qianwen hat im Jahr 2025 die Qwen2.5- und Qwen3-Serie von Modellen mit deutlich verbesserten Leistungen veröffentlicht. Bei der Vorab-Training hat das Qwen3-Datensatz eine gewisse Erweiterung im Vergleich zu Qwen2. Laut den Daten auf der offiziellen Tongyi-Website wurde Qwen2.5 auf 18 Billionen Tokens trainiert, während Qwen3 fast doppelt so viele Daten, nämlich etwa 36 Billionen Tokens, nutzt, die 119 Sprachen und Dialekte umfassen.

Tongyi Qianwen zeichnet sich in der chinesischen Textverstehen und logischen Schlussfolgerungen aus. Einerseits bietet es eine kostenlose Dokumentenanalysefunktion, die Webseiten, Dokumente, Forschungsarbeiten, Bücher usw. analysieren kann. Neben der Analyse von Online-Webseiten kann es auch einzelne Dokumente mit über 10.000 Seiten verarbeiten, was etwa 10 Millionen chinesische Zeichen entspricht. Bei mehreren Dokumenten kann es 100 verschiedene Formate auf einen Blick lesen. Andererseits hat es die Transformer-Architektur verbessert. Um die Probleme wie die ungenaue Analyse von alten Texten oder seltenen Wörtern und die unklare Übersetzung von Fachausdrücken zu lösen, nutzt Tongyi die Rotation-Positions-Einbettung (RoPE)-Technologie, um die zeitliche Logik in klassischen chinesischen Texten zu erfassen. Bei der Übersetzung von technischen Dokumenten behält es die Konsistenz der Fachausdrücke bei, und die Genauigkeit beträgt über 96 %.

Außer dem Textgenerierungs-Großmodell hat Tongyi auch ein Bildgenerierungs-Großmodell mit 20 Milliarden Parametern. Sein Video-Generierungsmodell kann Videos aus einem Satz generieren und auch aus einem ersten Bild oder aus Anfangs- und Endbildern einen flüssigen dynamischen Video erstellen.

Gründe für die Aufnahme in die Liste

In der Arbeit und im Lernen ist die Verarbeitung von langen Dokumenten für viele Menschen ein dringender Bedarf. Tongyi Qianwen zeigt einen einzigartigen Wert: Es macht es einfach, eine große Menge an komplexen Informationen zu verarbeiten. Egal ob es um 10.000 Seiten Literatur oder 100 gemischte Dokumente geht, es kann schnell die Struktur verstehen und die Kernpunkte extrahieren. Dies erweitert die Tiefe der persönlichen Forschung und des Lernens. Seine Fähigkeit, Text, Bild und Video zu erstellen, passt perfekt zu den Bedürfnissen der Nutzer, die nach Effizienz und Tiefe suchen.

WPS AI: "Chatten" und Arbeiten zugleich

Im Jahr 2023 hat Kingsoft Office WPS AI veröffentlicht und eine Reihe von KI-Funktionen rund um AIGC (Inhaltserstellung), Copilot (Intelligenter Assistent) und Insight (Wissensgewinnung) entwickelt. Im Jahr 2024 wurde WPS AI 2.0 geboren, das sich auf die spezifischen Unternehmensszenarien konzentriert und die intelligente Nutzung von Unternehmenswissen durch die KI fördert. Ende Juli 2025 wurde WPS AI 3.0 mit WPS Lingxi als Kernfunktion veröffentlicht.

Die Daten zeigen, dass bis Ende März 2025 die monatliche aktive Gerätezahl von WPS Office weltweit 647 Millionen betrug.

Eine der Kernmerkmale der neuen Version ist die Verbesserung der intelligenten Erstellung. In einigen Komponenten von WPS Office hat sich eine Interaktionsform entwickelt, bei der links die Office-Suite und rechts WPS Lingxi nebeneinander angezeigt werden. Das bedeutet, dass der Nutzer direkt in der rechten Dialogbox seine Anforderungen in natürlicher Sprache formulieren kann. Nach der Erkennung der Absicht kann die KI dann die linke Dokumentenbereich ändern, ohne dass man andere Apps öffnen muss. Im Vergleich zu anderen Produkten hat Lingxi die Vorteile von mehrmaligen Dialogen, kontrollierbaren Änderungen und Formatbeibehaltung. Es kann sicherstellen, dass die von der KI generierten Ergebnisse tatsächlich nutzbar sind.

Einerseits ist die Schwelle niedrig, und die Nutzer können schnell damit vertraut werden. Durch den Dialog können sie Dokumente erstellen. Andererseits kann die WPS Wissensbasis die Cloud-Dokumente der Nutzer in eine Wissensbasis umwandeln. Jeder kann auf der WPS Wissensbasis nach Antworten suchen, Daten filtern und auf der Grundlage von privaten Wissen Pläne oder Dokumente schreiben.

Darüber hinaus hat WPS Office ein neues PPT-Erstellungsmodell eingeführt. Die Nutzer können während des Dialogs mit der KI den PPT-Grundriss ändern und auch die Vorlagen, Einzelseiten und Layouts nochmal optimieren. So können sie mühelos das gewünschte Ergebnis erzielen.

Gründe für die Aufnahme in die Liste

Intelligentes Büroarbeitszeug ist nichts Neues. WPS AI hat kein neues Produkt geschaffen, das man speziell lernen muss. Stattdessen hat es die KI in einen immer verfügbaren "Lingxi"-Assistenten in der Office-Suite umgewandelt. Alle Operationen werden auf einem Bildschirm durchgeführt, und die generierten Ergebnisse sind sofort nutzbar. Diese "Dialog = Erstellung" -Erfahrung senkt die Schwelle für das intelligente Büroarbeitszeug erheblich. Es bringt sogar die riesigen Cloud-Dokumente der Nutzer durch die Wissensbasisfunktion "zum Leben" und wandelt sie in private Wissensressourcen um, die jederzeit abgerufen und für Entscheidungen genutzt werden können. So wird es für jeden im Büro ein eff