StartseiteArtikel

Der Wettlauf im Bereich der KI-Hardware ist heftig. DingTalk hat es in nur drei Monaten geschafft, die Situation zu wenden.

晓曦2025-11-21 10:45
Die Mission von DingTalk A1 ist sehr klar: "AI immer anwesend" machen.

Dieser Artikel umfasst etwa 4.500 Wörter. Die empfohlene Lesezeit beträgt 9 Minuten.

Der Wettlauf um AI-Hardware war noch nie so dicht besetzt.

Vom intelligenten Ring Stream, der von zwei ehemaligen Meta-Mitarbeitern entwickelt wurde und sich mit Menschen unterhalten kann, über Brillengläser mit integriertem AI-Assistenten und tragbare Audioaufzeichnungskarten bis hin zu Anhängern und Armbändern – Technologieunternehmen versuchen, künstliche Intelligenz in alle tragbaren Geräte zu integrieren. Selbst wenn Elon Musk nicht behaupten würde, dass „Edge-Intelligenz“ aufsteigen werde, hat sich in Silicon Valley bereits ein umfassender Wettlauf um die Interaktionsschnittstellen im Bereich Hardware ausgetragen.

Chinesische Tech-Riesen lassen sich auch nicht hinterherhinken. Bei der Veröffentlichung einer großen Version mit dem Code-Namen „Farn“ Ende August ist das erste AI-Hardwareprodukt von DingTalk, das DingTalk A1, auf den Markt gekommen. Es trägt das Hardware-Gen von DingTalk. Innerhalb von Alibaba ist dies ein Team, das bereits Hardware-Erfolge feiern konnte. Für die Außenwelt scheint dies nur ein Angriff auf den Wettbewerb im Bereich intelligenter Hardware zu sein, und das Engagement eines Tech-Riesen bringt nur mehr Aufmerksamkeit auf den bereits überfüllten Wettlauf.

Aber warum hat DingTalk jetzt beschlossen, in den Bereich AI-Hardware einzusteigen? Vielleicht liegt die Antwort anders, als viele denken.

Viele Unternehmen setzen auf groß angelegte Visionen und erzählen beeindruckende Geschichten darüber, wie AI die Welt verändern wird. Dies zieht Aufmerksamkeit und Investitionen an. DingTalk geht einen anderen Weg.

Wenn AI die Welt wirklich verändern soll, muss die Mehrheit der Menschen daran beteiligt sein. Zunächst müssen die Menschen AI jedoch helfen, die physische Welt zu verstehen. Damit jeder Einzelne aktiv mit Werkzeugen AI dabei helfen kann, die physische Welt besser zu verstehen, ist die Gleichverteilung dieser Werkzeuge unerlässlich.

Aus DingTalks Sicht kann die Gleichverteilung von AI nicht von wenigen Unternehmen von oben nach unten hergestellt werden. Sie wird von jedem einzelnen Angestellten in seinem täglichen Arbeitsalltag geprägt: Es kann die Erstellung einer Tabelle sein, die individuelle Reaktion eines DingTalk-Support-Mitarbeiters oder der Besuch eines DingTalk-Programmierers bei Kunden vor Ort. All dies passiert in kleinen Schritten, leise und kontinuierlich.

Wer jedoch DingTalks langjährige Haltung versteht, wird vielleicht zustimmen, dass das DingTalk A1 nicht als Mittel, um ein bestimmtes Unternehmen zu besiegen oder ein Blockbusterprodukt zu schaffen, entwickelt wurde. Es ist der erste Schritt in Richtung AI-Gleichverteilung von DingTalk und der Anfang einer langen Reise.

Die „stumme Mehrheit“ und die immer anwesende AI

Ende 2024 gab es in China mehr als 60 Millionen Unternehmen. Klein- und Mittelbetriebe machen den Großteil aller Unternehmen aus und tragen maßgeblich zur wirtschaftlichen Dynamik Chinas bei.

Als die Welle der künstlichen Intelligenz hereinfegte, standen viele Kleinunternehmen jedoch am Rande. Sie befürchten, von der Zeit hinterhergelassen zu werden, und es ist inzwischen Konsens, dass man „unbedingt etwas mit AI tun muss“. Doch wie man es anstellt und wie man es nutzt, bleibt für viele unklar. Sie sind die „stumme Mehrheit“ in der gegenwärtigen AI-Welle.

Hierbei ist vor allem die technische Schwelle ein Hindernis.

Heutzutage ist die Nutzung von großen AI-Modellen immer noch auf wenige Experten beschränkt. Es erfordert Zeit und Know-how, um diese Modelle zu optimieren. Für kleine Unternehmen, die an Personal, Geld und Zeit fehlen, ist die Einstiegshürde daher sehr hoch. In Yiwu beispielsweise machen Unternehmen mit weniger als zehn Mitarbeitern den Großteil aus. Sie haben keine formellen Management-Strukturen, halten selten Meetings und verfügen über keine festen Prozesse.

„Wir sehen täglich auf unseren Social-Media-Apps, wie AI die Welt erobert. Aber wenn man in die Unternehmen hineinsieht, merkt man, dass viele von ihnen noch nicht einmal die grundlegenden Bürosoftware richtig nutzen können“, beobachtet ein DingTalk-Service-Anbieter.

Viele Unternehmen wissen nicht, wie sie große AI-Modelle in ihre Arbeitsabläufe integrieren sollen und haben keine Zeit, um sich mit verschiedenen AI-Tools vertraut zu machen. Diese Nutzer wünschen sich ein Produkt, das ihre alltäglichen Probleme auf einfache und effiziente Weise löst und ihre Produktivität messbar erhöht.

Dies ist die Realität des chinesischen Unternehmensmarktes: vielfältig und komplex.

Um AI wirklich zugänglich zu machen, muss man daher nicht unbedingt stärkere Modelle entwickeln, sondern die Einstiegshürde senken.

Als ein Produkt, das sich bereits seit Jahren auf diesem Markt etabliert hat, weiß DingTalk, dass die Software als Zugangsmöglichkeit ihre Grenzen erreicht hat: Die Software hat eine hohe Einstiegshürde, wie ein Kunde in einer DingTalk-Umfrage kommentierte: „Wenn ich etwas schnell notieren will, habe ich keine Zeit, die App zu öffnen.“

Daraus ist das DingTalk A1 entstanden. Seine Mission ist klar: AI soll immer anwesend sein.

Als Thomas Edison das erste Glühlampenlicht anzündete, eröffnete er die Ära der Elektrizität. Als Apple das iPhone mit Touchscreen auf den Markt brachte, startete es die Ära des mobilen Internets. Jede technologische Revolution bedarf eines physischen Trägers. Menschen können sich am besten mit physischen Gegenständen auseinandersetzen.

Als erstes AI-Hardwareprodukt von DingTalk ist das DingTalk A1 in Form eines Karten-Audiorecorders konzipiert. Dies ist vor allem auf die unauffällige Nutzung zurückzuführen. Da AI-Hardware noch ein neues Gebiet ist, muss die Interaktions-Oberfläche einfach und klar sein, damit man schnell damit zurechtkommt. Das DingTalk A1 passt sich an das Smartphone an und kann rund um die Uhr und überall mitgeführt werden. Es ist mit einem Knopfdruck bedienbar: Drücken Sie einfach den Knopf und los geht’s.

Ein Beispiel: Ein Vertriebsleiter denkt manchmal an Dinge, die er erledigen muss oder an Lösungen für Probleme. Er öffnet einfach das DingTalk A1 und spricht seine Gedanken auf. „Es ist viel bequemer als das Öffnen der App auf meinem Smartphone. Niemand wundert sich, und ich bin selber auch zufrieden.“

Wenn man in ein paar Jahren zurückschaut, wird man feststellen, dass das DingTalk A1 weit mehr ist als nur ein Karten-Audiorecorder. Es ist eher eine Brücke zwischen der digitalen Welt und der physischen Welt und ein wichtiger Schritt in Richtung „Raumintelligenz“.

Der erste Schlüssel zur Raumintelligenz

Am 10. November hat die amerikanische Professorin Fei-Fei Li von der Stanford University einen Artikel veröffentlicht, in dem sie das Konzept der „Raumintelligenz“ einführt. Sie glaubt, dass dies der nächste Meilenstein in der Entwicklung von AI sein wird. Die derzeitigen AI-Systeme, die von großen Sprachmodellen dominiert werden, können zwar Texte und Bilder generieren, verstehen aber immer noch nicht wirklich die physische Welt, ihre Gesetze und die kausalen Zusammenhänge.

Die Interaktion zwischen Menschen und Gegenständen erschafft eine Komplexität, die weit über die Sprache hinausgeht. Ein neues Generation von großen AI-Modellen muss daher in der Lage sein, wie Menschen in der realen Welt zu verstehen, zu denken und zu handeln.

Aktuell erweitern wir die Eingabemöglichkeiten mit Kameras, Mikrofonen und Sensoren. Mit Spracherkennung, Bilderkennung und taktilen Sensoren helfen wir AI, die „fünf Sinne“ zu entwickeln und die Bedeutung menschlichen Verhaltens in der physischen Welt zu verstehen. Schließlich können wir die Welt auf geometrischer und physikalischer Ebene neu erschaffen.

Wenn man diesem Ansatz zustimmt, ist das DingTalk A1 ein erster Schritt in Richtung Spracherkennung.

Durch diese einfache und zugängliche Schnittstelle kann AI kontinuierlich unstrukturierte, mehrdimensionale Informationen aus der physischen Welt sammeln.

Im Gegensatz zu herkömmlichen Smartphones, die nur über ein Mikrofon verfügen, ist das DingTalk A1 mit fünf omnidirektionalen Mikrofonen und einem Knochenleitungsmikrofon ausgestattet. Es kann Geräusche bis zu einer Entfernung von acht Metern erkennen. Die Breite und Tiefe der Informationen, die es sammeln kann, sind daher weitaus größer als die eines Smartphones.

Wenn man sich vorstellt, dass die Daten, die bisher in Unternehmens-AI-Modelle eingeflossen sind, nur kleine Bäche waren, dann werden mit dem DingTalk A1 riesige Flüsse von Daten in diese Modelle fließen.

Beispielsweise hat das AI-Produkt „AI Audio-Notizen“ in Kombination mit dem DingTalk A1 eine neue Funktion namens „Visualisiertes Aufzeichnen“ hinzugefügt. Mit Hilfe der fünf Mikrofone des DingTalk A1 kann es verschiedene Sprecher anhand ihrer Stimmfarbe identifizieren und ihre Position im Raum bestimmen. Beim Abspielen der Aufzeichnung wird auf dem Bildschirm visualisiert, wer wann und wo gesprochen hat, so dass man die Sitzungszusammenfassung genauer verstehen kann.

Schließlich hofft DingTalk, dass diese Informationen zu „Wissen“ und „Weisheit“ werden können. In der Arbeitsumgebung soll dies die Produktivität von Mitarbeitern und Unternehmensinhabern erhöhen und Unternehmen dabei helfen, ihre eigene AI-Fähigkeit aufzubauen. Das bedeutet, dass es einen vollständigen Zyklus von Datenakkumulation über Modellbildung, Entscheidungsunterstützung bis hin zur Rückkopplung und Weiterentwicklung geben soll.

Offensichtlich hat sich die Beziehung zwischen Menschen und AI in diesem Prozess von einer einseitigen Datenübertragung zu einer zweistufigen Zusammenarbeit entwickelt. Nachdem DingTalk die Software und Hardware integriert hat, kann die DingTalk-AI die von DingTalk gesammelten Informationen verarbeiten und in den gesamten Arbeitsablauf einfügen.

Für die Nutzer von DingTalk ist die Unterstützung bei Entscheidungen und Aktionen der offensichtlichste Vorteil. Dadurch wird DingTalk von einer passiven Arbeitssoftware zu einem aktiven Berater.

Ein Beispiel: Ein Unternehmer im Bereich Wohnmobil-Import und -Export führt einen Telefonat mit ausländischen Kunden durch, muss die Unterhaltung notieren und übersetzen und anschließend eine E-Mail verfassen. Mit dem DingTalk A1 kann er die Telefonkonferenz direkt in Echtzeit transkribieren lassen und erhält automatisch eine E-Mail-Vorlage, die er nur noch anpassen muss.

Für die Mitarbeiter erhöht sich die Effizienz ohne zusätzlichen Zeitaufwand. Stattdessen können sie ihre Fähigkeiten kontinuierlich verbessern. Ein Sozialarbeiter kann beispielsweise mit dem DingTalk A1 Meetings aufzeichnen. Die DingTalk-AI kann die Aufzeichnung in Text umwandeln und eine Zusammenfassung und Analyse erstellen. Die AI kann ihm auch mitteilen, welche Methoden er bei der Aufgabe verwendet hat, welche Aspekte gut gelaufen sind und wo Verbesserungspotenzial besteht.

Dies ist eine stille Revolution, die von DingTalk initiiert wurde. In unzähligen Büros und Lagerhäusern entlastet DingTalk die Mitarbeiter und Geschäftsinhaber von Klein- und Mittelunternehmen von mühsamen Aufgaben. Wie ein DingTalk-Service-Mitarbeiter namens Mo Shang sagt: „DingTalk baut einfach Leitungen. Nur wenn wir diese Leitungen richtig einrichten und unseren Service auf das Optimum bringen, können die Unternehmen Zugang zu AI-Kompetenz, Rechenleistung und Daten erhalten.“

Alibabas erstes erfolgreiches AI-Hardwareprodukt

Im Bereich Unternehmens-AI stammen die Daten von Millionen von Unternehmen in China. Daten sind die Rohstoffe für AI-Anwendungen, während Rechenleistung der Grundstein für die AI-Welt ist.

Globale Wettbewerbe um Rechenleistung und Talent im Bereich AI befinden sich bereits in der Halbzeit. Wenn die Ära der Raumintelligenz beginnt, wird sich der Wettlauf noch intensivieren.

Am Beispiel von AI-Hardware für Unternehmen zeigt sich, dass die starke Lieferkette in der Pearl River Delta Region in China die Herstellungsschwellen für Hardware nahezu eliminiert hat. Man kann in Shenzhen für nur wenige Yuan einen Karten-Audiorecorder herstellen. Am Ende geht es jedoch immer noch um die Fähigkeiten der AI-Software und die Fähigkeit, das gesamte System und Ökosystem zu entwickeln.

Am Ende bleiben nur die Stärkeren im Rennen. Deshalb ist es logisch, dass die Aufgabe der Gleichverteilung von AI von einem populären Produkt wie DingTalk übernommen werden muss. Schließlich steht DingTalk auf der Schulter von Alibabas Rechenleistung, Technologie und Talent.

Als wichtiges Produkt von Alibaba zeigt DingTalk diese Stärke direkt. Auf der diesjährigen Produktveröffentlichung hat DingTalk mehr als zehn AI-Produkte vorgestellt, darunter DingTalk One, AI-Suche, AI-Tabellen, AI Audio-Notizen und das intelligente Hardwareprodukt DingTalk A1. Die Menge, Qualität und Schnelligkeit dieser Produktpalette ist für Start-ups kaum zu erreichen.

Dank Alibabas Technologie können die AI-Produkte von DingTalk erstaunliche Leistungen erbringen. Die AI-Tabellen von DingTalk und das Team hinter der Datenbank ADB-PG von Alibaba Cloud haben zusammen eine Architektur namens O-Table entwickelt, die eine Echtzeitaktualisierung von Tabellen mit Millionen von Zeilen in Sekundenschnelle ermöglicht.

Das DingTalk A1 ist streng genommen auch Alibabas erstes erfolgreiches AI-Hardwareprodukt. Es ist auch der erste Karten-Audiorecorder auf dem Markt, der eine Echtzeit-Transkription ermöglicht. Echtzeit bedeutet, dass die AI keine Zeit hat, die Transkription zu korrigieren, was eine sehr niedrige Fehlerquote erfordert. Auf der Rechenleistungseite muss das Modell in der Lage sein, hohe Datenmengen gleichzeitig zu verarbeiten, wenn die Transkription in Echtzeit erfolgen soll.

Aktuell können herkömmliche Karten-Audiorecorder nur die Aufzeichnung nachträglich in die Cloud hochladen und von einem externen großen Sprachmodell transkribieren lassen. Der Grund, warum sie keine Echtzeit-Transkription anbieten, ist, dass dies die Schwierigkeit und Kosten der Transkription exponentiell erhöhen würde.

Außerdem werden herkömmliche Audiorecorder in der Regel nach der Aufzeichnungsdauer abgerechnet. Man kann nur die Dauer der Aufzeichnung messen, die in die Cloud hochgeladen wird. Wenn man eine Echtzeit-Transkription hinzufügt, muss man das gesamte Abrechnungssystem überarbeiten. Deshalb fehlt diese scheinbar einfache Funktion in den meisten Produkten. Tatsächlich ist dies das Ergebnis einer großen Lücke in der Rechenleistung.

DingTalk hat die Aufgabe übernommen, diesen Weg zu ebnen. Genau diese Barrieren haben es dem DingTalk A1 ermöglicht, die Echtzeit-Transkription zu testen. Darüber hinaus bietet das DingTalk A1 1.000 Minuten kostenlose Aufzeichnungszeit, was der höchste Betrag auf dem Markt ist. Die Echtzeit-Transkription wird nicht in die kostenlose Zeit einbezogen.

Es ist unbestritten, dass das DingTalk A1 als Hardwareprodukt keine hohe Rendite bringt. Die Rechenleistungskosten hinter dem Produkt können in der kurzen Frist kaum amortisiert werden.

Tatsächlich hat DingTalk auch erstmals in der Branche ein neues Zahlungssystem für AI-Software eingeführt: Die Bezahlung erfolgt nach den Ergebnissen. In einer Zeit, in der Unternehmen noch unsicher sind, ob sie für AI-Produkte zahlen sollen, ist DingTalk bereit, die Kosten für Klein- und Mittelunternehmen zu übernehmen. Das Ziel ist, dass Unternehmen „sich trauen, AI zu nutzen, es nutzen können und es sich leisten können“.

Dies ist DingTalks Verantwortung für die Gleichverteilung von AI.

„Sie