StartseiteArtikel

Nach dem Ausbruch der Cloud-Tokens hat die Rechenleistung auf der Endgeräteseite begonnen: Der intelligente Agent-All-in-One-Computer begrüßt sechs Arten von Akteuren.

数智前线2026-06-03 15:07
Wer zahlt die Rechnung und wer beobachtet abseits?

Die Cloud-AI hat 2026 einen Ausbruch erlebt, und "Token" ist zum Brennpunkt der gesamten Branche geworden. Doch die Akteure in der Branchenkette haben allmählich erkannt, dass die AI nicht nur in der Cloud gedeihen wird.

"Die Agenten-All-in-One-Geräte sind schon sehr beliebt." sagte Guo Mengming, Mitbegründer der First Boundary Technology, der Digital Intelligence Frontline. Die Branche hat beobachtet, dass sechs Gruppen von Akteuren am Markt beteiligt sind: fast alle führenden Chipunternehmen, traditionelle PC- und Hardwarehersteller, AI-Start-ups, Branchenlösungsanbieter, allgemeine Lösungsanbieter sowie Unternehmen aus anderen Branchen.

Während der NVIDIA GTC Taipei-Konferenz in dieser Woche hat Huang Renxun es deutlich gemacht: "Zum ersten Mal in 40 Jahren wird der PC vollständig neu gestaltet." NVIDIA hat zusammen mit MediaTek den PC-Chip RTX Spark entwickelt und ist auf den Desktop-Rechenleistungsmarkt eingestiegen. Es wird behauptet, dass mit der FP4-Präzision ein Großmodell mit 120 Milliarden Parametern lokal ausgeführt werden kann. Im Herbst dieses Jahres werden Microsoft, Dell und HP 40 Geräte auf den Markt bringen.

Bisher hat man für die Cloud-AI nach Verbrauch bezahlt. Jetzt soll die Edge-AI die Cloud-Rechenleistung in lokale Infrastruktur umwandeln und in die Taschen der Verbraucher und auf die Schreibtische gelangen. Im Vergleich zur Cloud-AI ist die Edge-AI näher, privater, spart Token und ist näher an Einzelpersonen und kleinen Teams. Die Branche ist der Meinung, dass die Fähigkeiten der Edge-AI letztes Jahr auf der Ebene eines Schülers oder Mittelstufenschülers lagen und dieses Jahr auf der Ebene eines Studenten sind. Mit der Zeit wird die Fähigkeitsgrenze zwischen Edge und Cloud immer schwächer werden.

Rechenleistung ist Einnahmen, Rechenleistung ist Gewinn. "Die Hersteller versuchen alles, um ihre Edge-AI-Hardware zu vermarkten." sagte Ke Jiejing von Shenzhen Xingyi Technology. Der Wettbewerb wird immer heftiger.

Die Agenten-All-in-One-Geräte sind da, eine neue Produktkategorie entsteht

Hinter dieser Boombewegung steckt der Aufstieg der Multi-Agent-Anwendungen. Li Kaifu, CEO von Lingyiwanwu, erklärte, dass eine Benutzeranfrage in 20 oder mehr parallel laufende Agenten aufgeteilt werden kann. Die Ergebnisse werden zusammengefasst und lösen dann die nächste Runde der Zusammenarbeit aus. Dieser Rechenmodus ändert direkt die Anforderungen an die Hardware. "Das Hardware-System muss mehrere Bedingungen erfüllen: lokale Priorität, Edge-Verarbeitung und eine Reaktionsverzögerung von weniger als 100 Millisekunden. In Zukunft werden die maximale Token-Effizienz und die Fähigkeit zur lokalen Verarbeitung der Schlüssel sein."

Guo Mengming analysierte, dass die Benutzer drei Anreize für die lokale Rechenleistung haben, im Vergleich zur Cloud-Rechenleistung: Privatsphäre, Token-Einsparung und Senkung der Nutzungsschwelle für Agenten. Nach dem Boom der Krebse im Frühlingsfest wurden die Probleme der hohen Bereitstellungsschwelle und des hohen Token-Verbrauchs deutlich. Die All-in-One-Geräte mit voreingestellten Agenten ermöglichen es auch Nicht-Computerfachleuten, sie zu nutzen und sparen erheblich an Token.

Was ist ein Agenten-All-in-One-Gerät? Bis jetzt gibt es keine einheitliche Definition auf dem Markt, und die Produktformen variieren stark. Ke Jiejing gab eine relativ klare Beschreibung: "Es ist ein kleiner Rechner, eine Art Computer mit relativ starker lokaler Grafikkartenleistung." Der Kern ist die Fähigkeit, ein lokales Modell für ein kleines bis mittleres Team bereitzustellen und Agenten zu nutzen - "für kleine Teams von 3 bis 5 Personen oder sogar für Einzelpersonen oder OPC-Einzelunternehmen".

Derzeit gibt es auf dem Markt hauptsächlich vier Ansätze, mit unterschiedlichen Preisen und Anwendungsfällen:

Der erste ist der Apple Mac mini. Dank seiner M-Serie-Chips kann er sowohl als Alltagscomputer als auch für kleine Parameter-Modelle und Agenten eingesetzt werden. Nach dem Ruhm von OpenClaw ist der Preis des Mac Mini von 2.900 Yuan schnell auf 4.000 bis 5.000 Yuan gestiegen.

Der zweite ist die NVIDIA-Serie. Der DGX Spark kostet 33.000 Yuan. Er sieht aus wie eine kleine Box, hat ein ARM-Architektur und läuft unter Linux. Er kann nicht mit Windows neu installiert werden, was für normale Verbraucher eine Schwelle darstellt. Er eignet sich eher für die Verteilung an kleine Abteilungen in großen Unternehmen. Gleichzeitig hat NVIDIA zusammen mit MediaTek den RTX Spark entwickelt, der auf den Verbraucher-PC-Markt abzielt und zwischen 18.000 und 25.000 Yuan kostet. Im Herbst 2026 werden Microsoft, Dell und HP 40 Modelle auf den Markt bringen.

Der dritte ist ein Agenten-Rechner auf Basis von AMD Ryzen AI Max+. Er läuft unter Windows und hat bis zu 128 GB Grafikspeicher. Letztes Jahr kostete dieser Typ von Gerät etwa 15.000 Yuan, und dieses Jahr ist der Preis aufgrund der Preiserhöhung des Speichers auf über 23.000 Yuan gestiegen.

Der vierte ist das andere Extrem, mit einem energieeffizienten CPU wie dem Intel N97. Er hat 8 oder 16 GB Arbeitsspeicher, führt keine Modelle aus, sondern bietet nur einen unabhängigen Raum für die Ausführung von Agenten. Er verbraucht zusätzliche Cloud-Token und kostet einige tausend Yuan.

Außer dem Mac Mini integrieren die Agenten-All-in-One-Geräte normalerweise eine Agenten-Plattform und bieten "out-of-the-box" Nutzung. NVIDIA ist nun auch auf dem Edge-AI-Rechner-Markt aktiv und konkurriert mit AMD und Intel um den Marktanteil.

Es ist bemerkenswert, dass die Agenten-All-in-One-Geräte oder die Edge-AI etwas anderes sind als die "Großmodell-All-in-One-Geräte" oder die "DeepSeek-All-in-One-Geräte", die letztes Jahr sehr beliebt waren. Cai Youquan von CBM Information erklärte den Unterschied: Die Großmodell-All-in-One-Geräte lösen das Problem der "Bereitstellung von Rechenleistung für Großmodelle". Sie sind AI-Server, normalerweise mit 8 Grafikkarten und einem Preis im Millionenbereich. Sie können meist nur Fragen beantworten und sind für die Produktionsumgebung von Regierungen und Unternehmen bestimmt. Die Agenten-All-in-One-Geräte oder die Edge-AI lösen dagegen das Problem der Umsetzung von AI-Anwendungen und helfen Unternehmen oder Einzelpersonen tatsächlich bei der Arbeit. Ke Jiejing fügte hinzu, dass es im Wesentlichen zunächst ein Personalcomputer mit starker Hardwareleistung ist und dann Modelle und Agenten ausführen kann und AI-Fähigkeiten bieten kann.

Nachbesprechung der zwei "Retourenwellen", was ist diesmal anders?

Tatsächlich hat der AI-Hardware-Sektor bereits zwei Phasen des Kollektivimpulses und zwei Rückflutphasen erlebt.

Das erste Mal war Anfang 2025. Das DeepSeek-Open-Source-Modell war sehr beliebt, und es gab eine Kaufpanik nach den DS-All-in-One-Geräten. Doch danach gab es Leerlauf und Retouren. Obwohl die Großmodell-All-in-One-Geräte keine Edge-Rechenleistung haben, sind sie auch in All-in-One-Form. Die Branche glaubt bei der Nachbesprechung, dass es damals Rechenleistung, aber keine Anwendungen gab. "Bei den Großmodell-All-in-One-Geräten waren die Anbieter meist Hardwareunternehmen. Die Produkte hatten keine Anwendungen oder nur grundlegende Fragen beantworten können. Die Kunden haben sich in einer verwirrten Situation bei der neuen Technologie blind in die Einführung gestürzt, große Investitionen getätigt und am Ende festgestellt, dass es keinen Wert hatte."

Das zweite Mal war um das Frühlingsfest 2026 herum. OpenClaw war sehr beliebt und hat den MacMini mitgenommen. Diesmal gab es Anwendungen, aber man konnte sie nicht nutzen. "Man hat nur gesagt, dass dieses Ding sehr beliebt sei, und hat jemanden gebeten, einen Krebse zu installieren, aber man hatte keine konkreten Anforderungen, dass die AI bei der Arbeit helfen soll." sagte Wei Yang von Belling. "Egal ob OpenClaw oder verschiedene Krebsen oder Hermes, der Nutzen für normale Privatnutzer ist nicht so groß, wie man es sich vorstellt. Man kann nicht einfach nur den Rechner kaufen, sondern braucht mehr die Anpassung der Ökosysteme." Die Kunden haben sich in die Kaufbewegung gestürzt und mussten am Ende die Geräte retournieren.

Wie wird es nach diesen zwei Fehlschlägen diesmal aussehen?

Interessanterweise hat Guo Mengming die entgegengesetzte Einschätzung und Zeitlinie. Bei der Krebse-Boombewegung um das Frühlingsfest war er pessimistisch; jetzt ist er eher optimistisch. "Man konnte schon an der Schlange der Leute, die einen Krebse installieren ließen, sehen, dass es für die Benutzer schwierig war, die Geräte zu nutzen, wenn sie Schwierigkeiten bei den grundlegenden Fähigkeiten hatten." Aber jetzt ist die Situation anders. "Die Agenten haben in Bezug auf die Fähigkeiten und die Anwendungsreife viel mehr Fortschritte gemacht als letztes Jahr." Viele Benutzer kaufen die Geräte direkt nach den Ergebnissen und nutzen sie wirklich, um praktische Probleme zu lösen. Dieser Teil des Marktes ist stabil. Natürlich gibt es immer noch Nutzer, die sich nur in die Bewegung stürzen. "Der Markt braucht noch einige Zeit, um die Nutzer zu informieren." "Ich glaube, dass es keine so große Retourenwelle wie letztes Jahr geben wird."

Wei Yang gab bekannt, dass das Unternehmen nicht blind All-in-One-Geräte produzieren und einkaufen wird, sondern eher bedarfsgerecht verteilen wird. Aufgrund der starken Preiserhöhung des Speichers beobachten alle. Gleichzeitig forschen viele Nutzer an Agenten und AI, und es wird noch einige Zeit dauern, bis es in die praktische Arbeit umgesetzt wird. "Der allgemeine Rhythmus, die hohe Wachstumsrate wird vielleicht erst nächstes Jahr einsetzen."

Ke Jiejing gestand, dass es derzeit eine schmerzhafte Phase ist. Die Nachfrage ist real, aber nach der Preiserhöhung des Speichers und der CPU ist die Kosten sehr hoch, was viele Nutzer abschreckt. Deshalb haben sie einige neue Pläne in Richtung der Lokalisierung. "Wir passen die Produkte an die lokalen Bedürfnisse an. Obwohl die Kosten auch nicht niedrig sein werden, können wir die lokalen Bedürfnisse der Nutzer besser erfüllen." Ke Jiejing beobachtete, dass "die meisten normalen Nutzer die AI noch auf dem Niveau von neuen Modellen, Wetterabfragen mit AI oder Glücksspiel halten. "Ohne praktischen Nutzen gibt es so etwas wie Blasen."

Die neue Produktkategorie "ist weder hier noch dort"? Wo liegt die echte Nachfrage?

Während des Besuchs der Kunden haben die Branchenmitglieder die Bedenken der Kunden spüren können. Die Edge-AI oder die Agenten-All-in-One-Geräte scheinen in eine Situation geraten zu sein, in der sie "weder hier noch dort" sind - in Bezug auf die Anwendungsfälle gibt es derzeit weniger als in der Cloud; in Bezug auf die Rechenleistung haben sie nur eine Grafikkarte und sind daher beschränkt; in Bezug auf den Preis ist er für normale Nutzer, insbesondere für Studenten, zu hoch.

"Die Kunden finden, dass die Rechnung nicht auf geht." sagte ein Branchenmitarbeiter der Digital Intelligence Frontline. "Aber es ist nicht das Gleiche wie ein Server. Auf dem Server ist die Software noch nicht angepasst, und man kann es nicht sofort nutzen. Wenn man eine externe Softwarefirma beauftragt, muss man noch einige zehntausend bis hunderttausend Yuan investieren. Mit dem Agenten-All-in-One-Gerät kann man es sofort nutzen und es kann ein kleines bis mittleres Team bei der Nutzung des lokalen Modells unterstützen."

Wer wird tatsächlich dafür bezahlen? Die Branchenmitglieder haben zwei typische Gruppen von Personen identifiziert: kleine Teams, die auf Datenschutz achten, und die sogenannten "Superindividuen" oder OPC (Einzelunternehmen), die dieses Jahr oft erwähnt werden.

Wei Yang sagte der Digital Intelligence Frontline, dass kleine Teams mit weniger als 10 Personen auf Datenschutz achten. "Es ist bequem, ein Gerät mit 128 GB Arbeitsspeicher zu kaufen." Beispielsweise haben Forschungsgruppen wie Biowissenschaften und Archäologie oft große lokale Datenbanken aufgrund der Datenschutzanforderungen. Die Suche und die Organisation dieser Daten sind sehr zeitaufwendig. Ihre Agenten können automatisch Literatur durchsuchen, zusammenfassen und sogar die Forschungsrichtungen regelmäßig vergleichen. Wenn sie ähnliche Forschungsrichtungen finden, werden sie automatisch benachrichtigen, um redundante Arbeit zu vermeiden. Bei der Beratung eines Freundes aus der Wasserwirtschaft erwähnte er ein Prinzip: "Wenn die Datenmenge groß ist, wird empfohlen, ein lokales Modell bereitzustellen; wenn die Daten von Menschen verarbeitet werden können, ist es nicht notwendig, die Edge-AI einzusetzen."

Ke Jiejing erklärte eine andere Gruppe von Kunden: Einige Unternehmen möchten nicht, dass ihre Lösungscodes an Cloud-Konkurrenten freigegeben werden. Sie möchten sowohl lokal deployen als auch nicht auf einmal teure Serverräume aufbauen. Die Agenten-All-in-One-Geräte sind dann eine Alternative. Ähnlich ist es bei der AI-Kundenservice in Autohändlern: "Die internen Kundendaten sind privat, und man möchte nicht, dass andere Autohändler die Kunden wegnehmen."

Eine andere Nachfrage kommt von Superindividuen. Li Kaifu stellte fest, dass in Zukunft in AI-Unternehmen viele DRI (Direkte Verantwortliche) auftauchen werden. Sie sind für die Geschäftsergebnisse verantwortlich, führen die Gesamtplanung und die Schlüsselentscheidungen durch und tragen die Verantwortung für das endgültige Ausgabevertrag. "Ein menschlicher DRI steht im Zentrum des gesamten Agentensystems. Um ihn herum arbeiten spezialisierte Cluster aus verschiedenen Agenten wie Forschung, Ausführung, Compliance und Überwachung zusammen." Die Edge-AI-Geräte bieten genau die spezielle Infrastruktur für diese neuen Arbeitskräfte.

Guo Mengming fügte hinzu, dass viele Anwälte, die sie kennen, bereits die All-in-One-Geräte nutzen. "Produkte im Bereich von zwei bis drei Zehntausend Yuan sind für sie akzeptabel." Ähnlich haben wissensintensive, hochwertige Personen wie Chinesische Ärzte ebenfalls hohe Nachfrage. Diese Nutzer benötigen eine lokale Plattform, auf der sie ihr persönliches Wissensrepository langfristig aufbauen, ihre Privatsphäre schützen und Agent-Assistenten kontinuierlich betreiben können.

Cai Youquan gab ein Kriterium für Käufer an: "Alles, was man täglich wiederholt, eignet sich dafür, an Agenten zu übergeben. Je konkreter die Aufgabe, desto besser können die Agenten sie erledigen." Beispielsweise müssen Teileverkäufer täglich Angebote an Dutzende oder Hunderte von Kunden senden, und Finanzbeamte müssen täglich Rechnungen prüfen und Steuern berechnen. Solche mechanischen, repetitiven Aufgaben können vollständig von der AI übernommen werden, aber die meisten Menschen haben noch kein Bewusstsein dafür.

"Ich verstehe sehr gut die Bedenken der Kunden." sagte Guo Mengming. Die Edge-AI-Fähigkeiten befinden sich derzeit in einer Entwicklungsphase, die der Anfangsphase der Smartphones ähnelt. Letztes Jahr waren sie auf der Ebene eines Schülers oder Mittelstufenschülers, und dieses Jahr sind sie auf der Ebene eines Studenten. Bis Ende des Jahres werden es mehr neue Modelle und nützliche Agent-Frameworks geben, und es werden mehr Anwendungsfälle entstehen. "Ich glaube, dass mit der Zeit die Fähigkeitsgrenze