StartseiteArtikel

Das Luxus-Technologie-Brand BUTTONS kooperiert mit TUS-LINK und gibt den ersten Audio-Video-Roboter mit dem HALI-KI-Agenten heraus | Neueste Meldungen

黄 楠2025-10-20 18:26
Teslaien hat die Ökosystemkette von AI Infra, LLM und Agent aufgebaut.

Autor | Huang Nan

Redakteur | Yuan Silai

In letzter Zeit hat die globale Luxus-Technologie-Marke BUTTONS ein neues Produkt namens "BUTTONS SOLEMATE Intelligenter Super-Audiovisueller Roboter" vorgestellt. Dies ist auch die erste Hardwareeinrichtung, die das universelle KI - Agens HALI von TSL Smart City Technology Group integriert. Das universelle KI - Agens HALI wurde am 14. November 2024 veröffentlicht. Durch kontinuierliche Iteration und Optimierung hat es sich von einem hochgradig anthropomorphen KI - Agens allmählich zu einem "Lebensbegleiter" entwickelt, der über Raumwahrnehmungs - und physikalische Interaktionsfähigkeiten verfügt.

Das universelle KI - Agens HALI und der BUTTONS SOLEMATE Intelligenter Super-Audiovisueller Roboter

TSL's HALI hat ein dreidimensionales semantisches Gedächtnismodell aufgebaut, das eng mit der physischen Umgebung verknüpft ist. Es assoziiert die Informationsspeicherung, wie z. B. die Position von Gegenständen, Ereignisaufzeichnungen und die Suche nach Informationen, natürlich mit den Raumkoordinaten und dem Umgebungsumfeld. Der Vorteil besteht darin, dass es nicht nur die Anschaulichkeit und Genauigkeit der Informationsabfrage effektiv verbessert, sondern auch die KI in die Lage versetzt, das "Weltmodell" zu verstehen und für die Inferenz zu nutzen.

Als intelligentes Zentrum für die Benutzerinteraktion kann HALI die Benutzeranfragen in Echtzeit wahrnehmen und verarbeiten. Anders als das traditionelle Modell, das auf bestimmte Aktivierungswörter oder App - Eingänge angewiesen ist, nimmt HALI die Position des Benutzers im Raum, seine Handlungsabsichten und sogar den Umgebungsstatus als ersten Kontext für die Interaktion. Dies bedeutet, dass die intelligenten Dienste nicht "aufgerufen" werden müssen, sondern basierend auf einem tiefen Verständnis des physischen Raums auf passenden Zeit - und Raumpunkten aktiv und unbemerkt angeboten werden, um den aktiven Übergang von "der Mensch sucht den Dienst" zu "der Dienst sucht den Menschen" zu erreichen.

Im konkreten Betriebsprozess analysiert HALI zunächst die Benutzerabsichten und zerlegt die Aufgaben mithilfe des Edge - Modells. Beispielsweise kann HALI auf der Planungsebene die optimale Organisation von Ressourcen, Geräten und Handlungen im Raum - Zeit - Kontinuum effektiv realisieren. Es kann die Struktur des Wohnraums, die Bewegungsbahnen der Benutzer und die Umgebungsveränderungen verstehen. Anschließend wird die Datenvorverarbeitung und -verschlüsselung mithilfe des Edge - Chips durchgeführt. Schließlich koordiniert es die Cloud, um mehrere vertikale KI - Agenten zu mobilisieren und so komplexe Funktionen gemeinsam zu realisieren.

In diesem Prozess ist die GPU - Server - Cluster des TSL Xuzhou AIoT High - Performance Computing Center für die Durchführung von Massivparallelen Kooperationsrechnungen verantwortlich. Der hybride Rechenmotor auf der AIoT High - Performance Computing Cloud - Plattform von TSL unterstützt die dynamische Aufgabeplanung. Gleichzeitig übernimmt das Cloud - Großmodell von TSL die Pfadplanung, um sicherzustellen, dass die Geräte flexibel Raumhindernisse umgehen und präzise an das Ziel gelangen. Das visuelle Sprachmodell ist für die Zielerkennung verantwortlich, das Großsprachmodell generiert die Ausführungsstrategie und sendet sie zurück. Schließlich setzen die KI - Agenten die Entscheidungen um und reagieren.

Der BUTTONS SOLEMATE Intelligenter Super-Audiovisueller Roboter

Basierend auf den umfangreichen heterogenen Rechenkapazitäten des TSL Xuzhou High - Performance Computing Center können komplexe Prozesse in wenigen Sekunden abgeschlossen werden. Im Hinblick auf das Problem der Fusionierten Berechnung von heterogenen Chips hat die AIoT High - Performance Computing Cloud - Plattform von TSL zwischen dem Modell und der Hardware eine einheitliche Abstraktionsschicht aufgebaut, die aus Operator - Bibliotheken für verschiedene Chip - Architekturen besteht. Sie bietet auch eine End - to - End - Werkzeugkette, die mit verschiedenen Inferenz - und Trainingsframeworks kompatibel ist, damit das Modell nahtlos auf heterogenen Rechenkapazitäten läuft und die Effizienz der Inferenz und des Trainings erheblich verbessert wird.

Dr. Shao Ling, Chief AI Officer und Global President der TSL Smart City Technology Group, hat darauf hingewiesen: "Die Fähigkeiten spezialisierter KI - Agenten sind streng auf ihren Fachbereich beschränkt. Sie fehlt die Fähigkeit zur transferierten Lernfähigkeit über verschiedene Bereiche hinweg oder zur Lösung neuer Arten von Aufgaben... Sie operieren hauptsächlich in der digitalen Welt und haben keine Raumwahrnehmung oder direkte Interaktion mit der physischen Welt."

Der Schlüssel zum Fortschritt hin zu universeller KI besteht derzeit darin, die Barrieren der digitalen Welt zu durchbrechen, um eine vollständige Fähigkeits - Schleife von "Wahrnehmung - Inferenz - Handlung" in der physischen Umgebung zu erhalten. "Das heißt, ein echtes universelles KI - Agens muss in der Lage sein, die geometrische Struktur und die dynamischen Veränderungen der dreidimensionalen Umgebung wahrzunehmen, die räumlichen Beziehungen zwischen Objekten, die physikalischen Gesetze und die kausalen Ketten von Aktionen zu inferieren und schließlich Handlungen auszuführen, um Aufgaben sicher und effektiv auszuführen und so die reale Welt zu beeinflussen." sagte Shao Ling.