Das SenseFoundry-Platform von SenseTime wird umfassend aktualisiert, um die intelligente Basis für die nächste Generation von Städten zu schaffen | Live-Reportage
Autor | Huang Nan
Redakteur | Yuan Silai
Am 9. Dezember hat SenseTime auf dem AI-Forum 2025 von SenseTime im Hongkong Science Park den umfassenden Upgrade-Pfad seiner Flaggschiffplattform "SenseTime Ark" offiziell vorgestellt.
Derzeit ist visuelles AI zum Kernantrieb für die intelligente Modernisierung von Smart Cities und Branchen geworden. Die traditionelle Methode der Algorithmenentwicklung im Bereich visuellen AI hängt jedoch stark von professionellen Algorithmenexperten ab und ist mit drei großen Problemen konfrontiert: langer Entwicklungszyklus, hohe Kosten und hohe Einstiegshürde. Mit dem ständigen Auftauchen von Langschwanz-Szenarien ist das traditionelle Algorithmenmodell nicht in der Lage, den Bedarf an skalierbaren Anwendungen zu erfüllen.
Dr. Xu Li, Vorsitzender und CEO von SenseTime, sagte: "Die letzten zehn Jahre waren die Zeit mit den schnellsten Veränderungen in der Wahrnehmung von Künstlicher Intelligenz. Wir erleben möglicherweise die größte technologische Welle aller Zeiten. AI entwickelt sich von der Wahrnehmung zur Generierung, von der Cloud zum Endgerät und jetzt hin zu Embodied AI und Weltmodellen und verändert die Arbeitsweise in jeder Branche."
Dr. Xu Li, Vorsitzender und CEO von SenseTime
Piao Yuankui, Senior Director der Geschäftseinheit für Smart Cities und Commerce von SenseTime, weist ebenfalls darauf hin, dass die Ankunft der Ära der Large Language Models die Umgestaltung des Branchenparadigmas beschleunigt. Die Algorithmenentwicklung ist nicht mehr nur auf Experten angewiesen, sondern wird auch an Feldingenieure geöffnet. Die Modellanwendung wandelt sich von der "maßgeschneiderten Entwicklung" zur "intelligenten Produktion". Die Branche braucht dringend ein neues Produktionsmodell für visuelles AI, um die Anpassung der Modellfähigkeiten an die Geschäftsanforderungen und die effizientere Implementierung zu beschleunigen.
Deshalb hat SenseTime die aktualisierte Version von "SenseTime Ark" für visuelles AI 2.0 vorgestellt und ein neues Produktionsmodell für visuelle Algorithmen basierend auf zwei Systemen, nämlich der "Integration von allgemeinen und spezifischen Modellen" und dem "geschlossenen Kreis der intelligenten Training" aufgebaut.
Bei der Orchestrierung von "allgemeinen und spezifischen" Modellen erreicht Ark durch die mehrstufige Zusammenarbeit zwischen leichten kleinen Modellen und allgemeinen großen Modellen eine schrittweise Inferenz für Langschwanz-visuelle Aufgaben, was sowohl die Erkennungsgenauigkeit gewährleistet als auch den Rechenleistungsverbrauch erheblich reduziert. Im Bereich des "intelligenten Trainings" hat Ark mit Agentic Training als Kern einen geschlossenen Kreis für den gesamten Prozess um die Datenintelligenzaufbau, das Modelltraining, die Bewertung und die Implementierung gebildet, sodass die Produktion von visuellen Modellen von der Bildaufnahme bis zur geschäftlichen Entscheidung end-to-end automatisiert werden kann und auch erste Anlaufende Ingenieure schnell einsatzfähige visuelle Modelle erstellen können.
Das neue Produktionsmodell für visuelle Algorithmen von SenseTime
Gleichzeitig baut die Ark-Plattform eine integrierte Plattform für visuelle Agenten mit "Wahrnehmung - Entscheidung - Handlung" auf, die das visuelle Verständnis in der digitalen Welt mit der physischen Aktion in der realen Welt verbindet und die kooperative Wahrnehmung und Entscheidung von heterogenen Endgeräten wie Drohnen, Roboternhunden und Fahrerlosen Fahrzeugen unterstützt, um die Inspektions- und Patrouillenszenarien hin zu einer integrierten Luft- und Bodensicherheit zu entwickeln.
Basierend auf der Fähigkeit von Multimodal-Large Language Models kann SenseTime Ark SenseFoundry verschiedene visuelle Modelle effizient koordinieren und einen geschlossenen Arbeitsablauf für die Szenarienwahrnehmung, Datenverarbeitung und intelligente Entscheidung erstellen. Sein Kernvorteil liegt darin, die Grenzen des traditionellen visuellen AI zu überschreiten. Es kann nicht nur "sehen", sondern auch "verstehen, denken und entscheiden", was die Stadtverwaltung von der "reaktiven Reaktion" zur "proaktiven Vorhersage" verändert.
Dieser technologische Durchbruch beschleunigt auch den Prozess der industriellen Intelligenz. Am Beispiel des öffentlichen Sektors hat SenseTime basierend auf AIGC-Technologie und traditioneller Computervisionstechnologie das "Projekt zur Instandhaltung und zum Betrieb des Künstliche-Intelligenz-Enabling-Centers in Kunming" entwickelt, um ein umfassendes und mehrschichtiges städtisches Künstliche-Intelligenz-Dienstesystem aufzubauen, das die Infrastrukturdienste für Künstliche Intelligenz, die gemeinsamen Anwendungsunterstützungsdienste für Künstliche Intelligenz und die typischen intelligenten Anwendungsdiensteszenarien umfasst.
Außer auf dem chinesischen Binnenmarkt erweitert sich die Technologiefähigkeit und das Plattformsystem von SenseTime Ark auch kontinuierlich auf den Märkten in Hongkong, Macau und im Ausland.
Insbesondere auf den Märkten in Hongkong und Macau hat die Beschleunigung des Smart City -Baus in Hongkong den Bedarf an einem systematischeren visuellen AI in den Stadtverwaltungsszenarien erhöht. Feng Yu, Geschäftsführer für Hongkong und Macau von SenseTime, sagte, dass das neue plattformbasierte, modellbasierte und agentenbasiertes System von Ark den Bedarf der Märkte in Hongkong und Macau von der "Analyse zur Einsicht und von der Einsicht zur Entscheidung" erfüllt.
Derzeit hat SenseTime Ark in mehreren Schlüsselszenarien wie Stadtssicherheit, Verkehr, Fertigung, Drohnenpatrouille und Embodied AI eine skalierbare Anwendung erreicht und den Service in fast 200 Städten in China und im Ausland abgedeckt.
Am Veranstaltungsort hat Professor Lin Dahua, Mitbegründer und Chefwissenschaftler von SenseTime, in seinem Vortrag mit dem Thema "Von der Fähigkeitsentfaltung zum Wertkreislauf: Der Weg der Multimodal-Large Language Models zu Wert und Innovation" darauf hingewiesen, dass wir nach drei Jahren des "explosiven Wachstums" erneut an einer wichtigen Kreuzung stehen. Es gibt zwei wichtige Wege für die zukünftige Branchenentwicklung: Erstens muss AI wirklich in die Praxis umgesetzt werden, um die Entwicklung von Technologie und Anwendung durch Wert anzutreiben; zweitens muss man in das Labor zurückkehren, um die ursprüngliche Innovation des nächsten technologischen Paradigmas zu erkunden.
Professor Lin Dahua teilt im Vortrag die Wege der Multimodal-Large Language Models zu Wert und Innovation
Deshalb kann SenseTime durch Grundlageninnovationen, einschließlich der nativen Multimodal-Fusionsarchitektur NEO, des Trainingsparadigmas für die Vorhersage über verschiedene Perspektiven und des effizienten Inferenzsystems SekoTalk, die räumliche Wahrnehmung und Echtzeitinteraktionsfähigkeit der Modelle effektiv verbessern und die Entwicklung der Large Language Models von "AI für X" zu "AI in X" vorantreiben, um die geschlossene Kopplung von Agenten und Szenarien zu erreichen.
Mit dem Eintritt der Künstlichen Intelligenz in die "Ära der Large Language Models" werden Embodied AI und Weltmodelle zu den Schlüsseltechnologierichtungen für die Branchenumwandlung. Dr. Wang Xiaogang hat auf dem Forum angekündigt, dass der Daxiaorobot am 18. Dezember offiziell vorgestellt werden wird. Es werden mehrere weltweit führende Technologien und Produktportfolios vorgestellt, und das erste in China quelloffene und kommerziell anwendbare Weltmodell "Kaiwu" 3.0 wird veröffentlicht. Zusammen mit den Ökosystempartnern wird ein integriertes Branchenökosystem von "Modell - Hardware - Szenario" aufgebaut, um den Fortschritt der Embodied AI - Branche voranzutreiben.
Rundtischgespräch: Vom "digitalen Raum" in die "physische Welt": Wie formt das Embodied Weltmodell die Mensch - Maschine - Interaktion neu?
Das Embodied AI überwindet schrittweise die Kluft zwischen der "digitalen Welt" und der "physischen Welt". Der Daxiaorobot wird den Robotern ein intelligentes "Gehirn" verleihen, sodass sie von der "passiven Ausführung" zur "autonomen Erkundung" übergehen. Darüber hinaus soll die fortschrittliche Künstliche Intelligenz in zuverlässige Produkte umgewandelt und in jedes konkrete Lebensszenario integriert werden.