StartseiteArtikel

Su Hao, der Autor von ImageNet, kehrt in China zurück und lehrt an der Fudan-Universität. Als Schülerin von Fei-Fei Li und der Autor mit den meisten Zitierungen im Bereich Embodied AI wird er zum Direktor des Instituts für Allgemeine Physik-AI ernannt.

量子位2026-04-17 11:06
Fördern Sie die endgültige Realisierung von "physikalischer Intelligenz".

Der chinesische Wissenschaftler mit der höchsten Zitierhäufigkeit seiner Publikationen im Bereich der Embodied Intelligence ist nach 17 Jahren im Ausland zurückgekehrt.

Gerade jetzt wurde auf der 5. China 3D Vision Conference (China3DV 2026) von Fudan University offiziell bekannt gegeben, dass Su Hao, Schüler von Fei-Fei Li und Mitautor des ImageNet-Projekts, der Universität beitritt.

Nach seinem Eintritt in Fudan wird Su Hao als Distinguished Professor fungieren und die Gründung des Instituts für Allgemeine Physikalische Intelligenz leiten sowie Direktor dieses Instituts werden.

Die offizielle Seite von Fudan University definiert Su Haos Rückkehr als einen "schlüssigen Zug für die intelligente Ära".

Tatsächlich gab es bereits vor der offiziellen Ankündigung Gerüchte an der Universität von Kalifornien, San Diego (UCSD) und an Fudan, dass Su Hao, der Vorreiter im Bereich der Embodied Intelligence, bald an Fudan lehren würde.

Jetzt ist die Ankündigung erfolgt, was seine lang erwartete Rückkehr bestätigt.

Wer ist Su Hao?

Su Hao ist der chinesische Wissenschaftler mit der höchsten Zitierhäufigkeit seiner Publikationen im Bereich der Embodied Intelligence, Mitbegründer des ImageNet, Initiator von bahnbrechenden Projekten wie ShapeNet, PointNet, PartNet, SAPIEN und ManiSkill sowie Mitbegründer und CTO des Unternehmens Hillbot im Bereich der Embodied Intelligence.

Zuvor war er Assistentprofessor am Department für Informatik und Elektrotechnik der Universität von Kalifornien, San Diego (UCSD) und Leiter des Embodied Intelligence Lab.

Früher wurde Su Haos persönliche Homepage an der UCSD nicht mehr gepflegt und aktualisiert.

Auf Su Haos neuer persönlicher Homepage ist seine neue Position an Fudan bereits aktualisiert.

Bis jetzt wurden seine Publikationen auf Google Scholar über 145.000 Mal zitiert, was ihn zu dem ersten chinesischen Wissenschaftler im Bereich der Embodied AI macht.

Im vergangenen Jahr erhielt er gemeinsam mit Xiesainen den CVPR Young Researcher Award für ihre herausragenden Beiträge im Bereich der Computervision.

Es ist erwähnenswert, dass Su Hao auch der Senior-Kollegen von vielen bekannten Wissenschaftlern wie Yi Li (Assistentprofessor am Tsinghua Institute for Interdisciplinary Information Sciences), Ce Wu Lu (Gründer von Qiongche Intelligence und Professor an der Shanghai Jiao Tong University), He Wang (Gründer von Galaxy General Intelligence und Assistentprofessor an der Peking University), Mengyuan Yan (Forscherin bei OpenAI) und Kaichun Mo (Forscher bei NVIDIA) ist.

Von Beihang über Princeton bis Stanford

Im Jahr 2002 begann Su Hao sein Studium der Informatik an der Beihang Universität und war Mitglied der ersten Klasse des Advanced Institute of Science and Technology.

Während seines Bachelorstudiums studierte er unter der Leitung des Akademikers der chinesischen Akademie der Wissenschaften und ehemaligen Präsidenten der Beihang Universität, Li Wei, mathematische Logik und automatische Theorembeweise.

Im Jahr 2005 absolvierte er ein Praktikum am Microsoft Research Asia (MSRA) auf Empfehlung von Professor Li Wei und arbeitete unter den Anleitungen von Jian Sun, Xiangyang Shen und Ming Zhou.

Zu dieser Zeit konzentrierte er sich auf die natürliche Sprachverarbeitung. Mit der Vertiefung seiner Forschung erkannte er jedoch zunehmend, dass im Vergleich zu abstrakter Sprache Signale direkt aus der physischen Welt (wie das Sehen) der grundlegendere Weg zur Erforschung der Intelligenz sind.

Sein Forschungsschwerpunkt verschob sich daraufhin hin zur Computervision.

Im Jahr 2008 nahm Su Hao auf Empfehlung von Xiangyang Shen an dem ImageNet-Projekt an Princeton und Stanford teil und wechselte 2009 auf Empfehlung von Fei-Fei Li offiziell an die Stanford Universität.

Das bahnbrechende ImageNet-Dataset hat in den letzten 20 Jahren die Künstliche-Intelligenz-Welle vorangetrieben.

Nach dem ImageNet-Projekt arbeitete Su Hao mit Jia Li am Object Bank-Projekt zusammen, um die semantische Repräsentation von Bildern in hochgradigen visuellen Aufgaben zu verbessern. Dadurch konnten einfache Klassifikatoren auch in Aufgaben wie Objekterkennung und Szenenklassifikation hervorragende Ergebnisse erzielen. Diese Studie wurde 2010 in den NIPS veröffentlicht.

Der Begründer der 3D-Vision

Nach der zunehmenden Vervollkommnung der Methoden in der 2D-Vision richtete Su Hao seinen Blick auf die 3D-Vision.

Im Jahr 2014, nachdem er seinen Doktor in Mathematik an der Beihang Universität erhalten hatte, absolvierte er seinen Informatik-Doktor an der Stanford Universität unter der Leitung von Leonidas Guibas und konzentrierte sich auf die dreidimensionale Wahrnehmung.

Im Jahr 2015 veröffentlichte er ShapeNet, das weltweit erste großangelegte 3D-Dataset, das über 3 Millionen 3D-CAD-Modelle in 3135 Kategorien enthält und von außen als "ImageNet des 3D-Bereichs" gefeiert wird.

Nach der Veröffentlichung von ShapeNet begann die 3D-Visionsforschung eine goldene Entwicklungsphase.

Im Jahr 2017 wurden nacheinander PointNet und PointNet++ veröffentlicht, wodurch der Anteil von 3D-Visions-Publikationen in Top-Konferenzen von weniger als 10 % auf 70 % stieg.

PointNet ist das erste Deep-Learning-Modell, das direkt mit Rohpunktwolken-Daten arbeitet, während PointNet++ die lokalen Strukturinformationen in Punktwolken weiter erfasst.

Diese beiden Arbeiten werden heute weit verbreitet in autonomen Fahrsystemen eingesetzt.

Nachdem er 2018 seinen Informatik-Doktor an der Stanford Universität erhalten hatte, veröffentlichte Su Hao das 3D-Objekt-Dataset PartNet und trat an die Universität von Kalifornien, San Diego ein.

Von der Vision zur Embodied Intelligence

Nach der Wahrnehmung stellte sich Su Hao die Frage, ob es möglich sei, spezifische Wahrnehmungsalgorithmen in ein größeres System zu integrieren.

Diese Überlegung trieb ihn dazu, von der Computervision zur Robotikforschung überzugehen.

Im Jahr 2020 veröffentlichte er auf der Grundlage von PartNet den weltweit ersten Simulator mit generalisierbaren Manipulationen - SAPIEN (benannt nach "Homo sapiens" aus "Sapiens: A Brief History of Humankind"), der die Schlüsselinfrastruktur für die Forschung in Robotervision und Interaktionstasks aufbaute.

Im Jahr 2021 führte er auf dieser Grundlage die ManiSkill-Robotik-Manipulationssimulationsplattform ein, um Robotik-Manipulationsfähigkeiten zu testen und zu trainieren.

Im selben Jahr initiierte Su Hao auf der ICCV eine Workshop-Serie, die sich auf physikbasierte Modellierung und Simulation, lernbasierte Simulation, menschliche Simulation bis hin zur Embodied Vision und Robotik-Lernen konzentrierte.

Diese Ergebnisse wurden auch in Su Haos gegründetes Unternehmen für Embodied Intelligence, Hillbot, weitergeführt.

Im Jahr 2024 trat Su Hao in die Startup-Welle der Embodied Intelligence ein, gründete Hillbot und übernahm die Position des Chief Technology Officers.

Die beiden Trumpfkarten von Hillbot sind der von Su Hao veröffentlichte SAPIEN-Simulator und die ManiSkill-Trainingsplattform, die auf Simulation und 3D-Generierung spezialisiert sind.

Darüber hinaus hat Hillbot eine Partnerschaft mit NVIDIA eingegangen und nutzt die Nvidia Cosmos-Plattform, um hochrealistische Videotrainingsdaten zu generieren.

In Bezug auf die Produkte hat Hillbot den Radroboter Hillbot Alpha entwickelt, der auf Simulationsschulungen basiert und hauptsächlich für mobile Manipulationstasks in komplexen Umgebungen wie Einzelhandelsgeschäften, Cafés und Fertigungsstraßen eingesetzt wird.

Warum Fudan?

Für seine Entscheidung, Fudan zu betreten, gab Su Hao eine einfache und entschlossene Erklärung:

Weil das, was Fudan zu tun gedenkt, dasselbe ist wie das, was ich zu tun gedenke.

Dies bezieht sich auf die Förderung der "physikalischen Intelligenz".

Physikalische Intelligenz bedeutet, dass ein KI-System in der physischen Welt effektiv Aufgaben erledigen kann - es kann sowohl die Welt verstehen als auch angemessene Handlungen ausführen.

Nach Ansicht von Su Hao ist dies nicht nur ein Algorithmusproblem, sondern betrifft auch die Robotereinheiten, die interdisziplinäre Verschmelzung und ein vollständiges IndustriekoSystem.