StartseiteArtikel

He Kaiming hat offiziell angekündigt, dass er bei Google DeepMind angestellt wird.

智东西2025-06-26 11:22
Als herausragender Wissenschaftler bei Google DeepMind tätig sein.

Nach Berichten von Zhidongxi vom 26. Juni hat sich kürzlich der renommierte Computer-Vision-Experte und MIT-Professor He Kaiming für einen Job bei Google DeepMind entschieden. Er hat auf seiner persönlichen Homepage seine neue Position aktualisiert - ausgezeichneter Wissenschaftler bei Google DeepMind (Teilzeit). Gleichzeitig behält He Kaiming weiterhin seinen Lehrstuhl am MIT Department of Electrical Engineering and Computer Science (EECS).

He Kaiming ist einer der Autoren des Deep Residual Network (ResNet). Die von ihm als Erstautor veröffentlichte ResNet-Arbeit "Deep Residual Learning for Image Recognition" ist die am häufigsten zitierten Arbeit des 21. Jahrhunderts.

Die in der Arbeit vorgeschlagene Residualverbindung ist in modernen Deep-Learning-Modellen allgegenwärtig, einschließlich Transformers, AlphaGo Zero, AlphaFold und fast aller gegenwärtigen generativen KI-Modelle. Bis Mai dieses Jahres hat He Kaimings Veröffentlichungen insgesamt über 700.000 Zitationen erreicht.

Vor seinem Wechsel zum MIT im Jahr 2024 war He Kaiming immer in der Industrie und der Wissenschaft aktiv. Er war nacheinander als Forscher bei Microsoft Research Asia (MSRA) und dem Facebook AI Research (FAIR) tätig. Er hat einen Bachelor-Abschluss in Physik von der Tsinghua-Universität und einen Doktor-Abschluss in Informationstechnik von der Hongkonger Universität Chinesisch-Asiatischer Studien. Während seines Bachelorstudiums absolvierte er ein Praktikum in der Gruppe für visuelle Berechnung bei Microsoft Research Asia und war Schüler des renommierten Computer-Vision-Experten Sun Jian. An der Hongkonger Universität Chinesisch-Asiatischer Studien war er Schüler von Tang Xiaoou, dem Gründer des Multimedia-Labors der Universität und des Unternehmen SenseTime.

Außer dem ResNet hat He Kaiming auch viele andere Forschungsergebnisse veröffentlicht, die von hohem akademischem Wert sind und einen tiefgreifenden Einfluss auf die KI und die Computer-Vision haben.

Im Jahr 2009, während er an der Hongkonger Universität Chinesisch-Asiatischer Studien studierte, hat He Kaiming in seiner ersten veröffentlichten akademischen Arbeit einen "Algorithmus zur Entneblung von Bildern" vorgeschlagen. Diese Arbeit gewann sofort den Preis für die beste Arbeit der wichtigsten Tagung in der Computer-Vision, der CVPR, in diesem Jahr. He Kaiming wurde damit der erste Chinesische in der Geschichte der CVPR, der diesen Preis gewann.

Im Jahr 2015 hat das von He Kaiming während seiner Zeit bei Microsoft Research Asia vorgeschlagene ResNet den ImageNet-Wettbewerb in der Bilderkennung gewonnen, und die dazugehörige Arbeit gewann den Preis für die beste Arbeit der CVPR 2016.

Während seiner Zeit am Facebook AI Research hat He Kaiming auch wichtige Beiträge im Bereich der Bildsegmentierung geleistet. Als Erst- und Zweitautor hat er die beiden wichtigen Arbeiten Mask R-CNN und Faster R-CNN veröffentlicht. Die dazugehörigen Forschungen haben die Genauigkeit und Effizienz der Bildsegmentierung auf ein neues Niveau gebracht, und die Arbeit Mask R-CNN gewann den Preis für die beste Arbeit der ICCV 2017.

He Kaiming hat auch den PAMI-Junior-Forscherpreis 2018, die Ehrenpreise für die beste Arbeit der ECCV 2018 und der CVPR 2021 sowie den Everingham-Preis der ICCV 2021 gewonnen.

Derzeit haben weder Google DeepMind noch He Kaiming selbst die genauen Pläne nach seinem Wechsel veröffentlicht. Wir können aber aus He Kaimings jüngsten Vorträgen auf den Tagungen CVPR und NeurIPS die Forschungsrichtungen erfahren, die er als akademisch wertvoll ansieht.

Seit dem AlexNet werden Erkennungsmodelle in der Regel end-to-end trainiert und inferiert, aber die derzeitigen generativen Modelle sind in der Konzeption ähnlich wie das "Schichtweises Training" und beinhalten normalerweise mehrere Schritte der Inferenz und Berechnung. Das von He Kaiming geleitete Team hat im Jahr 2025 den theoretischen Rahmen für ein Ein-Schritt-Generativmodell, das MeanFlow, veröffentlicht. In Zukunft wird er möglicherweise weiterhin nach einem Rahmen für end-to-end generative Modellierung suchen.

He Kaiming hat auch gesagt, dass Erkennung und Generierung zwei Seiten einer Medaille sind. Die Erkennung ist ein "Fluss" von Daten zu Einbettungen, während die Generierung ein "Fluss" von Einbettungen zu Daten ist. In Zukunft könnte ein integrierter Rahmen für Erkennung und Generierung auch eine wichtige Forschungsrichtung für ihn werden.

Bei seinem Vortrag auf der NeurIPS-Konferenz 2024 hat He Kaiming betont: "Die Zukunft ist die echte Testmenge". Er plädiert dafür, dass Forscher sich auf neue, bisher nicht gesehene Daten, neue Konfigurationen, neue Anwendungsfälle und neue Situationen konzentrieren sollten, um das "Overfitting" in der Forschung zu reduzieren.

Bei derselben Konferenz hat He Kaiming gesagt, dass die Essenz der Forschung darin besteht, "Überraschungen" zu finden. Nach seinem Wechsel zu Google DeepMind können wir vielleicht hoffen, dass er noch mehr überraschende Forschungsergebnisse bringt.

Dieser Artikel stammt aus dem WeChat-Account "Zhidongxi" (ID: zhidxcom). Autor: Chen Junda, Redakteur: Li Shuiqing. Veröffentlicht von 36Kr mit Genehmigung.