StartseiteArtikel

Wissenschaftler der Peking University steigen in die Brain-Computer-Interface-Branche ein und sammeln fast 100 Millionen Yuan in der Seed-Finanzierungsrunde.

海若镜2026-06-18 09:34
Die Essenz der Interaktion zwischen Mensch und Welt liegt auf der einen Seite in der Wahrnehmung und auf der anderen im Ausdruck.

Text | Sun Xiaowen

Interview / Redaktion | Hai Ruojing

Das exklusive Wissen von "An Yong Waves" besagt, dass das Unternehmen für invasive Hirn - Computer - Schnittstellen "Xin Sheng Shi Jie" kürzlich eine Samenfinanzierungsrunde von fast 100 Millionen Yuan RMB abgeschlossen hat. Diese Finanzierungsrunde wurde von Matrix Partners China angeführt, und Starlink Capital, Yanyuan Venture Capital und Shuimu Venture Capital haben mitinvestiert.

Zurzeit haben invasive Hirn - Computer - Schnittstellen bereits in medizinischen Szenarien wie der Behandlung von Lähmungen und der Steuerung von externen Geräten durch das Gehirn Eingang gefunden, was die Sicherheit und Wirksamkeit von Langzeitimplantaten bestätigt. Gleichzeitig beschleunigt die Evolution der AI - Agent - und Embodied - Intelligence - Technologien die Erwartungen des Marktes an Hirn - Computer - Schnittstellen: die Umgestaltung der zukünftigen Art der "Mensch - Maschine - Interaktion", die Realisierung der Mensch - Maschine - Fusion und die Verstärkung des Menschen. Elon Musk und sein Neuralink sind der Windrichtungsgeber für diese Vision.

Das Team von Xin Sheng Shi Jie hat mehrere "Junge Chefs" in der Richtung der Hirn - Computer - Schnittstellen des nationalen "Hirnprojekts" zusammengebracht: Der Gründer Wang Qian kommt aus der Fakultät für Psychologie und Kognitionswissenschaft der Peking Universität und dem IDG - McGovern - Institut für Hirnforschung. Der Mitgründer Li Yuanning kommt von der ShanghaiTech Universität. Er ist Doktor der künstlichen Intelligenz und Neurowissenschaften von der Carnegie Mellon University und hat viele Jahre in der Edward - Chang - Laboratorium (ein Top - Labor für Hirn - Computer - Schnittstellen) der Universität von Kalifornien, San Francisco, als Postdoktor geforscht. Das Mitgründerteam umfasst auch Experten aus den Bereichen Embodied - Intelligence, Hirn - Computer - Chips und Hirnähnlichen Chips der Peking Universität.

Dieses junge Wissenschaftlerteam hat gleichzeitig Investitionen von führenden Technologie - Fonds sowie von Einrichtungen der Peking - und Tsinghua - Universität erhalten. Ihre gewählte Richtung ist auch klar: die Fusion von Vision, Sprache und Embodied - Intelligence; das Ziel ist es, ein "Neuraler Grafikkarten" - Hirn - Computer - Schnittstellen - System mit zehntausend Kanälen und einem integrierten Implantat zu entwickeln.

Li Yuanning, Mitgründer von Xin Sheng Shi Jie, ist der Meinung, dass das Sehen die wichtigste Wahrnehmungseingabe des Menschen ist, während die Sprache die zentrale Ausgabemöglichkeit für die menschliche Außenexpression ist. In der Forschung zur Hirn - Computer - Schnittstelle geht es darum, wie visuelle Informationen effizient in das menschliche Gehirn geschrieben werden können und wie Absichten und Semantik ausgelesen werden sollen. Dies entspricht sowohl der Funktionsrekonstruktion von Patienten mit Seh- und Sprachstörungen als auch dem Kernproblem der Mensch - Maschine - Interaktion.

Warum wird zunächst die visuelle Rekonstruktion gewählt, und wie weit kann man es derzeit bringen? Was bedeutet eigentlich die "Neuraler Grafikkarten" in der Hirn - Computer - Schnittstelle? Wie bilden Vision, Sprache und Embodied - Intelligence die Brücke für die nächste Generation der Mensch - Maschine - Interaktion? Im Folgenden finden Sie unser Interview mit Li Yuanning (bearbeitet):

01 Die Wissenschaftler treten in den Ring

An Yong: Wie sind die Mitgründer von Xin Sheng Shi Jie zusammengekommen und beschlossen, ein Unternehmen zu gründen?

Li Yuanning: Dies beruht eigentlich auf einer gemeinsamen Einschätzung über das technologische Endziel: Das Wesen der Interaktion zwischen Menschen und der Welt besteht auf der einen Seite in der "Wahrnehmung" und auf der anderen Seite in der "Expression".

Ich und Wang Qian haben lange Zeit an der visuellen und sprachlichen Hirnrinde geforscht. Vor über zehn Jahren, als ich meinen Doktorandenabschluss an der CMU absolvierte, habe ich am University of Pittsburgh Medical Center invasive Studien zur neuronalen Kodierung und Dekodierung der menschlichen visuellen Rinde durchgeführt und mehrere Studien über die Erzeugung von Wort - und Gedächtnisillusionen durch elektrische Stimulation veröffentlicht. Später habe ich auch an der ersten invasiven chinesischen Hirn - Computer - Schnittstellenforschung in China mitgewirkt.

Zur gleichen Zeit hat das Team von Professorin Wang Qian in China erstmals die Einzelneuronenaufzeichnung der visuellen Rinde an klinischen Patienten durchgeführt und 2020 eine Forschungsarbeit über "Den Mechanismus der Abbildung von farbigen visuellen Illusionen, die durch elektrische Stimulation der menschlichen visuellen Rinde ausgelöst werden" veröffentlicht.

Als wir unsere über zehn Jahre hinweg entwickelten Algorithmen und experimentellen Daten zusammenführten und uns bemühten, sie in die klinische Anwendung umzusetzen, stellten wir fest, dass wir dringend eine Hardwarebasis benötigten, die präzise reguliert werden kann und eine bidirektionale Informationsschleife ermöglicht.

Dafür haben wir das Spitzenteam der Peking Universität, das sich auf Hirn - Computer - Hardwarechips spezialisiert hat, hinzugezogen. Sie verfügen über die seltenen Erfahrungen in der industriellen Chipfertigung und der Massenproduktion.

Professor Zhu Yixin, ein weiterer Mitgründer von Xin Sheng Shi Jie, kommt ebenfalls von der Peking Universität. Als einer der wenigen chinesischen Experten in der Embodied - Intelligence, der eingeladen wurde, auf der NVIDIA GTC Global Conference einen Vortrag zu halten, wurde er von der Vision der "Mensch - Maschine - Fusion" beeindruckt und hat sich dem Team angeschlossen.

So hat sich das Team schließlich aus Experten in allen Bereichen von der Analyse der neuronalen Mechanismen, den untersten Hochdurchsatzchips, der fortschrittlichen klinischen Medizin bis hin zur Embodied - AI - Vernetzung zusammengeschlossen. Dies ist auch unsere technologische Barriere von der siliziumbasierten Rechenleistung zur Kohlenstoff - Silizium - Fusion.

An Yong: Es gibt bereits mehrere chinesische Hirn - Computer - Schnittstellenunternehmen mit einem Marktwert von über zehn Milliarden Yuan. Ist es jetzt zu spät, in diesen Markt einzusteigen? Können die von bisherigen Unternehmen, die sich auf die motorische Funktionsrekonstruktion spezialisiert haben, gesammelten Daten und Fähigkeiten leicht auf Indikationen wie Vision und Sprache übertragen werden?

Li Yuanning: In Bezug auf die Gründung des Unternehmens sind wir nicht die ersten. Aber die bisherigen Unternehmen haben sich hauptsächlich auf die motorische Funktionsrekonstruktion konzentriert, während wir uns für die Richtungen Vision, Sprache und Embodied - Intelligence entschieden haben, in denen alle gerade erst beginnen, und wir haben möglicherweise noch tiefere Erfahrungen gesammelt.

Die Daten - Fähigkeiten, die bei der motorischen Funktionsrekonstruktion gesammelt wurden, lassen sich schwer auf andere kognitive Funktionen übertragen.

Die Dimensionen der motorischen Kontrolle sind relativ niedrig, während Vision und Sprache hochdimensionale nichtlineare Codierungen betreffen. Auf diesem neuen Gebiet hat Xin Sheng Shi Jie nicht nur in Bezug auf die Algorithmen Erfahrungen gesammelt, sondern auch durch die langjährige Arbeit des Gründerteams an der klinischen Front. Wir haben eine enorme Menge an intrakraniellen multimodalen Daten gesammelt, einschließlich einer Datenbank mit elektrischer Stimulation der visuellen Rinde von über hundert Patienten. Das bedeutet, dass wir nicht von Null anfangen müssen, um klinische Fehlversuche zu machen.

02 Die Möglichkeit von zehntausend Kanälen

An Yong: Viele der derzeit auf dem Markt beliebten Unternehmen für invasive Hirn - Computer - Schnittstellen haben ihre Geschäftsidee von der Stärke der "flexiblen Elektroden" ausgehend entwickelt. Was ist die Lösung von Xin Sheng Shi Jie?

Li Yuanning: Flexible Elektroden sind die physikalische Schnittstelle zum Gehirn, was sehr wichtig ist. Aber hinter der Hirn - Computer - Schnittstelle steht ein ganzes System. Was wirklich die Obergrenze der Mensch - Maschine - Interaktion und den Informationsdurchsatz bestimmt, sind die Chips und die neuronalen Kodierungs - und Dekodierungsalgorithmen unter den Elektroden - deshalb haben wir das Konzept der "Neuraler Grafikkarten" entwickelt.

Einige der derzeit in der Klinik verwendeten Hardwarekomponenten haben eine geringe Steuerbarkeit und sind nicht für eine effiziente bidirektionale Interaktion konzipiert. So wie die Grafikkarten die Explosion der künstlichen Intelligenz ermöglicht haben, versucht Xin Sheng Shi Jie, ein "Neuraler Grafikkarten" - System aufzubauen, das die "Kodierung - Dekodierung - Rekonstruktion" - Schleife für die extrem hochbandbreiten Datenströme des Gehirns löst und möglicherweise die zentrale Infrastruktur für die Hirn - Maschine - Fusion und die Mensch - Maschine - Symbiose werden kann.

An Yong: Es gibt auch eine Meinung in der Branche, dass ein Hirn - Computer - Schnittstellen - System nicht unbedingt einen extrem hohen Durchsatz benötigt. Elon Musks Neuralink hat zunächst ein Hirn - Computer - System mit 1024 Kanälen implantiert, aber tatsächlich haben nur einige hundert Kanäle eine Wirkung.

Li Yuanning: Die Durchsatzanforderungen variieren je nach Aufgabe. Die motorische Kontrolle erfordert eine relativ niedrige Aufzeichnungsdimension. Beispielsweise kann man mit weniger als zehn Freiheitsgraden der neuronalen Signale für die Armbewegung die Maus auf einer zweidimensionalen Ebene präzise steuern.

Im Wesentlichen handelt es sich bei allen derzeitigen Arbeiten zur Sprachdekodierung auch um die Dekodierung der feinen Bewegungen der Artikulationsorgane: Mit nur ein paarzig Freiheitsgraden der neuronalen Signale kann man die Bewegungen der Lippen, Zunge und Kehle gut beschreiben und die Sprache dekodieren.

Aber die echte visuelle Rekonstruktion und die natürliche Semantikdekodierung sind ein ganz anderes Projekt. Wenn Sie ein klares Bild pixelgenau in den Kopf eines Blinden schreiben oder direkt eine "komplexe abstrakte Idee, die durch den Kopf schwebt" dekodieren möchten, entspricht jeder Schritt tausenden oder zehntausenden von Dimensionen an Informationen, die gleichzeitig verarbeitet werden müssen. Dann wird die Notwendigkeit von Hochdurchsatzelektroden und Hochdurchsatzchips offensichtlich. Derzeit kann Musks Neuralink 3000 Kanäle realisieren, und wir arbeiten an der Erreichung von zehntausend Kanälen.

An Yong: Sie sind also der Meinung, dass es notwendig ist, Hochdurchsatz - Hirn - Computer - Chips zu entwickeln. Was sind die Schwierigkeiten bei der Entwicklung von Hirn - Computer - Chips?

Li Yuanning: Die Entwicklung von Hirn - Computer - Chips ist wie Tanzen mit Fesseln. Um solche Chips in das Gehirn zu implantieren, müssen sie eine kleine Größe und einen geringen Stromverbrauch haben, gleichzeitig aber einen hohen Durchsatz und eine bidirektionale Interaktion ermöglichen.

Dieses Problem ist nicht unlösbar. Im Vergleich zu GPU - Chips ist die Fertigungstechnologie von Hirn - Computer - Chips derzeit nicht so hoch. Aber ohne Massenproduktion ist der Gewinn sehr gering. Die Chipentwicklung ist sehr kostspielig, und eine kleine Chipfertigung kann schon Millionen von Yuan kosten.

Der Bereich der Hirn - Computer - Schnittstellen steht erst am Anfang, und die Menge an investierten Ressourcen bestimmt, wie viele Probleme gelöst werden können. Aus dieser Perspektive ist die Finanzierung in der Hirn - Computer - Schnittstellenbranche im Vergleich zu anderen Bereichen wie Chips und Embodied - Intelligence noch relativ gering.

An Yong: Wie weit ist die Entwicklung Ihres Hirn - Computer - Chip - Konzepts derzeit?

Li Yuanning: Wir sind eines der wenigen chinesischen Teams, das einen 28 - nm - Hirn - Computer - Chip gefertigt hat. Derzeit hat unser Chip 256 Kanäle, und in diesem Jahr sollten wir einen Chip mit höherem Durchsatz und bidirektionaler Interaktion entwickeln.

03 Die Zukunft der visuellen und sprachlichen Rekonstruktion

An Yong: Warum ist die "visuelle Rekonstruktion" derzeit eine wichtige Richtung, die man zu meistern versucht? Welche Erfahrungen hat Ihr Team in diesem Bereich gesammelt?

Li Yuanning: Aus klinischer Sicht besteht ein hoher Bedarf an visueller Rekonstruktion, und es gibt derzeit keine guten Alternativlösungen. Die drei häufigsten Behinderungstypen in China sind Bewegungsbehinderungen, Sehbehinderungen und Hörbehinderungen. Bei Bewegungsbehinderungen gibt es Prothesen, und bei Hörbehinderungen kann man teilweise mit Cochlea - Implantaten helfen. Aber im Bereich der Sehbehinderungen ist der implantierte Hirn - Computer - Schnittstelle fast die einzige Möglichkeit, Blinden das Sehen wieder zu geben.

Betrachtet man den Forschungsweg, ist der erste Schritt zur Validierung klar. Die primäre visuelle Rinde hat einen Retinotopie - Mechanismus, d. h., wenn man bestimmte Stellen der Rinde stimuliert, kann man Farbempfindungen und Lichtempfindungen erzeugen.

Professorin Wang Qian hat bereits 2020 entsprechende Studien durchgeführt. Die Versuchspersonen sollten beschreiben, wo in ihrem Gesichtsfeld Bilder nach der elektrischen Stimulation der Rinde auftraten. Beispielsweise konnten die Patienten, nachdem das Gesichtsfeld in mehrere Teile aufgeteilt wurde, wahrnehmen, dass links rot und rechts blau war. Dank der Vorteile der chinesischen klinischen Ressourcen haben wir bisher experimentelle Daten von über hundert Fällen gesammelt und teilweise das Problem der einfachen Eingabe von Informationen in die visuelle Rinde von unten nach oben gelöst.

Im Bereich der visuellen Codierungsalgorithmen für komplexe Szenarien gibt es einen alle zwei Jahre stattfindenden internationalen Wettbewerb namens Algonauts. Die Veranstalter stellen einen öffentlichen Datensatz von neuronalen Big Data zur Verfügung und fordern die Teilnehmer auf, Algorithmen einzureichen, um auf der Grundlage der gegebenen Stimuli möglichst genau die neuronale Reaktion des Gehirns vorherzusagen. Unser Team hat in den Jahren 2021 und 2023 diesen Wettbewerb gewonnen. 2025 haben wir nicht mehr teilgenommen, und der Gewinner war Meta AI.

An Yong: Früher hat ein Experte für Hirn - Computer - Schnittstellen gesagt, dass die visuelle Rekonstruktion sehr schwierig sei. Warum ist es so schwierig, Blinden das Sehen wieder zu geben?

Li Yuanning: Es gibt noch zwei Schlüsselprobleme, die nicht gelöst sind.

Das erste ist der Mechanismus der Ergänzung der Umwelt durch das Gehirn bei der dynamischen Wahrnehmung. Wenn wir die Welt betrachten, nimmt unser Gehirn tatsächlich nur in einem sehr kleinen Bereich visuelle Informationen auf: Der Bereich der Retina mit hoher Auflösung ist sehr klein. Das Gehirn nutzt die hochfrequenten Augenbewegungen und ein internes Weltmodell, um die vollständige und kontinuierliche visuelle Szene zu rekonstruieren.

Dieser Mechanismus macht die Rekonstruktion durch die Hirn - Computer - Schnittstelle auch sehr schwierig, denn die primäre visuelle Rinde ist kein einfaches Vorwärtsnetzwerk. Es gibt eine große Anzahl von lateralen Hemmungen und rückkoppelnden Verbindungen zwischen verschiedenen Hirnregionen. Die Aktivierung eines Neurons kann die umliegenden Neuronen beeinflussen, d. h., wenn man einen Punkt aktiviert, kann dies andere Punkte beeinflussen. Dies erhöht die Schwierigkeit der visuellen Codierungsrekonstruktion. Wenn man zehntausend Elektroden einfach als unabhängige Pixelpunkte anregt, wird man wahrscheinlich nur ein unscharfes Bild erhalten.

Das andere Problem ist, wie man die neuronale Plastizität nutzen kann, damit das Gehirn diese Eingabe akzeptiert und eine Wahrnehmung entwickelt. Wenn wir elektrische Signale, die durch einen Algorithmus codiert wurden, in das Gehirn eines Blinden einspeisen, ist dies für das Gehirn eine neue "Sprache", die es noch nie gesehen hat.

Blinde können nicht sofort die Welt "sehen", wenn sie das Gerät angeschlossen haben. Sie müssen einen aktiven Anpassungsprozess ähnlich wie beim "Stärkungslernen" durchlaufen. Im Wesentlichen nutzt man die