Professor Xiao Yanghua: Wie weit ist die embodied Intelligence noch von dem "Emergenz-Phänomen" entfernt?
Die neue Technologiewelle, repräsentiert durch generative KI, entwickelt sich tagtäglich weiter und bringt eine tiefgreifende technologische, kommerzielle und gesellschaftliche Transformation mit sich. Sie treibt die menschliche Gesellschaft von der Informationsgesellschaft zur Intelligenzgesellschaft voran. Während die ganze Welt der Ankunft der KI mit Spannung entgegenseht, interessiert man sich auch sehr für die neuen Chancen und Herausforderungen, die die Künstliche Intelligenz mit sich bringen wird.
Deshalb haben wir eine Diskussion namens „100 Fragen von 100 Personen zu KI & Gesellschaft“ initiiert. Wir haben weitläufig KI - Technologieexperten, Gründer von KI - Unicorns, KI - Anleger sowie Soziologen, Psychologen, Experten für internationale Beziehungen und Science - Fiction - Autoren eingeladen. Mit vielfältigen Perspektiven werden wir die weitreichenden Auswirkungen der Künstlichen Intelligenztechnologie eingehend diskutieren, die Konsens - und Nicht - Konsens - Punkte der KI - Ära aufdecken und gemeinsam die nachhaltige Entwicklung der Künstlichen Intelligenz in Richtung „Menschenentwicklung unterstützen und mit Menschen gut umgehen“ vorantreiben.
In dieser Ausgabe haben wir das große Vergnügen, Professor Xiao Yanghua einzuladen, um uns auf eine intellektuelle Reise in die Welt der KI zu führen.
Professor und Doktorvater an der Fakultät für Computation und Intelligenzinnovation der Fudan - Universität, KI - Wissenschaftler am Shanghai Institute for Science and Intelligence, Direktor des Shanghai Key Laboratory of Data Science. Langjährige Forschung in den Bereichen Big Data und kognitive Intelligenz. Er hat den 10 - Jahre - Einfluss - Paper - Award der ICDE 2024 und den Outstanding Paper Award der ACL 2023 erhalten. Er hat über 300 Artikel in CCF - A - und B - Kategorien veröffentlicht und drei akademische Monographien und Lehrbücher herausgebracht. Er hat auch Forschungspreise von Unternehmen wie Huawei, Alibaba und Meituan erhalten. Er ist stellvertretender Herausgeber oder Redakteur mehrerer internationaler Zeitschriften wie Applied Intelligence.
Wichtige Punkte:
1. In den letzten Jahren hat die Entwicklung der Künstlichen Intelligenz zwei sehr klare Linien gezeigt. Eine ist repräsentiert durch AIGC oder generative Künstliche Intelligenz. Die andere ist die Entwicklung in Richtung Embodied Intelligence. Warum sagen wir, dass AGI eine technologische Revolution ist? Wir müssen es aus drei grundlegenden Aspekten betrachten: Erstens, ob diese fortschrittliche Technologie grundlegend ist. Zweitens, wie sie die Produktivität verbessert. Drittens, wie sie die gesamte gesellschaftliche Überbauung beeinflusst.
2. Die Embodied Intelligence hat noch eine nächste Stufe, nämlich die Koordination von Körper und Geist. Tatsächlich wurde dieses Problem schon auf philosophischer Ebene frühzeitig diskutiert - wie entsteht menschliche Intelligenz? Stellen Sie sich vor, wenn Sie sich wohlfühlen, sind Sie glücklich. Also hat der Körper einen gewissen Einfluss auf das Gehirn. Wenn wir laufen und bis zu einem gewissen Punkt kommen, produziert das Gehirn Dopamin. Der Körper beeinflusst das Gehirn, und umgekehrt beeinflusst das Gehirn indirekt den Körper. Somit beeinflussen sich Körper und Gehirn gegenseitig.
3. In der gegenwärtigen Stufe der KI sind die Qualität der Daten und die Strategie des Trainings und des Fehlersuchendes Versuchs die beiden wichtigsten Faktoren. Das heißt, die Größe der Datenmenge gibt der Qualität der Daten den Vorrang, und die Größe der Rechenleistung gibt der Algorithmenentwicklung den Vorrang.
4. Es gibt in der Branche eine grundlegende Ansicht, dass der Algorithmus oder die Architektur eines Modells die Untergrenze des Modells darstellen, während die Daten die Obergrenze bestimmen. Aus Branchensicht ist es die Hauptaufgabe von Großunternehmen wie Staats - und Zentralunternehmen, ihre Branchen - Daten zu ordnen und zu reinigen. Dies ist der Schlüssel für die Entwicklung von Branchen - KI.
5. Der Kern der Embodied Intelligence - Anwendungen auf der ToC - Seite ist die emotionale Fähigkeit. Wenn Roboter in Zukunft tatsächlich in jedes Haushalt kommen sollen, müssen sie in der Lage sein, mit uns zu empathisieren und unsere emotionalen Bedürfnisse zu verstehen, um in ToC - Anwendungen wirklich wirksam zu werden.
6. In gewissem Maße liegt die von uns heute gesammelte Datenmenge noch sehr weit von dem kritischen Punkt entfernt, der für das Entstehen von Generalisierungsfähigkeit in der Embodied Intelligence erforderlich ist. Im Vergleich zu großen Sprachmodellen kann der Unterschied sogar mehrere Größenordnungen betragen. Es gibt zwei Ansätze, um die Embodied Intelligence schneller an den kritischen Punkt heranzuführen: Erstens, wenn die Datenmenge nicht ausreicht, kann man die Trainingsmenge erhöhen. Zweitens, man muss den menschlichen Generalisierungsmechanismus verstehen, einschließlich der Fähigkeit, aus einem Beispiel zu lernen und zu induzieren und zu deduzieren.
7. Vom geistigen Ursprung der Entwicklung der Künstlichen Intelligenz her haben wir bis jetzt noch nicht aus den drei von Wissenschaftlern in den fünfziger und sechziger Jahren des letzten Jahrhunderts gezeichneten Linien gerückt, nämlich Symbolismus, Konnektionismus und Behaviorismus. Diese drei Paradigmen sind immer noch die wichtigsten Ideen für die Erstellung einer vollständigen Lösung für die Künstliche Intelligenz heute.
8. Embodied - Intelligenz - Roboter werden in Zukunft sicherlich einen szenariobasierten und auf Aufgaben ausgerichteten Weg gehen. Sie können skaliert werden, aber die Intensivierung muss angemessen sein. Man muss berücksichtigen, ob die Körperstruktur des Roboters praktikabel ist, anstatt ihm mehr Fähigkeiten zu verleihen, was gegen die Branchenlogik verstößt.
9. Der menschliche Körper ist sowohl eine Stärkung als auch eine Einschränkung. Die körperlichen Fähigkeiten des Menschen beschränken in gewissem Maße unsere physischen Grenzen. Menschen können nicht mit zwei Beinen zum Mond laufen. Dies ist genau die Einschränkung des menschlichen Körpers für sich selbst. In Zukunft sollten wir umgekehrt darüber nachdenken, um die KI nicht als Gefahr für die Menschen zu werden, müssen wir der KI einen Körper geben. Durch die Einschränkung der körperlichen Funktionen kann die Sicherheit der Menschen gewährleistet werden.
10. Eine KI mit Körper kann tatsächlich die Menschen auf physischer Ebene vernichten, aber noch wichtiger ist das Risiko und die Zerstörung, die eine KI mit Intelligenz für die Menschen bringt. Wie können wir das Risiko der KI abwehren? Erstens, wir müssen die Risikobewertung durchführen und somit die neue Berufsgruppe der KI - Risikoregulierer schaffen, deren Aufgabe es ist, den Stecker zu ziehen. Zweitens, wir müssen die Ausrichtung der KI verbessern. Zunächst müssen wir das Problem der Ausrichtung der menschlichen Gesellschaftswerte lösen.
11. Wie können wir in der Intelligenzära die Degeneration der Menschen verhindern? Ich denke, wir müssen einige Dinge tun: Erstens, wir müssen die grundlegenden Regeln für die Anwendung der Künstlichen Intelligenz festlegen. Zweitens, wir müssen die Pädagogik und die Psychologie stark entwickeln. Drittens, wir müssen nach außen streben, unsere kognitive Grenze erweitern und ein neues Wertesystem aufbauen.
In der zukünftigen Bildungsrevolution dürfen wir nicht für die hochgradigen Fähigkeiten der zukünftigen Zeit unsere gegenwärtigen Kernkompetenzen völlig aufgeben. Die zukünftige Arbeit wird nicht mehr nur Mittel zum Lebensunterhalt sein, sondern Sie können die Erfahrung genießen, die die Arbeit Ihnen bringt.
Vollständiger Transkript
100 Fragen von 100 Personen zu KI & Gesellschaft:
In den letzten drei Jahren hat AIGC eine Welle der Umsetzung und Anwendung der KI - Technologie ausgelöst. Aber es gibt auch Ansichten in der Branche, dass die Embodied Intelligence die Schlüsselrichtung für die Entwicklung der KI ist. Diese beiden Technologierouten laufen derzeit parallel nebeneinander. Sie haben tiefe Forschungen in den Bereichen großer Modelle und Big Data durchgeführt. Aus Ihrer Perspektive, können Sie uns bitte beschreiben, welche revolutionären Eigenschaften diese beiden Technologien gemeinsam haben?
Xiao Yanghua:
In den letzten Jahren hat die Entwicklung der Künstlichen Intelligenz zwei sehr klare Linien gezeigt. Eine ist repräsentiert durch AIGC oder generative Künstliche Intelligenz. Die andere ist repräsentiert durch die Embodied Intelligence.
Große Modelle wie ChatGPT zielen im Wesentlichen darauf ab, den Maschinen die kognitive Fähigkeit des menschlichen Gehirns zu verleihen. Einfach ausgedrückt, sollen die Maschinen lernen, wie Menschen zu denken. Tatsächlich hat Turing in seiner bahnbrechenden Abhandlung (Can Machine Think?) in den fünfziger Jahren des letzten Jahrhunderts bereits das tiefe Problem diskutiert, ob Maschinen wie Menschen denken können. Bereits bei der Entstehung der Computer haben Wissenschaftler über dieses Problem nachgedacht. Die Fortschritte der generativen großen Modelle heute sind im Wesentlichen die Antwort auf dieses Problem. In gewissem Maße können wir sagen, dass die heutigen großen Sprachmodelle die Fähigkeit zur menschlichen Sprachgenerierung und die logische Denkfähigkeit hinter der Sprache erlernt haben und sogar viele kognitive Fähigkeiten des menschlichen Gehirns besitzen.
Die andere Route ist die Embodied Intelligence. Ihr grundlegendes Ziel ist es, den Maschinen die Wahrnehmungs - und Handlungsfähigkeiten des menschlichen Körpers zu vermitteln. Die menschliche Intelligenz zeigt sich nicht nur in der kognitiven Funktion des Gehirns, sondern auch in der Fähigkeit des menschlichen Körpers, die Welt mit den fünf Sinnen wahrzunehmen. Zum Beispiel kann man mit den Augen sehen, mit den Ohren hören und mit der Haut berühren. Und auf der Grundlage dieser Wahrnehmungsfähigkeiten kann man effektiv und reibungslos mit der komplexen Welt interagieren. Diese Wahrnehmungs - und Handlungsfähigkeiten werden hauptsächlich vom Körper bestimmt und verliehen. Daher liegt das grundlegende Ziel der Embodied Intelligence darin, dass die Maschinen die Fähigkeit des menschlichen Körpers, die Welt wahrzunehmen und mit ihr zu interagieren, imitieren können.
Diese beiden Technologierouten sind zwei Schlüsselintelligenzformen, die die Maschinenintelligenz auf ihrem Weg zur AGI durchlaufen muss. Tatsächlich könnte die Entwicklung der kognitiven Intelligenz und der Embodied Intelligence noch eine weitere wichtige meilensteinartige Form (oder Stufe) haben, nämlich die Koordination von Körper und Geist.
Jetzt haben die Maschinen ein Gehirn und einen Körper, aber es besteht immer noch ein wesentlicher Unterschied zwischen der Maschinenintelligenz und der menschlichen Intelligenz in Bezug auf die Koordination von Körper und Geist. Tatsächlich haben die Philosophen frühzeitig über das tiefe Problem nachgedacht, wie menschliche Intelligenz entsteht. Es gab damals mehrere gegenläufige Schulen. Einige Leute glaubten, dass unser Gehirn unsere Intelligenz bestimmt, aber später wurde festgestellt, dass der Körper einen unverzichtbaren Einfluss auf das Gehirn hat. Stellen Sie sich vor, wenn Sie sich wohlfühlen, sind Sie glücklich. Wenn Sie sich sehr schlecht fühlen, ist Ihre Stimmung meistens nicht gut. Wenn wir laufen und bis zu einem gewissen Punkt kommen, produziert das Gehirn Dopamin, das uns erregt und glücklich macht. Die Fähigkeiten des Körpers bestimmen auch unseren Handlungsbereich und somit letztendlich die kognitive Grenze des Gehirns. Das kognitive Muster des menschlichen Gehirns ist in hohem Maße eine Metapher für die körperlichen Fähigkeiten. Zum Beispiel sagen wir oft, dass man beim Tun von Dingen etwas aufnehmen und wieder loslassen kann. Dies ist im Wesentlichen eine Metapher für die Fähigkeit der Arme. Also hat der Körper einen gewissen Einfluss und sogar eine formende Wirkung auf die Funktion des Gehirns. Umgekehrt beeinflusst das Gehirn auch den Körper. Beispielsweise steuert das Gehirn ständig die Interaktion des Körpers mit der Umwelt. Somit beeinflussen sich Körper und Gehirn gegenseitig.
Jetzt scheint es von entscheidender Bedeutung zu sein, ob die Maschinen die Schwelle der Koordination von Körper und Geist überwinden können. Derzeit gibt es immer noch verschiedene Probleme bei der Koordination von Körper und Geist der Maschinen. Betrachtet man die heutigen Roboter einzeln, so wird ihre Körperstruktur immer ausgefeilter, und die Wahrnehmungs - und Interaktionsfähigkeiten, die die Maschinen erreichen können, werden immer stärker. Auch die großen Modelle werden immer stärker, und die kognitive Fähigkeit, die die Maschinen erreichen können, entwickelt sich rasant. Aber wenn man diese beiden zusammenführt, wird man feststellen, dass die Roboter sehr „dumme“ Verhaltensweisen zeigen. Dies liegt im Wesentlichen an der fehlenden Fähigkeit der Maschinen, Körper und Geist zu koordinieren.
Dann stellt sich die Frage, ob die obigen Technologierouten eine technologische Revolution darstellen. Langfristig betrachtet, handelt es sich hier um ein grundlegendes Problem, nämlich ob das Gehirn oder der Körper, oder genauer gesagt, die kognitive Fähigkeit des Gehirns oder die Wahrnehmungs -, Interaktions - und Handlungsfähigkeiten, die der Körper zeigt, eine entscheidendere, revolutionärere und nachhaltigere Auswirkung und Rolle für die industrielle und gesellschaftliche Entwicklung spielen?
Wir können jetzt sehr deutlich sehen, dass, wenn die KI die kognitive Fähigkeit des Menschen erlangt hat, das heißt, wenn die Maschinen ein Gehirn haben, dies sicherlich eine technologische Revolution ist. Warum sagen wir, dass dies eine technologische Revolution ist? Wir müssen es aus drei grundlegenden Aspekten betrachten:
Erstens, ob diese fortschrittliche Technologie grundlegend ist. Die traditionellen technologischen Revolutionen, wie die Dampf - und die Elektrizitätsrevolution, sind zu Infrastrukturen geworden und sind fast überall anzutreffen. Also ist die Grundlegendheit gegeben.
Zweitens, wie sie die Produktivität verbessert. Als eine fortschrittliche technologische Revolution verbessert sie die Produktivität um ein Vielfaches oder sogar exponentiell. Gegenwärtig, mit der Unterstützung von AIGC, hat sich die Effizienz vieler Arbeitsaufgaben, insbesondere geistiger Arbeitsaufgaben, wie die Prüfung von Verträgen, die Herstellung von Zeichnungen und die Generierung von Texten, um Hunderte oder Tausende von Prozent erhöht. Nach der Einführung von AIGC ist die Produktionsmenge von verschiedenen wissenschaftlichen Artikeln stark gestiegen, so dass die Menschen fast von der Artikelflut überflutet werden. Dies ist tatsächlich eine starke Steigerung der Artikelproduktivität. Ohne AIGC hätten viele unserer Studenten Schwierigkeiten, gute Texte zu schreiben, aber heute haben sie diese Sorgen nicht mehr. Dies ist ein Beweis für die Produktivität. AIGC ist tatsächlich eine Produktivitätsfaktor.
Drittens, wie sie die gesamte gesellschaftliche Überbauung beeinflusst. Wenn die KI lernt zu denken und die Fähigkeit des menschlichen Gehirns erlangt hat, ist die Reichweite und Tiefe ihrer Auswirkungen auf die gesamte Gesellschaft beispiellos. Alle menschlichen Produktions - und Lebensaktivitäten, die der Intelligenz zugänglich sind, werden von der generativen Künstlichen Intelligenz berührt. Zum Beispiel kann man bei der Anhörung von Berichten oder dem Besuch von Sitzungen, die geistige Aktivität erfordern, KI - Produkte für die Protokollierung von Sitzungen entwickeln. Also wird die Anwendung einer KI mit Gehirn in jede Kapillare der Gesellschaft eindringen und überall anzutreffen sein. Ihre breite Anwendung kann auch zu einer Faulheit des menschlichen Denkens führen. Daher sind ihre Auswirkungen auf die gesamte Gesellschaft auch sehr weitreichend. Es gibt bereits viele Diskussionen darüber, ob das Gehirn der Menschen nach der breiten Anwendung von AIGC, wenn es nicht mehr benutzt wird, verschlechtert werden könnte. Dies sind im Wesentlichen die Auswirkungen einer KI mit Gehirn.
Also, gemäß den obigen drei Kriterien ist AIGC oder das generative große Modell sicherlich eine neue technologische Revolution. Aber wenn man die Emb