StartseiteArtikel

Warnung von einem Top-Experten der UC Berkeley: Es bleiben nur noch fünf Jahre für Tätigkeiten, die Menschen ausführen können.

新智元2025-10-11 18:18
Innerhalb von fünf Jahren werden Roboter in Haushalte und Branchen einziehen, und der Fliehkraftregler der Selbstentwicklung wird in Gang gesetzt.

Der Fünf-Jahres-Zeitplan hat begonnen. Sergey Levine, ein Renommierter Forscher von UC Berkeley, sagte direkt: Roboter werden bald in die reale Welt eintreten und nicht nur Küche und Wohnzimmer übernehmen, sondern möglicherweise auch Fabriken, Lagerhäuser und sogar die Datenzentrumskonstruktion. Die echte Revolution beginnt, wenn der "Fliehkraftregler der Selbstentwicklung" einmal in Gang kommt und nicht aufhört.

In fünf Jahren müssen Sie möglicherweise nicht mehr selbst Kleider falten, kochen oder den Boden wischen!

Der Professor von UC Berkeley und Top-Experte für Robotik, Sergey Levine, prophezeit: Vor 2030 können Roboter wie Haushaltshilfen das gesamte Haushaltseigentum unabhängig bewirtschaften.

Dies ist kein Showstück, sondern ein Signal dafür, dass der "Fliehkraftregler der Selbstentwicklung" bald in Gang kommt.

Der Haushalt ist nur der Anfang. Ein größerer Schock ist - die Arbeiterwirtschaft, die Fertigungsindustrie und sogar die Datenzentrumskonstruktion werden im Robotertsunami neu geschrieben.

Fünf-Jahres-Zeitplan: Wann startet der Fliehkraftregler wirklich?

Als Sergey Levine in einem Podcast die Prognose "Median 5 Jahre" aussprach, dachte viele Leute, dass dies Science-Fiction sei.

Aber dies ist keine leeren Worte, sondern basiert auf der ständigen Akkumulation von Robot Foundation Models + realer Implementierung + praktischer Rückmeldung in den letzten Jahren.

Zur gleichen Zeit hat das π0,5-Modell von Physical Intelligence in einer bisher nicht gesehenen Haushaltsumgebung es ermöglicht, dass der Roboter komplexe und erweiterbare Haushaltsarbeiten wie "Küche oder Schlafzimmer aufräumen" erledigt.

Illustration der kooperativen Trainingsaufgaben in der π(0,5)-Rezeptur, einschließlich verschiedener Roboter-Datenquellen aus verschiedenen Robotertypen sowie multimodalen Daten aus dem Internet, die hochrangige Subaufgabenanweisungen und Anweisungen enthalten.

Diese Fortschritte unterscheiden sich von Demonstrationsvideos. Sie sind klare praktische Fähigkeiten - beispielsweise können Roboter Kleider aus dem Waschkorb holen, einen Tisch voller Teller und Tassen abräumen, Kleider falten und Kisten zusammenbauen. All diese Aktionen werden von Modulmodellen + visuell-sprachlichen Aktionsnetzwerken realisiert.

Levine betont auch:

Das wahre Zeichen für den Start dieses Fliehkraftreglers liegt nicht darin, einen Roboter zu bauen, der auf den ersten Blick beeindruckend ist, sondern darin, dass der Roboter in einer realen Familie eine Aufgabe, für die Menschen bereit sind, zu bezahlen, gut erledigen kann.

Wenn dieser Schwellenwert einmal überschritten ist, bringt jede praktische Anwendung Daten, und jede Rückmeldung fördert die Verbesserung. Erst dann beginnt der Fliehkraftregler wirklich zu drehen.

Und dies ist keine ferne Vorstellung.

Das Forschungsunternehmen von UC Berkeley hat kürzlich gezeigt, dass Roboter in ein oder zwei Stunden echter Arbeit lernen können, Mainboards zusammenzubauen und sogar IKEA-Möbel zu montieren.

Obwohl die Effizienz noch verbessert werden muss, bedeutet dies, dass der Mechanismus des "Lernens, Dinge zu tun" bereits in der Realität funktioniert.

Autonomes Fahren hat Schwierigkeiten, Roboter sollen jedoch schneller in die Praxis umgesetzt werden

Viele Leute denken beim ersten Gedanken an "Haushaltsroboter": Selbst autonomes Fahren ist noch nicht weit verbreitet. Wie können Roboter schneller eingesetzt werden? Aber Sergey Levine meint - Roboter könnten schneller in die Praxis umgesetzt werden.

Der Grund liegt in der Schleife von "Fehler - Korrektur - Lernen".

Wenn ein Roboter zu Hause Kleider faltet, Teller und Tassen abräumt oder kocht, kann er in den meisten Fällen schnell korrigiert werden und lernt aus den Fehlern;

Beim Fahren auf der Straße ist es völlig anders. Ein einziger Fehler kann eine Katastrophe sein.

Das bedeutet, dass Roboter in der Haushaltsumgebung häufiger und sicherer Daten und Rückmeldungen sammeln können und natürlich schneller lernen.

Ein weiterer Vorteil ist das Alltagswissen und die intuitive Wahrnehmung.

In der Haushaltsumgebung ist die Situation zwar ungeordnet, mit Verschattungen und verschiedenen Gegenständen, aber insgesamt noch beherrschbar.

Im Vergleich dazu muss autonomes Fahren mit hoher Geschwindigkeit, komplexem Verkehr und plötzlichen Situationen umgehen, und jede Entscheidung betrifft die öffentliche Sicherheit. Die Schwelle ist höher.

Wie die Forscher von MIT in diesem Jahr in einem Kommentar sagten:

Wenn man Schlussfolgerungen und Alltagswissen in die Wahrnehmung von Robotern aufnimmt, können sie in der realen Welt weit mehr leisten, als wir uns vorstellen können.

Levine betont besonders, dass der echte Schlüssel nicht darin besteht, einen allmächtigen Roboter zu bauen, sondern ihn in der Realität gut genug in der Lage zu machen, eine bestimmte Aufgabe zu erledigen, für die Menschen bereit sind, zu bezahlen.

Wenn dieser Schwellenwert einmal überschritten ist, kann er anfangen, seine Arbeit zu tun und sich ständig verbessern, um dann auf mehr Aufgaben zu erweitern.

Dies ist auch der grundlegende Grund, warum er meint, dass der "Roboter-Fliehkraftregler" möglicherweise früher starten kann als autonomes Fahren.

Der technologische Durchbruch zeigt sich nicht nur in einem schnelleren Implementierungsrhythmus, sondern auch in der Neukonstruktion des unteren Modells.

Technologische Basis: VLA-Modell und Emergenzfähigkeiten

Damit Roboter von der Demonstration zu realen Haushaltsaufgaben kommen, geht es nicht um ein oder zwei hartkodierte Anweisungen, sondern um eine neue untere Architektur - das VLA-Modell.

Sergey Levine hat in einem Podcast das Konzept des VLA - Visuelle (Vision), Sprachliche (Language), Aktions (Action) Modells vorgeschlagen.

Das visuelle Modul erfängt die Umgebung wie die Augen, das Sprachmodul versteht die Anweisungen und plant die Schritte, und der Aktionsdecoder fungiert wie das "Motorcortex", um abstrakte Pläne in kontinuierliche und präzise Operationen umzuwandeln.

Im Gegensatz zu großen Sprachmodellen, die nur diskrete Texte generieren müssen, müssen Roboter kontinuierliche Aktionen verarbeiten.

Levine hat angegeben, dass sie Methoden wie Flow Matching und Diffusion verwendet haben, um eine hochfrequente feine Steuerung zu erreichen.

Diese Technologien ermöglichen es den Robotern nicht nur, einzelne Aufgaben wie "ein Kleid falten" auszuführen, sondern auch komplexe Handlungssequenzen kontinuierlich zu erledigen.

Noch erstaunlicher ist, dass Roboter mit zunehmender Größe Emergenzfähigkeiten zeigen.

In einem Experiment hat er versehentlich zwei Kleider aufgehoben. Er hat zuerst versucht, das erste Kleid zu falten, festgestellt, dass das andere im Weg war, und dann das überflüssige Kleid in den Korb zurückgelegt, bevor er mit dem Falten des in der Hand gehaltenen Kleids fortfuhr.

Wenn der Einkaufssack versehentlich umfällt, richtet er ihn auch "von selbst" wieder auf. Diese Details waren nicht in den Trainingsdaten enthalten, sondern treten in der realen Arbeit natürlich auf.

Ähnliche Phänomene sind auch im Vocal Sandbox-Projekt von Stanford aufgetreten.

Die Forscher haben festgestellt, dass Roboter in der Aufgabe des Packens von Geschenksäcken niedere Aktionen wie "Spielzeugwagen aufheben", "zum Geschenksack bewegen" und "ablegen" zusammenfügen können, um eine neue zusammengesetzte Aufgabe zu erledigen.

Dies zeigt, dass wenn Vision, Sprache und Aktion wirklich zusammenarbeiten, können Roboter ihre vorhandenen Fähigkeiten wie Lego zusammenfügen, um komplexe Situationen zu bewältigen.

Das ist die Bedeutung des VLA: Es ist nicht nur eine Architektur, sondern auch ein Weg zu "Eingebetteter Intelligenz".

Roboter sind daher nicht mehr nur Roboterarme, sondern "lernende Helfer", die allmählich Erfahrungen sammeln und lernen, sich anzupassen.

Von der Haushaltsarbeit zur Industrie: Expansion und wirtschaftliche Auswirkungen

Der Haushalt ist nur der Anfang. Als nächstes folgen Szenarien wie Lagerhäuser, Fabriken und Datenzentren.

Levine hat in einem Podcast eine Logik erwähnt:

Wenn man einen guten Kaffee machen kann, kann man sich einem Café eröffnen nähern.

Dies ist nicht nur eine Metapher, sondern sein Weg zur Kapazitätserweiterung: Zuerst kann man eine bestimmte reale Aufgabe zufriedenstellend erledigen. Danach werden die Schritte immer mehr und komplexer, und die Implementierung wird immer größer.

Der wirtschaftliche Weg ist auch klar. Roboter "arbeiten zuerst zusammen mit Menschen" und ersetzen die Menschen in repetitiven körperlichen Arbeiten und routinemäßigen Operationen. So können die Menschen mehr Energie auf Notfallentscheidungen und kreative Aufgaben verwenden.

In den letzten 30 Jahren hat sich die Kosten von Robotern um mehr als 50% verringert.

McKinsey hat in seinem Bericht "Automatisierung und das Personalproblem der amerikanischen Fertigungsindustrie" festgestellt, dass routinemäßige und repetitive Aktivitäten am leichtesten automatisiert werden können. Sobald diese Schritte durch Automatisierung ersetzt werden, steigen die Effizienz und die Ausbeute in der Regel deutlich an.

Mehrere Branchen werden umgestaltet, und Roboter treten in Bereiche wie "Herstellung / Lagerung / Montage" ein.

Die Hardwarekosten sinken, und die Algorithmen werden immer genauer.

Früher konnte ein Forschungsroboter sehr teuer sein. Aber wenn die Hardware in Massenproduktion hergestellt wird, die Materialien und Komponenten standardisiert werden und dann mit den Algorithmen des Visuelle-Sprache-Aktions-Modells kombiniert werden, sinken die "Nutzbarkeit" Kosten der Roboter.

Die Senkung der Schwelle für Haushaltsanwendungen ermöglicht es auch mehr Start-up-Teams oder kleinen und mittleren Unternehmen, an der Implementierung teilzunehmen und so einen Skaleneffekt zu erzielen.

Wenn diese Faktoren zusammenkommen, werden die wirtschaftlichen Auswirkungen signifikant sein.

Einerseits wird dies die Unternehmenskosten und die Produktivität senken; andererseits wird es den Arbeitsmarkt, die Wertschöpfungskette und sogar die Gesellschaftsstruktur neu gestalten.

Berufe wie Lagerhaltung, Verpackung und Geräteüberprüfung, die ursprünglich eine große Anzahl von Menschen benötigten, sind am wahrscheinlichsten die ersten Szenarien, die von Robotern weitgehend ersetzt werden.

Wenn Roboter wirklich in Haushalte, Fabriken und Baustellen kommen, müssen wir uns nicht nur mit einer Effizienzsteigerung befassen, sondern auch mit einer tiefgreifenden Anpassung der Gesellschaftsstruktur.

Kurzfristig wird das Partnerschaftsmodell zwischen Menschen und Maschinen enorme Vorteile bringen; langfristig könnte die vollständige Automatisierung das Muster der Arbeit, der Bildung und der Vermögensverteilung neu gestalten.

Wie Sergey Levine sagte,

Wichtig ist nicht das Ziel eines bestimmten Jahres, sondern wann der Fliehkraftregler beginnt zu drehen.

Wenn er einmal losgeht, wird die Geschwindigkeit weit über unsere Intuition hinausgehen.

Die nächsten fünf Jahre könnten das Fenster sein, das das Muster der nächsten Jahrzehnte bestimmt.

Referenzen:

https://www.dwarkesh.com/p/sergey-levine

Dieser Artikel stammt aus dem WeChat-Account "New Intelligence Yuan", Autor: Qingqing. 36Kr hat die Veröffentlichung mit Genehmigung erhalten.