StartseiteArtikel

Was würde aus dem Kochen werden, wenn KI über „Augen“ und „Hände“ verfügen würde?

36氪品牌2026-03-16 19:31
Genieße einfach die Freude am kulinarischen Schaffen.

Zu Beginn des Jahres 2026 geriet die gesamte Technologiebranche wegen einer "Hummer" in Rauschzustand.

Dieser Open-Source-AI-Agenten-Frameworks namens OpenClaw hat in kurzer Zeit eine Volksbegeisterung für das "Hummer-Züchten" ausgelöst, die von Angestellten großer Internet-Unternehmen bis hin zu normalen Benutzern reicht.

Warum lässt ein Open-Source-Projekt Menschen in Schlange stehen, um es zu installieren?

Der Kerngrund liegt in einer Paradigmenwende, die die Schmerzpunkte trifft: Im Gegensatz zu den großen Modellen, die in der Vergangenheit nur in Web-Dialogfenstern mit Ihnen chatten konnten, ist OpenClaw ein typischer "ausführender Agent". Er kann die gleichen Rechte wie der Benutzer erhalten und Daten automatisch verarbeiten, den Schreibtisch aufräumen und sogar über Anwendungen hinweg praktische Anweisungen des Benutzers ausführen.

Der Ruhm der "Hummer" spiegeln die realsten Emotionen des gegenwärtigen Technologieverbrauchermarktes wider: AI, die nur chatten kann, genügt den Bedürfnissen der Benutzer nicht mehr. Wir brauchen echte Handlungshelfer, die "für uns arbeiten" können, und das ist noch nicht alles.

AI bricht aus dem Bildschirm heraus

Im Bereich der künstlichen Intelligenz gibt es das berühmte "Moravec-Paradoxon": Es ist relativ einfach, einen Computer so zu programmieren, dass er in Intelligenztests besser abschneidet als ein Erwachsener. Doch es ist extrem schwierig, ihn so zu trainieren, dass er die reale Welt wie ein einjähriges Kind wahrnimmt und körperliche Bewegungen ausführt.

Wenn man sich die gegenwärtige AI-Landschaft der intelligenten Haushaltsgeräte ansieht, merkt man, dass die meisten Unternehmen noch in den flachen Gewässern dieses Paradoxons herumirren. In der virtuellen Welt scheint AI allmächtig zu sein - es kann in wenigen Sekunden Code schreiben, eine logisch klare Geschäftsidee erstellen und Videos produzieren, die mit Hollywood-Blockbustern mithalten können. Doch wenn diese AI-Welle in das physische Leben der Menschen, insbesondere in die komplexe Küchenumgebung, eindringen will, stößt sie auf ein peinliches "Einsatzproblem".

Wenn man sich die Intelligenzentwicklung der Haushaltsgerätebranche in den letzten Jahren anschaut, wird eine holprige AI-Einsatzroute deutlich.

Zuerst gab es die primitive Intelligenz in Form von "Funktionszusammenstellungen". Die Hersteller haben einfach "Additionen" vorgenommen. Ein typisches Merkmal dieser Phase war die direkte Installation eines Sprachinteraktionsmoduls oder eines Wi-Fi-Verbindungsmoduls auf traditionellen Hardwaregeräten. Erst als die Verbraucher die Geräte nach Hause brachten, stellten sie fest, dass die sogenannte AI nur die manuellen Tasten durch Sprachbefehle ersetzte und überhaupt nicht das Wesen des Kochens verstand.

Danach trat die Branche in die Phase der "Trennung von Software und Hardware" und der passiven Unterstützung ein. Intelligente Lautsprecher oder Kühlschränke mit Bildschirmen wurden zur Fassade der Küche. Die Benutzer konnten auf dem Bildschirm unzählige Rezepte einsehen und sogar Lehrvideos anschauen. Doch es kam auch eine fatale Kluft: Die Informationsflüsse auf der Softwareebene und die physischen Aktionen auf der Hardwareebene waren völlig getrennt.

Sie sahen auf dem Bildschirm ein perfektes Rezept für süß-saueres Rippchen, aber als sie sich dann dem rohen Fleisch auf dem Hackbrett und der komplexen Feuerstärke gegenüberstanden, waren sie immer noch ratlos. Die AI existierte nur im Bildschirm, sie "sah" die Verlegenheit der Benutzer nicht und konnte keine praktischen Anweisungen an physische Geräte wie Herd und Dunstabzugshaube geben.

Diese Ohnmacht der großen Modelle in der Küchenumgebung wurde von Dr. Zhou Haixin, Vizepräsident von Robam, treffend beschrieben: "Die Küche ist der Ort mit den komplexesten Regeln in der physischen Welt: Rauch ist eine Frage der Strömungsmechanik, das Erhitzen von Lebensmitteln ist eine Frage der Thermodynamik, und das Wenden des Pfannes beinhaltet Beschleunigung und Drehmoment. Wenn die AI nur im Bildschirm chatten kann, wird sie Ihnen nie helfen können, wenn Sie in der Küche ratlos sind."

Offensichtlich muss ein großes Modell in der dritten Phase, um in der Küche wirklich Wert zu schaffen, die "physische Kluft" überwinden. Dies ist keine leichte Aufgabe. Angesichts dieser extrem unstrukturierten Umgebung muss das große Modell den Sprung von "Cloud-Rechenleistung" zu "physischer Arbeit" vollziehen und eine ganzheitliche Lösung für die gesamte AI-unterstützte Kochkette bieten, um einen vollständigen "Wahrnehmungs - Entscheidung - Handlung"-Zyklus zu erstellen.

Von "virtueller Unterhaltung" zu "physischer Verwaltung"

Der Sprung von "Funktionsbefehlen" zu "physischer Verwaltung" ist nicht etwas, das mit ein paar Codezeilen erreicht werden kann. Es ist eine tiefgreifende Umstrukturierung der Hardware. Für die gesamte Haushaltsgerätebranche hat der traditionelle Ansatz des "Zentralschirms" seine Grenzen erreicht. Um die "logistische Kluft" zu überwinden, braucht die Branche eine umfassendere Lösung für die Zusammenarbeit von Software und Hardware.

Wenn man die ganzheitliche Lösung für die AI-unterstützte Kochkette von Robam als ein Schnitt für die Branchenbeobachtung betrachtet, wird deutlich, dass der Kern des Überwindens der Kluft die Schaffung eines "unsichtbaren Kochs" mit vollständigen Handlungsfähigkeiten ist: Die AI-Kochbrille ist das empfindliche "Gesicht", das die Außenwelt wahrnimmt; der Shishen ist das "Gehirn", das tiefgründig denkt und Strategien entwickelt; und die tief integrierten AI-digitalen Küchengeräte sind die "Arme und Beine", die die schweren Arbeiten tun. Erst durch die Verbindung der untersten Protokolle kann die AI die physische Küchenumgebung wirklich vollständig übernehmen.

Zuerst wird die "Blindstelle", die in der Branche weit verbreitet ist, beseitigt, damit die Küche "erste Person"-Sensoren bekommt. Die traditionellen Küchengeräte erscheinen "dumm", weil sie die reale Küchensituation nicht "sehen" können. Robam hat die Lösung gefunden, indem es sich von der traditionellen Form der Küchengeräte entfernt und die AI-Kochbrille als Sensorantenne des großen Modells nutzt.

In der praktischen Anwendung kann die AI-Kochbrille nicht nur empfindlich per Sprache aktiviert und Fotos speichern, sondern auch die erfassten Bilder, Geräusche und andere multimodale Daten in Echtzeit an das Shishen-AI-Kochmodell senden, um eine genaue Erkennung durchzuführen. Dadurch erhält die AI die "erste Person"-Wahrnehmungskraft, die Voraussetzung dafür, dass sie die komplexen Bewegungen in der Küche wirklich versteht.

Anschließend kann die AI erst "aufmerksam" werden, wenn sie die Situation "verstanden" hat. Nach der Erkennung gibt die AI-Kochbrille nicht einfach allgemeine Internetrezepte aus, sondern sendet den Benutzern maßgeschneiderte Rezepte und gibt in Echtzeit Tipps über die beste Art der Lebensmittelverarbeitung, die genaue Menge an Gewürzen und sogar die Feuerstärkeänderung per AR-Projektion oder Sprachinteraktion in erster Person. Sie wird wirklich zum "persönlichen Intelligenzassistenten".

Zweitens muss die "Alltagswisheit" überwunden werden, um ein Supergehirn zu schaffen, das Ihre Geschmacksrichtung besser versteht als Sie selbst.

Wenn die Dividende der öffentlichen Datenbanken der allgemeinen großen Modelle allmählich erreicht, bilden die privaten Daten in vertikalen Szenarien neue Branchenbarrieren. In diesem Punkt haben die traditionellen Herstellungsriesen mit jahrzehntelanger Branchenerfahrung eine natürliche Vorteil.

Nehmen wir das Shishen-AI-Kochmodell von Robam als Beispiel. Seine Wissensbasis basiert nicht auf einförmigen Internet-Suchen, sondern auf den riesigen und realen Kochdaten, die Robam in 47 Jahren gesammelt hat. Es kann sogar auf die spezifischen Hardwarebedingungen bei jedem einzelnen Kochvorgang eingehen. Diese Entscheidungsfähigkeit auf der Grundlage echter Hardware ist eine unüberwindliche Barriere für allgemeine große Modelle.

Schließlich muss man in die "Hauptstädte" der physischen Welt eindringen, damit das große Modell wirklich "Hände und Füße" bekommt, um die Arbeit zu erledigen. Selbst die perfekteste Rechenleistung und Entscheidung ist sinnlos, wenn sie nicht in physische Arbeit umgesetzt werden kann. In dieser Kette ist die Ausführungsfähigkeit der untersten Hardware der Schlüssel zum Erfolg.

Wir können sehen, dass in der AI-digitalen Küchengeräte-Matrix, vertreten durch die Robam i1Pro, i9 und andere Sets, die untersten Algorithmen die Lüfterleistung des Dunstabzugshaubens automatisch regeln können. Selbst der schwierigste Bereich des offenen Feuerkochens ist durch die hochpräzise Temperaturerfassung in die intelligenten Verwaltungskategorie aufgenommen worden. Sogar nach dem Essen kann die Spülmaschine den Reinigungsfortschritt anhand der Echtzeit-Temperatur- und Feuchtigkeitskurven verfolgen, um den gesamten Kochvorgang perfekt abzuschließen.

Von der Erkennung der Lebensmittel über die Planung des Kochwegs bis hin zur Übernahme des offenen Feuerkochens und der Reinigung nach dem Essen hat die AI endlich in der schwierigsten physischen Küchenumgebung den gesamten Weg von "Sie beobachten das Kochen" zu "Sie helfen beim Kochen" zurückgelegt.

Die "Herstellungsstabilität" in der AI-Welle

Tatsächlich, wenn wir von einer höheren Branchenperspektive aus die Umsetzungspfade von Robam betrachten, wird deutlich, dass diese Vorgehensweise ein sehr beobachtbares Beispiel für die Überlebensregeln der realen Herstellungsindustrie in der AI-Zeit bietet.

In den letzten Jahren, in denen die AI-Technologie rasant vorangeschritten ist, standen alle Spotlights auf den Technologiegiganten und den aufstrebenden Start-ups mit großen Modellen. Die reinen Technologieunternehmen streben das Heiligtum der AGI (Allgemeine Künstliche Intelligenz) an, indem sie "Rechenleistung stapeln und Parameter optimieren".

In der traditionellen Hardwarebranche haben viele Unternehmen angesichts des technologischen Überwältigungsangriffs eine tiefe "FOMO" (Angst vor dem Verpassen) gespürt. Sie haben entweder blind allgemeine große Modelle integriert, um Marketingeffekte zu erzielen, oder sich dem Trend angeschlossen und Ressourcen in die Entwicklung von "virtuellen Assistenten" investiert, die den tatsächlichen Bedürfnissen nicht entsprechen.

Beispielsweise in der derzeit heiß umkämpften "Hunderte-Brillen-Kampf" konzentrieren sich die meisten AI-Brillen auf Übersetzung und Prompter, und bleiben auf der Ebene der "passiven Unterstützung" in Bezug auf Informationen.

In dieser lärmenden und verwirrenden Branchenumgebung beginnen einige klare Herstellungsunternehmen einen sehr unterschiedlichen "unabhängigen Kurs" zu gehen. Hinter diesem unabhängigen Kurs steckt eine wertvolle Geschäftsstabilität.

Für Unternehmen, die sich auf vertikale Bereiche spezialisiert haben, wissen sie, dass selbst die feinste Programmierung nicht die reale Feuerkraft und die physische Arbeit ersetzen kann. Daher ist die Schutzmauer der Herstellungsindustrie in der AI-Zeit nicht die Konkurrenz um die Parametergröße der untersten großen Modelle mit den Technologiegiganten, sondern die Erschließung ihrer eigenen jahrzehntelangen Branchenkenntnisse, Datenbasis und starken Hardwareausführungsfähigkeit.

"Sie können ein Hardwaregerät kopieren und ein ähnliches Modell trainieren." Dr. Zhou Haixin hat in einem Interview mit 36Kr die Essenz dieser Schutzmauer aufgedeckt: "Aber es ist schwer, unsere tiefgreifende Einsicht in das 'Kochen und Braten' in chinesischen Küchen zu kopieren, schwer, die Akkumulation hinter unseren hunderten Millionen von Kochdaten zu kopieren, und es ist unmöglich, in kurzer Zeit ein vollständiges System aufzubauen, das von der Wahrnehmungsebene über die Entscheidungsebene bis zur Ausführungsebene selbst kontrollierbar und nahtlos kooperierend ist."

Dies bedeutet, dass die Stabilität der realen Unternehmen bei der Annahme von AI nicht darin besteht, technologische Schnörkel zu schaffen, sondern die professionelle Wertschöpfung der Herstellungsindustrie durch AI zu verstärken, damit das große Modell sich an die extrem komplexe