StartseiteArtikel

Ehemalige technische Fachkräfte von Huawei, OPPO und Tencent haben für ausländische Kinder ein AI-"Kleines Haus" entwickelt, das Geschichten erzählen kann | Exklusives Interview von 36Kr

张子怡Leslie2026-02-05 10:00
Die Wichtigkeit von Inhalten für AI-Spielzeuge.

Autor | Zhang Ziyi

Redakteur | Yuan Silai

„Papa, ich möchte McDonald's essen. Mein Mund ist wie ein Wohnzimmer für Pommes frites...“

Nachdem Ma Xiucheng seinen Kindern seine eigene Produkte für eine Zeit lang ausprobiert hatte, war er überrascht, zu hören, dass die Kinder in ihrem Alltag einige außergewöhnliche Metaphern benutzten. Dies wurde einer der positivsten Rückmeldungen, die sie erhielten.

Im mittleren Alter verließen Ma Xiucheng und sein späterer Geschäftspartner Pan Xuan die Mobiltelebranche, in der sie jahrzehntelang gearbeitet hatten. Zu diesem Zeitpunkt änderte sich ihre Rolle, und beide wurden „Väter“.

Während des Lernens, wie man ein guter „Vater“ ist, fanden sie die Inspiration für ihr Startup - ein AI-Spielzeug für Kinder zu entwickeln. Als Eltern hatten sie sehr klare Anforderungen: Es sollte keinen Bildschirm haben, Kindern Geschichten erzählen können und ihre Vorstellungskraft anregen.

Im Gegensatz zu den derzeit beliebten Puppenformen von AI-Spielzeugen sieht Talenpal, das Spielzeug, etwas „abstrakt“ aus. Sein Äußeres gleicht einem kleinen Haus und verfügt über einen kleinen Bildschirm, der für einfache Text- und Bildhinweise dient.

Beim Kauf von Talenpal erhält der Kunde eine Reihe von Puppen geschenkt. Jede Puppe hat ein unterschiedliches IP-Image und ist mit bestimmten Geschichten, Musik oder Lernaktivitäten vorinstalliert: Zum Beispiel hat die Giraffe Gigi Schlafstunden-Heilungsinhalte, der kleine Leopard Jett Inhalte zur Erkundung von Natur und Leben, der kleine Fuchs Nora herzliche Freundschaftsgeschichten, das kleine Flusspferd Pipa Geschichten zum emotionalen Wachstum, der kleine Bär Tubby Geschichten zur Förderung von guten Alltagsgewohnheiten...

Wenn ein Kind eine Puppe auf die Etage von Talenpal legt, kann es die Geschichte abspielen. Drückt man auf den Schornstein, kann das Kind die Unterhaltung mit der KI starten.

Der Markt für AI-Spielzeuge ist in den letzten zwei Jahren ein sehr beliebter Bereich. Laut Daten der Marktforschungsfirma Market Research Future hat das weltweite Marktvolumen für AI-Spielzeuge 2024 die Marke von 11 Milliarden US-Dollar überschritten und wird voraussichtlich 2030 auf 58 Milliarden US-Dollar steigen, was einer durchschnittlichen jährlichen Wachstumsrate von über 20 % entspricht.

Während sich die Startup-Unternehmen im Kampf befinden, beginnen auch die großen Konzerne, in den Markt einzusteigen. Huawei hat auf seiner Mate 80-Pressemitteilung das AI-Spielzeug „Intelligenter Narr“ für emotionale Begleitgespräche vorgestellt, und in der ersten Vorverkaufswoche wurden 100.000 Exemplare verkauft.

Talenpal hat seine Stärken auf dem ausländischen Markt. Sie konzentrieren sich hauptsächlich auf den US-Markt, wo es hohe Anforderungen an die Gesetzeskonformität, Datensicherheit und die Kombination von Hardware und Software gibt.

Am wichtigsten ist, dass die IP-Geschichten von Talenpal aus ausländischen Bilderbuchrechten stammen und in Zusammenarbeit mit einem inländischen Inhaltsteam weiterentwickelt werden. Dies sind die exklusiven IP-Assets des Unternehmens. „Diese Fähigkeiten können inländische Unternehmen entwickeln, aber es kostet Zeit.“ sagte Ma Xiucheng gegenüber Yingke.

Wir sprachen mit Ma Xiucheng von Talenpal über Kinder, AI-Spielzeuge, AI-Sicherheit und seine Beobachtungen der Branche.

01 Das bildschirmfreie AI-Spielzeug kann die Vorstellungskraft der Kinder anregen

Yingke: Können Sie uns etwas über den Hintergrund Ihres Teams erzählen?

Ma Xiucheng: Ich habe früher im Verbrauchergeschäft von Huawei gearbeitet und war hauptsächlich für die Entwicklung von Huawei-Mobiltelefonprodukten verantwortlich. Ich habe auch für das globale ausländische Mobilfunkbetreibergeschäft von OPPO verantwortet und drei Jahre in Europa gearbeitet.

Der andere Kerngründer war früher VP bei Goertek und verantwortete die Entwicklung von Apple-Audio-Produkten. Er war auch bei Bluetti Power für die Entwicklung von innovativem Produkten zuständig.

Beide Kerngründer haben die Entwicklung von Huawei- und Apple-Produkten geleitet. Das restliche Kernteam besteht aus Mitgliedern von Tencent, Coolpad, Amazon, Indare Design und anderen Unternehmen. Wir sind ein Team mit vielfältigem Hintergrund und verfügen über Fähigkeiten in den Bereichen Konsumelektronik, Inhaltserstellung und Auslandseinführung.

Yingke: Wann haben Sie ungefähr angefangen, an diesem Produkt zu denken?

Ma Xiucheng: Ich bin der Vater von zwei kleinen Jungen, Zwillingen im Alter von vier Jahren. Die Form dieses Produkts stammt also aus dem täglichen Leben und der Einsicht in die Bedürfnisse der Benutzer. Im Allgemeinen ist das Alter zwischen drei und sechs Jahren in der Montessori-Pädagogik die Empfindlichkeitsphase für die Vorstellungskraft. Wenn Kinder im Alter von drei bis sechs Jahren in Medien mit Bildschirm versunken sind, ist dies für die Entwicklung ihrer Vorstellungskraft nachteilig. Deshalb wollten wir zunächst ein bildschirmfreies Produkt entwickeln.

Kinder, die nach 2020 geboren wurden, können als die AI-native Generation bezeichnet werden. Diese Generation von Kindern sollte ihre eigenen Spielzeuge haben. Ich habe festgestellt, dass meine Kinder stark an Gesprächen mit Doubao interessiert sind. Deshalb dachte ich darüber nach, wie man diese bildschirmfreie Produktform mit KI kombinieren kann. Dies sollte ein äußerst innovatives Produkt sein. Auf der Grundlage dieses Konzepts wurden umfangreiche Nutzerstudien durchgeführt. Um die Vorstellungskraft der Kinder zu entwickeln und ihre Kreativität anzuzünden, sind drei Elemente unerlässlich: Symbolische Reize (z. B. vielfältige Puppenformen), ein Erzählrahmen (klare Geschichten) und interaktive Reaktionen (sofortige Rückmeldung auf Phantasien). Deshalb muss bei der Produktdefinition eine Kombination aus hochwertigen Kinderinhalten, kindlichen Puppen-IP-Images und einer freundlichen KI-Interaktion erfolgen. Die Entwicklung des ersten Produkts dauerte fast ein Jahr.

Yingke: Bildschirme sind für Kinder sehr schädlich, aber es ist schwer, Bildschirme bei modernen Smartprodukten zu vermeiden. In welchem Stadium haben Sie beschlossen, ein bildschirmfreies AI-Spielzeug zu entwickeln?

Ma Xiucheng: Wir haben die Kinderentwicklungspsychologie studiert, insbesondere die Präoperationalstufe zwischen drei und sechs Jahren, die von Piaget vorgeschlagen wurde. Dies ist die Phase, in der die Sprache und die Vorstellungskraft der Kinder am stärksten sind. Ein konkretes „Bildschirm“ kann es ihnen leicht machen, süchtig zu werden und ihre Vorstellungskraft zu verlieren, und es ist auch schlecht für die Augen.

Wir sind der Meinung, dass die Form eines Geschichtenapparats für Kinder vor sieben Jahren besser geeignet ist, damit sie durch das Hören von Geschichten fantasieren können. Der bildschirmfreie Modus kann die Vorstellungskraft der Kinder maximal anregen. Ich habe festgestellt, dass mein Sohn die Inhalte unseres Produkts in seinem Alltag wirklich anwendet.

Ich möchte zwei sehr anschauliche Beispiele geben. Eines Tages sagte er zu mir: „Papa, ich möchte McDonald's essen.“ Und er sagte: „Mein Mund ist wie ein Wohnzimmer für Pommes frites.“ An einem anderen Tag war es regnerisch, und wir fuhren Fische kaufen. Er sagte: „Wenn ich die kleinen Fische esse, ist mein Bauch wie ein Regenschirm für die kleinen Fische.“

Yingke: Das klingt sehr interessant. Wie lange benutzt Ihr Sohn bereits dieses Spielzeug? Wie spielt er damit, und wie haben Sie festgestellt, dass seine Vorstellungskraft dadurch reichhaltiger und interessanter geworden ist?

Ma Xiucheng: Nachdem das Produkt-Demo fertig war, habe ich es meinen Kindern gegeben. Ich habe auch die Unterschiede bei der Nutzung im Vergleich zu anderen Produkten genau verglichen. Herkömmliche Produkte werden normalerweise nur gehört, und es ist schwer, die Kinder zum Sprechen zu bringen. Natürlich möchten die Eltern, dass ihre Kinder sich mehr äußern. Ich habe auch einige AI-Spielzeuge für Gespräche für meine Kinder gekauft, aber aufgrund des Fehlens von voreingestellten Geschichten war es für die Kinder auch schwer, gute Fragen zu stellen.

Ich habe beobachtet, wie mein Sohn unser Produkt benutzt. Zunächst hört er die Geschichten, und während des Hörens entwickelt er seinen Phantasieraum. Er stellt einige gute Fragen, die sich auf den Inhalt der Geschichte beziehen, und dann kann die KI dem Kind interessantere Antworten geben, um seine Vorstellungskraft weiter zu entfalten.

Dies ist die positive Rückmeldung, die ich in meinem täglichen Leben beobachtet habe. Als Vater von zwei kleinen Jungen bin ich sehr aufgeregt. Bei der Produktgestaltung haben wir die Form eines kleinen Hauses gewählt, die ebenfalls aus dem Alltag stammt und den Kindern vertraut vorkommen wird.

Zusätzlich werden kindliche Puppen-Images angeboten. Wenn man jede Puppe drauflegt, kann die Geschichtenerzählung starten. Jede unserer Puppen hat eine andere Weltanschauung, die den Bedürfnissen des Kindeswuchses entspricht. Diese Puppen-Images, die Geschichteinhalte und die KI-Interaktion sind miteinander verknüpft, und wir haben die Einheit von IP + Inhalt + KI erreicht.

Yingke: Können außer dem kleinen Haus und Ihren Puppen auch andere Spielzeuge Geschichten erzählen?

Ma Xiucheng: Nein, das wird nicht unterstützt. In unserem Ökosystem werden alle Geschichten selbst produziert, und sie werden automatisch erkannt, wenn man sie drauflegt. Wenn man andere Produkte kauft und drauflegt, gibt es keine Geschichten dahinter.

Yingke: Sie haben viele bekannte Bilder. Wie haben Sie das Problem der IP-Konzepte und des Urheberrechtsschutzes gelöst?

Ma Xiucheng: Die meisten dieser Bilder wurden von uns selbst entworfen, oder wir haben gemeinfreie IPs wie die Märchen von Grimm verwendet.

Yingke: Da die Hardware auf der Nutzungssituation der Kinder basiert, warum haben Sie sich entschlossen, viel Energie in die Inhaltserstellung zu investieren und das AI-Spielzeug auf jüngere Kinder auszurichten? Was war der Anlass dafür?

Ma Xiucheng: Wir haben eine globale Nutzerumfrage durchgeführt und festgestellt, dass Geschichten für Kinder ein starker Bedarf sind. Die Bedürfnisse der Kinder sind überall ähnlich, aber es gibt große Probleme bei der Geschichtenerzählung. Wir haben festgestellt, dass Familien normalerweise eine große Anzahl von systematischen Bilderbuchressourcen haben, die die Bedürfnisse der Kinder in verschiedenen Stadien systematisch befriedigen können, wie z. B. die Emotionserkennung im Alter von drei Jahren und die Sozialisierung im Alter von vier Jahren. Allerdings haben Kinder in diesem Alter Schwierigkeiten beim Lesen und benötigen die Hilfe der Erwachsenen. Die meisten ähnlichen Spielzeuge in Nordamerika sind entweder einfache AI-Gespräche oder unterhaltsame Geschichten und fehlen an Systematik.

Unser Kernunterschied liegt darin, dass wir von einem wissenschaftlichen Inhaltsystem ausgehen. Wir haben für jedes IP-Image (z. B. die Ente lehrt die Ausdrucksfähigkeit, der Bär lehrt die Sozialisierung) eine Weltanschauungslinie festgelegt. Die Geschichten werden von einer versteckten Linie in der Bilderbuchreihe gestützt und dann mit einem abgestimmten AI-Gesprächsmodus kombiniert. Dieses System kann Kindern systematisch helfen, Emotionen besser zu erkennen und zu sozialisieren. Dies ist eine sehr wissenschaftliche und systematische Gestaltung, und dies war unser ursprünglicher Gedanke.

Yingke: Bilderbücher können die Vorstellungskraft anregen und eine bildliche Welt aufbauen. Ihr bildschirmfreies AI-Spielzeug basiert vollständig auf Sound. Ist dies nicht eine große Herausforderung für die Konzentration der Kinder und fehlt die bildliche Gestaltungswirkung der Bilderbücher?

Ma Xiucheng: Zunächst einmal weisen viele Eltern natürlicherweise gegen Bildschirme auf. Die amerikanischen Eltern sind wie die chinesischen Eltern und möchten nicht, dass ihre Kinder im Alter von drei bis sechs Jahren in eine Welt mit Bildschirmen eintreten. Bildschirme können die Vorstellungskraft einschränken und sind eine einseitige Vermittlung von Informationen. Dies sind wir uns sehr sicher.

Wir nutzen den Effekt der „hörerischen Leerstellen“. In einem Bilderbuch ist das Bild vollständig ausgefüllt, und die Kinder nehmen es passiv auf. Im Gegensatz dazu bleiben beim Hören von Sound Leerstellen, und die Kinder müssen sich das Bild in ihrem Kopf selbst konstruieren. Dies zwingt die Kinder, ihre Vorstellungskraft aktiv einzusetzen. Gleichzeitig nutzen wir die „sofortige Interaktion“ der KI, um die Konzentration zu halten. Die Gedanken der Kinder springen schnell, und die KI kann sofort antworten. Wenn ein Kind eine Frage stellt, antwortet die KI direkt. Diese hochfrequente Interaktion macht es den Kindern möglich, auch ohne Bildschirm sitzen zu bleiben. Dies ist eine doppelte und tiefe Übung für die Konzentration und die Vorstellungskraft.

02 Ein AI-Spielzeug ohne Inhalte ist nur ein leerer Hülle

Yingke: Können Sie uns den technischen Verbindungsprozess genauer beschreiben? Wenn man das Spielzeug auf das Haus legt und auf den Knopf drückt, um ein Gespräch zu starten, wie stellen Sie sicher, dass es bei der KI-Interaktion keine Verzögerungen oder Ablenkungen gibt?

Ma Xiucheng: Unsere Server sind in den USA lokal installiert und rufen direkt amerikanische Modelle auf. Durch die Reduzierung und Verarbeitung der lokalen Wissensbasis stellen wir sicher, dass die Verzögerungen minimal sind. Wir haben viel Detailarbeit bei der Reduzierung der Wissensbasis und der Anpassung der Perspektive geleistet, um den Kindern das Gefühl zu geben, dass die KI sie wirklich versteht.

Yingke: Es gab in anderen Ländern Fälle, in denen Jugendliche durch Gespräche mit KI zu Selbstverletzung oder unangemessenen Gesprächen verleitet wurden. Wie stellen Sie sicher, dass Kinder bei den Gesprächen nicht versehentlich ungeeignete Informationen erhalten?

Ma Xiucheng: Die Eltern legen bei der Sicherheit von Produkten für Kinder viel größeren Wert, als man denkt. Wir haben mehrere Schutzschichten aufgebaut.

Die erste Schicht ist das Basis-Modell. Wir haben das am sicherstenste Basis-Großmodell für Kinder in den USA ausgewählt und es für Jugendliche freundlicher gestaltet. Die zweite Schicht ist die lokale RAG (Wissensbasis). Anders als andere Hersteller haben wir uns intensiv mit Inhalten beschäftigt und haben daher eine große Anzahl von Geschichtsinhalt-Materialien. Nach der Reduzierung und Verarbeitung können wir die lokale RAG optimieren. Die dritte Schicht ist der Agent. Jeder unserer Puppen-Agenten hat eine entsprechende unterschiedliche Weltanschauung. Dann werden von professionellen AI-Engineern Prompts erstellt, um den Agenten unserem Character anzupassen. Diese Anpassung wird auch zusammen mit amerikanischen Experten vorgenommen.

Außerdem haben wir auch eine Stimmenklonfunktion entwickelt. Dies stammt von meiner eigenen Erfahrung. Wenn die Eltern nicht anwesend sind, wie kann man mit einer Stimme, die dem Kind vertraut ist, Geschichten erzählen und ihm Sicherheit und Vertrautheit geben. Wenn die Eltern anwesend sind, ermutigen wir sie, mitzuarbeiten. Für nordamerikanische Eltern ist es auch sehr wertvoll, die Stimme der Großeltern als Weihnachtsgeschenk zu reproduzieren.

Yingke: Wie sind die Nutzerrückmeldungen nach der Produktveröffentlichung?

Ma Xiucheng: Das Produkt ist erst vor kurzem auf den Markt gekommen, aber wir haben bereits einige Nutzerrückmeldungen gesammelt.

Wir können drei Punkte zusammenfassen. Erstens hat es eine sehr hohe „Bildschirmersetzungsrate“.