前华为、OPPO、腾讯的技术骨干,给外国孩子做了款会讲故事的AI“小房子”|36氪专访
作者 | 张子怡
编辑 | 袁斯来
“爸爸,我想吃麦当劳,我的嘴巴就是薯条的客厅......”
在给孩子试用自家产品一段时间后,马秀成惊讶的听到孩子将一些奇特的比喻运用在日常生活中。这成为他们收到的最正向的反馈之一。
人到中年,马秀成和后来的合伙人潘璇离开了工作过数十年的手机行业。两人的身份在这时发生变化,他们都成为了“父亲”。
在学习如何做“父亲”的过程中,他们找到了创业灵感——做一款针对孩子的AI玩具。作为家长,他们需求很明确:不能有屏幕,可以给孩子讲故事,激发孩子的想象力。
不同于时下AI玩具流行的玩偶形态,作为玩具的Talenpal长得有些“抽象”,其外观像一座小房子,带有一块微型显示屏用作简单的图文或图画提示。
购买Talenpal后,用户会获赠一套玩偶。每个玩偶有不同的IP形象,都预装了特定的故事、音乐或学习活动:如长颈鹿Gigi有睡前疗愈的内容,小猎豹Jett有自然与生命探索的相关内容,小狐狸Nora有温暖的友情故事,小河马Pipa有情商成长故事,小熊Tubby有日常习惯培养的故事……
孩子将玩偶放在talenpal的楼阁上,它便能播放故事,按下烟囱,孩子便能够启动和AI的对话。
AI玩具是近两年大热的赛道,据市场研究公司Market Research Future的数据,2024年全球AI玩具市场规模已突破110亿美元,预计2030年将达580亿美元,年均增速超20%。
创业企业混战时,大厂也开始下场。华为在其Mate80发布会上,推出情感陪聊AI玩具“智能憨憨”,预售首周卖出10万台。
Talenpal的优势在海外。他们主攻美国市场,法案合规、数据安全合规和软硬结合都有很高门槛。
最关键的是,Talenpal的IP故事是海外的绘本版权,又结合国内内容团队做再生产,是企业独家的IP资产。“这些能力(国内公司)可以做,但有时间成本。”马秀成告诉硬氪。
我们同Talenpal的马秀成聊了聊,关于孩子、AI玩具、AI安全和对行业的观察。
01 无屏AI玩具能激发孩子的想象力
硬氪:能否介绍一下团队背景?
马秀成:我曾经在华为消费者BG工作,主要是负责华为手机产品研发,也负责过OPPO全球海外运营商业务,在欧洲工作过三年。
另一位核心创始人原来在歌尔声学担任VP,负责过Apple音频类产品研发,也在正浩创新负责创新产品研发业务
两位核心创始人都管理过华为和苹果产品的研发,其他核心团队还包括来自腾讯、酷派、亚马逊、Indare设计等小伙伴,我们是一个复合背景的团队,具备消费电子,内容制作与出海能力。
硬氪:你们大概是什么时候开始想做这个产品的?
马秀成:我是两个小男孩的父亲,一对双胞胎都是4岁。所以这个产品形态,源于生活的体感和洞察,和对用户需求的敏感。一般3-6岁的小孩,在蒙氏教育里面是想象力的敏感期,3-6岁的小孩如果沉溺在有屏的媒介中,会不利于他们想象力的构建。所以我们首先想做无屏。
2020年之后出生的孩子,可以定义为AI-Native的一代,这一代的小孩应该有属于他们的玩具,我发现自己的孩子跟豆包聊天的黏性很强,所以就想如何把这种无屏形态产品和AI结合起来,这应该会是一个极具创新力的产品。从这个概念出发,进行了大量的用户研究。对于塑造孩子想象力,点燃他们的创造力,需要三个要素,缺一不可:符号刺激(比如多元化的公仔形态),叙事框架(清晰的故事)以及互动响应(对幻想的及时反馈)。所以在产品的定义上,就需要高质量的儿童内容,童趣的公仔IP形象以及友好的AI互动结合起来。第一代产品的打磨用了将近一年的时间。
硬氪:屏幕对孩子伤害很大,但现在的智能产品又很难避开屏幕。你们是在哪个阶段决定要做一款无屏AI玩具的?
马秀成:我们研究了儿童发展心理学,尤其皮亚杰提出的3-6岁潜散期。这是孩子语言、想象力最旺盛的阶段,具象的“屏”容易让他们沉迷、缺失想象力,且对眼睛不好。
我们判断,7岁前更适合故事机形态,让孩子通过听故事去想象。无屏模式能最大化激发孩子的想象力,我发现他听了我们产品的内容后,真的会应用在日常生活中。
我举两个很形象的案例。有一天他告诉我“爸爸我想吃麦当劳”,他说“我的嘴巴就是薯条的客厅”。还有一天,下雨带他买鱼回家,他说“如果把小鱼吃了的话,我的肚子就是小鱼的雨伞”。
硬氪:很有意思。您家小朋友使用这款玩具有多久了?他是怎么玩的,您又是怎么发现他的想象力因此变得更丰富、更有趣的?
马秀成:产品Demo出来之后,我就给自己的孩子使用,我也仔细对比了与其他产品的使用差异。传统形态的产品一般只是听,很难让孩子开口说话,而父母肯定是希望孩子多表达。我也给孩子买过一些AI对话玩具,但是由于没有预置好故事内容的输入,孩子也很难问出好问题。
我观察自己的孩子使用我们的产品,首先是听故事,在听故事中会展开他们的想象空间,他会问一些与故事内容结合的好问题,然后AI就可以给孩子更有趣的回答,让孩子进一步的打开想象力。
这是我实际生活中观察到的正向反馈,作为两个小男孩的父亲,还是感受很兴奋。在产品的设计上,我们是小房子造型,这种造型也是源于生活,会让孩子感到熟悉。
同时搭配有童趣的公仔形象,每个公仔放上去就能启动故事讲述。我们的每一个公仔,都有不一样的世界观设定,这些世界观都是契合孩子成长需要的。这些公仔形象,故事内容以及AI互动,都是相互耦合的,我们做到IP+内容+AI的统一。
硬氪:那除了小房子和你们的玩偶,其他玩具放上去也能讲故事吗?
马秀成:不支持的。我们的生态系统中,所有故事都是自己生产的,它放上去就会自动识别。如果你买别的产品,放上去,它背后没有故事。
硬氪:你们有很多熟悉的形象,关于IP的概念和版权保护问题,是怎么解决的?
马秀成:这些形象基本是我们自己设计的,或者选用像格林童话等公有IP。
硬氪:既然硬件是基于小朋友使用情况开发的,那为什么会想到要投入大量精力做内容,并将AI玩具定位在低龄儿童,这个契机是什么?
马秀成:我们做了全球用户的调研,故事对于儿童是强刚需,任何地方的孩子需求都类似,但怎么讲故事存在巨大的痛点。我们发现,家庭通常有大量成体系化的绘本资源,能系统性地满足孩子在不同阶段的需求,如3岁情绪认知,4岁社交。然而,这个年龄段孩子有阅读障碍,需要大人协助。北美同类玩具大多是单点的AI对话或娱乐化故事,缺乏系统性。
我们的核心差异化在于:我们从内容科学体系出发。我们给每个IP形象(如小鸭子教表达、小熊教社交)锚定一个世界观主线,故事由绘本系列暗线支撑,再结合调教后的AI对话模式。这套体系能系统地教孩子更好地认知情绪、去社交。这是一个非常科学体系化的设计,这是我们的初心。
硬氪:绘本能激发想象力和构建形象世界。你们的无屏AI玩具完全靠声音,这会不会对小朋友的专注力是很大的考验,同时缺失了绘本的形象构建作用?
马秀成:首先很多家长对屏幕是天然抗拒的。美国家长跟中国家长一样,3-6岁时不希望孩子进入有屏世界。有屏会限制想象力,属于单向灌输,这一点我们很笃定。
我们利用的是“听觉留白”效应。绘本把画面画满了,孩子是被动接受;而声音留出了空白,孩子听到描述,必须在脑海里自己构建画面。这倒逼孩子去主动调动想象力。同时,我们用AI的“即时互动”来锁住注意力。孩子的思维是跳跃的,AI能做到秒回,孩子问一句、它接一句,这种高频互动的趣味性,能让孩子在没有屏幕的情况下依然坐得住。这是对专注力和想象力的双重深度锻炼。
02 没有内容的AI玩具只是空壳
硬氪:能具体分享一下这个技术连接过程吗?玩具放上房子,按下按钮对话,你们如何确保AI互动中不会有延迟或跑题?
马秀成:我们的服务器部署在美国本地,直接调用美国模型,结合本地知识库的精简和加工,以确保更低的延迟。我们在知识库的精简和性格调优上做了大量细致的工作,只为给孩子一种“它真的懂我”的感觉。
硬氪:海外曾出现青少年与AI对话引发诱导自伤或不当对话的例子。你们如何保证小朋友在对话中不会意外触发并获取不适合的信息?
马秀成:家长对这儿童产品安全性的关注度远超大家想象。我们做了多层防护。
第一层是底层模型,我们选择了美国当地对儿童最安全的底层大模型,并做了青少年友好化的限制。第二层是本地RAG(知识库),区别于其他厂家,因为我们深耕内容,会有大量的故事内容素材,进行精简和加工后,可以优化本地RAG。第三层是智能体,我们的每个公仔智能体,都有对应的差异化世界观,再由专业的AI工程师来做prompt,让智能体贴近我们的角色,这个调试也是跟美国的专家一起做的。
此外,我们也设计了声音克隆功能,这源于我自己的经历,当父母不在场的时候,如何用孩子熟悉的声音讲故事,提供他们熟悉感和安全感。在场时,我们鼓励父母一起互动。对北美父母而言,复刻祖父母的声音作为圣诞礼物,也是非常有价值的事。
硬氪:产品发售后的用户反馈如何?
马秀成:产品才刚开始推出市场,但已经收集到一些用户反馈。
我们可以总结三点。第一,“屏幕替代率”很高。最惊喜的是我们的产品真能把孩子从iPad面前拉走,而且孩子听得进去,专注时间变长了,不是玩两下就扔那种。第二,“带娃减负”。我们的产品就像个随时待命的助手,能让家长腾出手来干点别的,实实在在减轻了带娃的压力。第三,“高频陪伴”。不少家长反馈这不再是一个玩两下就扔的玩具,孩子在真实生活中用得高频,买得很值。
硬氪:你们主要关注美国和欧美市场,但每个国家的育儿理念、IP偏好都不同。这对你们的产品本地化会带来挑战吗?
马秀成:我们产品的文化柔性很强。比如,我们在北美有独立站,中东最大的玩具厂商也主动接触我们。
中东有禁忌,像佩奇不能用,他们希望有中东化的、保留传统的祈祷、古兰经之类的故事,更偏向阿拉伯语。美国也会提西班牙语的需求,因为有很多双语或多语言家庭。北欧国家更关注社交和情绪教育。不同区域的需求确实完全不一样。
对我们来说,柔性意味着很多资源已经完备,只需要适配语言,并搭配IP形象。举例子,比如在中东,我们可以有骆驼IP,去解读本地的文化,我们的内容工业化生产能力已经完备。
硬氪:你们非常重视内容版权,去不同市场是否意味着需要采买大量不同的内容、寻找新的声优演员?整个生产链条会很长吗?
马秀成:这确实是一条很难的路,但也因此构成了护城河。很多厂商不愿意碰内容,嫌太重、太慢。但我们认为,没有好内容的AI玩具只是个空壳。
03 硬件只是物理载体
硬氪:玩偶是如何定价的?
马秀成:玩偶定价不同,10美金到15美金不等。每一个公仔背后,都是我们要花费大量时间去打磨的“灵魂”。
这款产品背后的成本投入很深,我们的定价策略反映了产品的内容价值和IP价值。我们不卖廉价的塑料,我们卖的是精心设计的角色和持续更新的互动体验。
硬氪:AI生成的孩子成长报告涉及到儿童隐私问题,你们在这方面是如何考虑的?
马秀成:我们所有的用户数据和服务器都部署在美国本地,不会采集或回传用户任何东西。我们在这方面做了很多工作,确保完全合规。我们的态度是:不做任何妥协,不留任何隐患。我们的很大一部分精力也花在了这方面。
硬氪:能否简单介绍一下美国的AI玩具市场现状和主要产品?Talenpal在这个市场中是否具备独创性?
马秀成:美国玩具市场非常大,是数百亿美金的市场。这个市场在AI时代能够再做一遍,孩子听故事、玩玩具就像衣食住行一样,是人类的本能需求。
Talenpal是率先将AI与儿童本地化内容以及出海这个事情结合起来的,在全球具备极高的独创性,开创了品类的新玩法。
硬氪:国内厂商学习能力很强,有没有担心产品很快被跟进?
马秀成:完全不担心,我们欢迎良性竞争。因为这个行业的门槛比表面看起来要高得多:第一是全球合规门槛,在高价值市场解决隐私和安全问题需要极高的专业度;第二是跨界融合能力,将硬件、AI、内容、Saas服务以及儿童心理学等领域的能力融合在同一个产品上非常难;第三是内容的持续再创造能力,这需要时间的沉淀。这些工作需要大量的时间和资源投入,不是简单抄袭一个外观,或者接入一个API接口就能复刻的。
硬氪:您认为AI玩具的局限性和天花板在哪里?会不会有对话能力不够有趣,影响复购的问题。您怎么看?
马秀成:传统玩具是“静态”的,出厂那一刻就是它的最终形态,所以容易被淘汰。但我们的产品是“生长型”的。硬件只是一个物理载体,真正的核心在内容在云端。不同玩偶上的内容能够提供匹配不同年龄段的内容。这意味着我们的LTV(用户生命周期)会比传统玩具更长,它不是一个短期的安抚工具,而是整个3-6岁童年的成长伙伴。
硬氪:除了硬件本身,你们在商业模式上是如何规划的?毕竟硬件通常是一次性消费,如何产生持续价值?
马秀成:我们不把TalenPal定义为一家纯硬件公司,我们的商业逻辑类似经典的“剃须刀与刀片”模式:主机硬件是基础平台(剃须刀),而不断推出的公仔玩偶就是“刀片”。当孩子喜欢上我们的故事宇宙,以及随着孩子年龄增长,就会渴望拥有新的角色来解锁新的冒险。这种“实体公仔+内容解锁”的模式,能带来良性复购,让我们能持续通过内容变现,而不仅仅是依赖卖机器。
硬氪:你们未来会考虑独立融资吗?
马秀成:我们已经收到一些投资意向。现阶段,我们更看重用户的真实反馈。我们要证明,这不仅仅是一个很酷的概念,更是一个能真实进入千家万户、被孩子和家长高频使用的好产品。