AI耳机眼花缭乱,为何巨头都想占领你的耳朵?
今年以来,AI竞速赛进入了深水区。一方面,阿里、智谱、DeepSeek、腾讯、字节、月之暗面、小米等公司轮番出牌,新模型以周为单位更新,性能指标不断刷新。另一方面,巨头们也在加紧布局AI硬件,AI眼镜、AI手机、AI PC、机器人成重点方向,软硬齐齐乏力。
比起这些重点赛道,一个不算太起眼的AI硬件正悄悄卷得头破血流。三天前,京东“Aidol创造营”首场PK直播落幕,50多家品牌和创业团队,带着各类前沿AI硬件产品同台竞技,最终,光帆AI耳机凭借主动式AI、独立联网等能力脱颖而出,获全场爆灯。
上周三,AI硬件公司「未来智能」正式推出viaim讯飞智能体耳机,首次引入“项目”功能,将耳机的定位从单次音频工具,直接推向了拥有长期记忆的“办公AI Agent”。上月底,在第34届深圳礼品展上,sanag塞那展出的Apex AI智算耳机,更是在耳部集成了七大核心模型。
算上更早的当贝Air1、字节跳动的Ola Friend以及苹果首款AI硬件“可视耳机”的一系列研发进展,好像一夜之间AI耳机就突然就成了各家的重点赛道,叫人应接不暇。
不管是初创公司还是科技巨头似乎都在告诉我们:耳机将是你的下一台“可穿戴计算机”。那么,在新概念、新技术层出不穷的全民AI时代,扎堆上市的AI耳机,究竟是真正的生产力还是噱头?
“苹果时刻”尚未到来,赛道已然沸腾
AI耳机热闹之下,行业并非只有一条路可走。基于各自的技术积累、生态方向、和感知执行环节的不同侧重,近期密集发布的新产品已经形成三条技术路线。
光帆在京东“Aidol创造营”展出的视觉感知AI耳机,走的是多模态感知路线。在首场PK直播里,这款耳机最引人注目的,是耳挂侧搭载的双目视觉感知模组。在耳机上搭载摄像头,等于加了一双眼睛,可以实时识别周围环境、物体和场景,进行语音交互和信息提示。
想象一下,当你走进一家餐厅,它会自动推荐菜品。当你在一家商场或医院到处兜圈找不到车位时,它会主动推荐附近的空闲车位。这种多模态的尝试,试图让耳机脱离手机独立联网,成为一个具备环境感知能力且完全独立的下一代AI可穿戴终端。
「未来智能」推出的viaim讯飞智能体耳机,则着重将AI生产力融入办公场景。过去,AI会议耳机能做的大多是录音、转写、摘要、待办提取等工作,一次会议结束后,AI的任务也就结束了。但在现实中,许多人的办公场景是碎片化且有延续性的,一个项目往往涉及多次会议、多轮沟通和多份文档。
viaim首次引入的项目功能和长期记忆系统,支持将耳机录音、手机上传的外部音频以及Word、PDF等背景文档,统一放进一个特定的项目空间中。如此一来,AI不再是理解一条孤立的录音,而是能跨时间、跨载体去理解一个项目的完整上下文,并产出闭环的工作成果。从处理一次内容升级到推进一件事,这是典型的Agent化路径。
与前两者不同,sanag塞那的Apex AI智算耳机走的是多数公司都看好的消费穿戴路线。在保证耳夹式耳机健康舒适体感的前提下,疯狂堆叠AI大模型,让功能越多越好。
据官方提供的信息,Apex内置了七大核心AI模型,既包括同声传译和会议录音等实用工具,也包含了AIGC绘画和音乐生成等娱乐功能。此外,利用耳部集成的深度PPG传感器,结合AI算法,Apex可以实时分析用户的疲劳度、心率血氧并提醒坐姿。借助这位全天候贴身挂载的综合助理,Apex试图把耳机做成“全天候AI入口”。
不过,这些产品都算是开胃小菜,真正的重量级选手尚未正式出手。从前年开始,苹果一直在探索将摄像头传感器嵌入AirPods耳机的可行性。据彭博社记者最新爆料,首款AI耳机已进入设计验证测试(DVT)阶段,最快将于今年9月随iOS27和全新Siri2.0一同发布。
从目前泄露的信息来看,一旦苹果将“视觉+听觉+唇语微动”的三合一多模态方案落地,现有的AI耳机在体验上将面临极大的代际差距,很难追赶。
苹果入场后,AI耳机的定义可能会从帮你处理声音变成帮AI理解你所处的现实世界,这会倒逼行业从语音AI升级到视觉-语言-音频多模态AI。同时,摄像头很可能会成为AI耳机高端化的新分水岭。过去高端耳机靠主动降噪、无损音频、空间音频、佩戴舒适度和品牌溢价区分。未来,高端AI耳机真正较量的,很可能是摄像头模组、传感器融合、端侧AI算力、低功耗视觉处理、隐私保护和AI场景能力。
此外,跨设备的无缝协同也是苹果生态的核心优势。对于普通AI耳机厂商来说,接入一个大模型、做翻译和转写并不难,难的是把AI能力嵌入系统级体验。业内预测,随着苹果等巨头入场,接下来生态短板会把许多中小厂商踢下牌桌。
巨头为何此时集体押注AI耳机?
生成式AI爆发后,和AI相结合的轻便可穿戴设备,成为一众科技公司最为感兴趣的产品方向之一。但是,为什么做声学的音频厂、做AI的软件公司和互联网大厂,今年都迫切地将重点放在耳机这个小小设备里?
原因其实很简单,对于中小厂商而言,旧赛道已经卷无可卷,耳机行业亟需新故事。而苹果、字节跳动这样科技或者大模型巨头,则需借助AI耳机争夺人机交互的“第一入口”。
过去几年,无线耳机靠主动降噪、空间音频、通话降噪、续航完成了几轮升级,诸多功能目前已经成为百元耳机标配,市场早卷成了白菜价。硬件厂商急需一个新故事来提升产品溢价、刺激换新需求,AI无疑是当下最适合讲的热门题材。
今年,供应链和大模型的迭代也正好到了可以支撑硬件厂商需求的时候。芯片成本和功耗的瓶颈被打破后,过去只能放在云端跑的语音识别、说话人分离、关键信息抽取,可以直接在毫瓦级功耗的耳机上完成,AI耳机才真正从PPT走向了量产阶段。
科大讯飞、字节跳动等对巨头入局AI耳机这一赛道,其核心是争夺下一代人机交互的核心入口,一种比键盘、语音和触屏更接近人类意图的输入方式。大模型再强大,也需要一个“身体”,否则,技术就只能停留在App里,无法真正嵌入用户的日常生活。
目前来看,手机当然是最重要的入口,但问题是需要被拿出来。无论是唤醒语音助手还是打开App,都有一层触达成本。而耳机天然贴合人体、佩戴时间极长、语音交互场景纯粹,可能是目前所有消费电子品类中,离零打扰AI交互最近的一个。
Apple的布局则需要单独盘一盘。目前,低价版Vision Pro已经停止开发、Siri被吐槽十年回答不了基本问题、Apple Intelligence的进度比预期慢了将近一年,在新一波AI浪潮里,苹果AI软硬件实际上已经落后于硅谷巨头和一众中国公司,且短期内无望赶上。
面对这一现实,苹果选择放弃正面竞争,转向依靠硬件销售与服务生态寻求突破。AirPods的优势在这里就显现出来了,它是目前苹果除了iPhone之外渗透率最高、用户接受度最成熟的硬件,把AI视觉感知能力直接嫁接到一个已经被市场验证的入口上,试错成本远低于从零做眼镜或挂坠。
如果苹果的AI耳机真正上市,它可能会改变现在可穿戴AI市场的格局。智能眼镜不再是随身视觉Agent 的唯一答案,耳机同样是一个重要入口。这也符合Apple一贯的思维:它不一定最先发明硬件,但擅长把复杂技术变成用户能理解、开发者能调用、生态能承接的体验。
是真生产力还是营销噱头?
目前的AI耳机,在大多数日常场景里仍然是营销噱头大于实际,虽然官方宣传的功能一个比一个炫目,但还不足以真正改变用户的工作和生活。
从积极的角度来看,AI 耳机已经在办公、翻译、健康等多个领域证明了自己的价值。
传统的会议记录需要人一边听一边记,很容易遗漏重要信息,后续的语音整理工作更是枯燥低效的。AI 耳机可以同声传译、自动录音、转写、提炼要点,甚至生成待办清单,对于经常开会的职场人来说,可以明显提升工作效率。
viaim更进一步,聚焦“办公会议”,让AI助理的功能价值最大化。通过“项目”功能,用户可以将同一项目、客户、课程或研究主题下的多条录音、外部音频和文档资料集中放置在同一个空间内。这样一来,分散在不同时间和载体中的信息就可以被串联起来。
此外,健康监测也是AI耳机未来主攻的重点方向。无论是早期的体检、后来的智能手表,还是各种健康App,本质上都在要求用户主动参与,而AI耳机的优势在于佩戴更舒适,可以让健康监测变得更无感,在“AI健康+”领域有天然的优势。
不过,除了佩戴体感差异,AI耳机目前在功能性上没有和智能手表、智能手环拉开差距,同样是实时监测心率、血氧和坐姿,提醒用户注意身体健康这些基本功能。手表做不了的事我能做,而且体验更好,比如耳内心率、听力健康、声音环境和语音交互,才是AI耳机真正的竞争力。
除了这些,你得承认目前AI耳机很多功能噱头成分更大、同质化严重。比如AIGC 绘画和音乐生成功能,虽然听起来很酷,但在耳机这么小的屏幕上,很难进行精细的操作和展示,大多数用户也将刚买的时候尝个鲜。
现在几乎所有的AI 耳机都在主打会议记录、同声传译、语音助理这几个功能,缺乏真正的差异化创新。很多厂商只是在传统耳机里加了一个大模型接口,就敢自称AI 耳机,用户需要对着空气用语音描述画作,再掏出手机在App里看图,这种为了AI而AI的设计,是不折不扣的鸡肋。
从长远来看,AI耳机真正的机会,是从手机的附属品,进化为可长时间舒适佩戴的独立个人智能终端,更方便、自在地帮助用户跟踪自己的日常活动,协助人们的日常工作。如果用很大的成本,却只解决了很小的问题,空有噱头,注定走不远。
本文来自微信公众号“AI价值官”,作者:艾杰 ,36氪经授权发布。