首页文章详情

李彦宏:便宜已经不是DeepSeek的优势了

阿菜cabbage2025-04-25 21:27
MCP、Agent、新模型,李彦宏在大会上把热点讲了一遍。

文|周鑫雨

编辑|苏建勋

如今,模型的发展已经成了应用开发者的一把双刃剑。一方面,模型能力的增强,给场景落地带来更多的可能;另一方面,应用的能力,也随时可能被模型能力本身淘汰。

什么样的应用不会过时?

2025年4月25日,百度Create大会上,百度集团创始人、董事长兼CEO李彦宏的答案是:“你只要找对场景,选对基础模型,有时候可能还要学一点调模型的方法,那么在这个基础上做出来的应用,它是不会过时的,应用才是真正创造价值的。”

在应用层,李彦宏认为2025年以来最令人激动的突破性的应用,是数字人和Agent。

卖数字人,是百度布局电商业务的重要一环。在会上,李彦宏发布了最新的数字人能力:高说服力数字人。除了更加拟人,“高说服力数字人”的特点,是可以感知直播间环境,并智能做出发红包、换品等决策。

百度在应用层的另一个布局重点,是Agent。

一年前,李彦宏曾表示,AI Coding是他最看好的应用方向。目前,百度在代码智能体领域已经做了较为完整的布局,有面向专业工程师的编程工具Comate,面向普通人的无代码编程工具“秒哒”。

而面向通用场景,前有Manus邀请码“一码难求”,百度也快马跟上,趁Manus收费之际,推出了一款移动端的Agent应用“心响”。

在模型层,DeepSeek是绕不过去的竞争对手。

“DeepSeek不是万能的。”李彦宏开门见山,“DeepSeek不支持多模态理解,有幻觉,更重要的是,慢和贵。”

对着DeepSeek的“短板”打,百度在Create发布了新模型:文心大模型4.5 Turbo和X1 Turbo,主打多模态,强推理,低成本。尤其是成本,4.5 Turbo的成本,是DeepSeek V3的40%,X1 Turbo的成本,是DeepSeek的25%。

最后,百度将自己的野心,也放到了AI应用生态的建立上。

一方面,百度搜索推出了开放平台,邀请应用开发者给予搜索生态开发AI应用;另一方面,百度对Anthropic发布的Agent协议MCP,进行了支持——这意味着,支持MCP的模型、外部工具和数据库之间,将能够畅通无阻的交互。

百度的“App版Manus”发布了

2025年3月6日发布的Agent应用Manus,又让AI Agent成为各家抢滩的应用高地。

4月22日,大会三天前,百度的首款独立Agent应用,已经上架了安卓应用商店。这款名为“心响”的App,形式可以简单理解为百度将Manus的移动端版本做了一遍。

用户只需在“心响”App中输入自己的需求,Agent就能对任务进行执行和交付。

“心响”制作绘本。来源:百度

此前,据百度智能体业务首席架构师、心响App负责人黄际洲介绍,“心响”的实现,背靠的是百度提出的Agent Use协议。此前,Anthropic提出的Agent协议MCP,针对的是工具的调用。

而“心响”采用的是对智能体的调用。根据用户的需求,“心响”的主智能体,能根据任务,调度第三方和百度自己的智能体,实现任务的执行和交付。

重建用户心智,在心响App产品经理黎宇昕看来,是百度做Agent产品时遇到的最大难点。

在媒体沟通会上,他提到,百度之前用搜索建立的用户心智,是及时交付。这意味着,AI应用“一定会折损效果,比如通过缓存的方式,去降模型调用的次数等等”——这也是市面上大多强调及时交付的Agent产品,无法实现高质交付的原因。

黎雨昕认为,“心响”要重新建立的,是托管心智。与Manus的任务可视面板类似,“心响”在任务执行过程中,也采用了分析流的形式,将任务执行的过程和时间,呈现给用户。

目前,心响已经支持包括200种类型的任务,覆盖了工作、学习、生活的主要场景,比如试题讲解、旅游、相亲、问诊、法律咨询。

黄际洲透露,未来,“心响”计划将支持的任务类型扩展到10万+以上。与此同时,“心响”PC端也正在研发中。

会画画的新推理模型,成本仅DeepSeek的25%

百度新发布的模型文心4.5 Turbo和X1 Turbo,相较于DeepSeek V3和R1的优势,除了整体性能的超越,主要在于多模态能力和低成本。

文心4.5 Turbo性能测评。来源:百度

文心X1 Turbo性能测评。来源:百度

其中,李彦宏强调了多模态理解的能力。他认为,多模态是未来基础模型的标配,“纯文本模型的市场会越来越小,多模态的市场会越来越大”。

文心4.5 Turbo和X1 Turbo,都对图像和视频理解进行了支持。

比如,输入一张高糊的球赛照片,文心4.5 Turbo能通过周边的广告牌、球员动作等元素,识别出这是1986年墨西哥的世界杯足球赛上,阿根廷与英格兰的决赛。

文心4.5 Turbo的图像理解能力。

除了多模态理解,两个模型也支持多模态生成。

比如,在文心X1 Turbo中输入“听说武汉有种东西叫‘蒜鸟’,请你把它画出来”,X1 Turbo就能根据联网搜索到的信息,生成蒜鸟的卡通形象。

至于价格,文心4.5Turbo价格仅为文心4.5的20%、DeepSeek V3的40%,每百万token的输入价格为0.8元,输出价格3.2元;X1 Turbo的价格仅为DeepSeek-R1的25%,每百万token输入价格1元,输出价格4元。

百度电商,做上游“卖水人”

AI重燃了百度对电商信心。

自2023年5月在百度App上线“百度优选”入口以来,百度对电商的定位,不是和淘宝、京东这些规模化的货架电商竞争。

百度副总裁、百度电商总经理平晓黎表示,百度电商有两个定位,一方面,是构成百度App服务的一环,满足搜索用户的消费需求;另一方面,是用智能工具服务,成为电商的上游“卖水人”。

数字人,就是百度电商卖的水。此次百度发布的“高说服力数字人”,除了在拟人、成本、风格等层面有所优化,最重要的是能够对直播间环境进行感知,并作出实时的互动,避免了传统数字人循环播放的尴尬局面。

比如,比如满50万人观看,就给观众发红包;根据直播间用户的问题,灵活调度PPT、切换素材。

“高说服力数字人”。来源:百度

实时互动背后的技术,是多智能体调度能力。据平晓黎介绍,高说服力数字人背后,有主播专家、运营专家、场控专家等多个角色智能体,能够根据直播间实时热度和转化情况,灵活调度。

AI月活超9700万的文库,想打模型组合拳

整合了百度网盘的文库,交出了半年答卷:付费用户数超4000万,月活超9700万。

在百度内部,百度文库是模型能力应用的尖子生。此前,百度副总裁、百度文库兼百度网盘负责人王颖告诉《智能涌现》,文库是最早自研MoE(混合专家模型)架构的AI应用。

当下,采用多模型组合的底座,已经成为AI应用的基操。李彦宏认为,应用对模型的组合使用,是普遍的现象,但如何组合、如何调用,仍然是一门技术活。

为此,百度文库和网盘推出了一个技术底座:沧舟OS。

沧舟OS。

为了实现不同模型对不同内容的理解和生成,这个底座,主要分成两层:

第一层,Chatfile Plus。其能够对不同模态、不同形态、不同格式的内容进行“向量化处理”,也就是将不同内容翻译成大模型能看得懂的向量化Token,在进行混合生成。

第二层,三库+三器,也就是“公域知识库、私域知识库,记忆库”,以及“编辑器、阅读器和播放器”。这一套系统,可以根据用户的需求,被大模型来组合调用。

基于这一套OS,百度网盘发布了新功能,AI笔记。

在百度文库看来,用户学习的一个痛点,是笔记内容与原始学习资料之间缺乏关联。比如用户根据笔记复习时,需要再花一番功夫,去寻找文本、视频、图片等资料。

AI笔记的核心功能,是时间溯源和多模态整理。比如,根据百度网盘中保存的视频讲解,AI笔记可以基于对内容的理解,梳理整个视频的逻辑结构和行文顺序,并生成思维导图。

导图中,每个知识点带的时间戳,都直接溯源到视频的相应节点。

百度网盘的“AI笔记”功能。

MCP,百度也接上了“AI万能插座”

MCP,是美国模型厂商Anthropic推出的Agent协议。

就像秦统一了货币,协议的作用,就是统一了软件之间的开发标准。支持MCP协议的软件之间,也可以更为灵活的适配、相互调用。比如,不少金融公司采用MCP,让AI更好地理解金融数据的上下文。

支持MCP,也成了厂商吸引更多第三方应用入驻、建立AI生态的一场“暗战”。比如,阿里云的AI开发平台“百炼”上线了MCP服务,腾讯云也宣布大模型知识引擎支持MCP协议。

在李彦宏看来,MCP就像给AI装上了一个万能插座,能够提高不同AI软件适配、开发、整合维护的效率。对于需要自由调用工具的Agent而言,MCP的出现尤为重要,这意味着Agent可以自由调用支持MCP的第三方工具。

目前,百度智能云大模型平台“千帆”兼容了MCP,百度搜索也构建了MCP Server的索引平台,文心快码、百度电商、地图、网盘、文库等应用,也通过MCP Server的形式,对外提供了能力。

欢迎交流!