从吴恩达的信号看Agent:中国AI的机会在执行权,不在模型
判断:当AI从回答问题走向替人干活,真正的商业化难点不再只是模型选择,而是企业敢不敢把一部分业务动作交给它。
吴恩达在其著作中曾指出一个关键:改进AI系统,与其频繁更换模型,不如先搞清楚系统何时出错、为何出错、以及该从哪里改起。这个思路,过去指导着图像识别与搜索排序的优化。
如今,当我们谈论智能体时,这条逻辑的内涵变了:当AI的任务从“回答问题”变成“替人干活”,衡量标准也就从模型得分,变成了企业敢不敢让它干、干了之后出了问题谁来负责。
这才是当前Agent热潮背后,中国AI创业者最该看清的本质。
界面之下,是新的执行权
过去几十年,企业软件的逻辑始终是“人操作系统”。无论CRM、财务系统还是代码库,软件只管记录、规范和沉淀,而做判断、点确认、担责任的,始终是人。
Agent带来的深层变革在于,软件正试图从“记下你干了什么”转向“替你干一部分”。这远非把按钮换成对话框那么简单,其核心是一种权力的让渡——我们称之为执行权。
它意味着系统开始接手、推进甚至完成那些原本必须由人点击的业务动作:新建一条客户记录、发起一笔付款审批、发送一封外部邮件、提交一行代码修改。一旦动作跨过“建议”的红线,进入“执行”的领域,那么决定成败的就不再是模型的好坏,而是公司里那套“谁有权、谁审批、谁承担后果”的规矩。
吴恩达最近关于智能体工作流、上下文中心和编程智能体的讨论,信号意义就在于此。竞争的焦点,正在从“谁的话说得漂亮”悄悄转向“谁能把事拆开、调用工具、检查结果、迭代到完成,并且整个过程能被追查、能被验收、出了问题能找到人”。
单个任务做得好不好,是模型的事;能不能把一个流程里的具体步骤走完,是业务的事。前者回答“能不能干”,后者要回答“干完了,公司敢不敢认这笔账”。
执行权,公司不会轻易给
企业中任何一个微小操作的背后,都嵌套着一套规矩:这件事谁有权限、依据是什么、要谁批准、操作留没留痕、最后谁担责任。这是公司运转的底层逻辑。
很多Agent产品就卡在这里。它们能出方案,但推不动流程;能总结信息,但调不动系统;能写代码,但看不懂公司内部那套东西;能答制度题,但不知道制度是不是已经改了;能给建议,但出了事责任不沾边。
瓶颈往往不是模型不够聪明,而是Agent根本不知道企业内部流程如何运行。它不知道哪个内部接口已经变了,不清楚哪个数据字段不能碰,不晓得走到哪一步需要领导点头,不明白这条客户信息能不能发出去,更不懂出错后如何回滚、补救和追责。
吴恩达以编程智能体为例,指出它们会因为拿不到最新、最准的API文档而“瞎猜”、乱调用。对于要在企业里干活的Agent,这问题更致命:它面对的是各个部门自己的系统、复杂的审批规矩、历史遗留的数据和一大堆内部规定。对干活的智能体来说,准确的信息不是参考材料,而是它动手的“施工图”。没有这张图,执行权就无从谈起。
能批预算的,是“控制层”不是聊天框
这指向一个更基础、可能也更不“炫”的机会:打造企业内部的控制层。把散落在各处的知识库、规章制度、操作手册、API文档、权限体系和业务系统全都打通、管起来,让它成为Agent动手前必须看懂、并且绝对不准越界的行动指南。
过去的知识库解决“让人能查到”,而Agent时代的控制层要解决“让AI能基于对的信息干活,并且事后能说清楚自己凭什么这么干、用了什么、有没有越界”。
上下文层解决“知道该怎么做”,控制层解决“被允许做到哪里”。公司不会轻易把一个很会聊天的东西放进核心流程,却可能为一个能管住上下文、权限、接口和操作记录的系统付钱。这种能力可能不好讲故事,但更容易让客户批预算、走付款流程。
前台的Agent或许很酷,但帮助Agent在公司里安全、合规跑起来的“连接-管控-审计”链条,可能更早产生真实的收入。
流程的本质,是责任链不是对话流
Agent要产生价值,必须能接入ERP、CRM、OA、财务、供应链这些实在的系统。这条路听起来不性感,却比再造一个聊天入口更可能让客户掏钱。
一个销售Agent,如果只能生成话术,价值有限;如果能读取CRM里的客户阶段、自动调报价系统、生成待办任务并写回系统,才算跑通销售流程。
一个财务Agent,如果只能解释制度,价值有限;如果能自动核对发票和合同、发现异常自动预警、推起审批流并留下审计痕迹,才算跑通财务流程。
一个客服Agent,如果只能回答问题,那只是替代了知识库;如果能自动判断问题、查订单、看权限、创建或流转工单,才算跑通客服流程。
它的价值不来自于“有多像人”,而在于能否成为公司里一个靠谱的环节。“靠谱”意味着:知道什么事能干什么事不能干、操作都留了记录、出了岔子能倒查、能撤回。
所以,早期真正能卖出钱的Agent,很可能出自特别具体的业务环节:外贸业务员的客户跟进闭环、连锁店的线上客诉处理、工厂的设备预警派单、金融机构的内部合规查询、研发团队的内部代码助手。它们没有“通用智能”的宏大故事,但更可能收到钱,更重要的是——更容易被重复地卖给同类客户。
做细分不是把市场做小,而是为了先算清楚账:到底服务谁、具体干什么活、干一次的成本是多少。只有当一家公司能在同一个场景下连续拿下十个客户,且每个客户的实施成本越来越低,规模化才算看到曙光。如果每个客户都得从头定制、重新对接系统、重新定义怎么才算验收合格,那生意就太重了。
编程智能体的未来:不止于写代码
吴恩达说过,编程智能体对不同开发任务的提速效果天差地别。在中国,这一点更明显,因为大量有价值的东西都藏在公司私有的代码库、内部祖传的组件、过时的文档、陈年Bug和没人敢动的老系统里,不在公开的GitHub上。
所以,中国编程智能体的机会,远不止“帮程序员写代码”,而在于钻进企业研发的实际流程里:能看懂内部代码和依赖,能结合历史工单看问题,能辅助写测试,能留下谁改了啥的记录,并且确保敏感代码绝不外泄。
一个只会写代码的智能体,客户未必愿意买单;而一个能减少重复劳动、降低测试工作量、帮团队理顺陈年老代码、并且保证一切在安全范围内运行的智能体,才更可能进入采购清单。两者的区别,还是那四个字:接入业务。
AgentOps不是运维,而是执行控制
当Agent真的开始替人操作,客户马上就会问:它干了啥?为啥这么干?调了哪个工具?有没有乱来?搞错了能不能回退?操作留痕了吗?谁让它干的?结果给谁了?
这些问题表面是运维问题,实质是控制权问题。传统运维是保障系统不挂,而针对Agent的运维是保障它不越权、不失控。它不是个附加功能,而是Agent能上线干活的前提条件。
在金融、政务、医疗这些地方,没有严格的权限控制、操作日志、审计追踪和回退机制的Agent,永远只能做演示。只有那些能被全程盯着、能被管着、出了事能立刻拉闸的Agent,才有可能真的用起来。
从产品到公司:商业化的那道坎
Agent这股热闹过去之后,投资人看项目就不会只看“有没有Agent”了。他们会问更实际的问题:它用在公司哪个具体环节?谁拍板付钱?效果怎么衡量?真能省人吗?是项目制、年费还是按用量收费?用出了问题谁负责?
对一家做Agent的创业公司来说,最值钱的可能不是模型,而是对某个行业业务流程的深刻理解、和各路系统打交道的经验、成熟的权限与审计方案,或是搞定某类任务验收的独家方法。它的增长飞轮在于:客户用得越多,沉淀的行业流程、工具连接和知识是否就越多;它的增长杠杆在于:做第二家、第三家同类客户的成本是不是越来越低。
更现实的路径,往往是从一个很小但很扎实的业务点切进去:客户画像清晰、要干的活明确、结果好坏可衡量、交付成本能控住。先在一个流程里证明客户愿意付钱、项目能赚钱,再把其中能复用的部分变成标准产品。
到了这一步,资本的作用才清晰起来:它不是用来验证需求有没有,也不是给一个个定制项目填坑的,而是帮助已经被验证的能力,更快地复制到更多客户、更多场景里去。
钱能放大能力,但给不了你能力。
能不能进入客户的业务流程,决定了客户会不会批预算。能不能让客户从“试试看”变成“离不开”,则决定了一款Agent产品能否长成一家真正的Agent公司。
作者
闫峻,SCMP Opinion 撰稿人,前快的/滴滴政府事务与政企合作负责人,科技创业者。曾创办并运营获多轮融资的科技公司,长期关注AI、机器人与硬科技项目进入真实产业系统后的资本判断、收入质量、市场准入、项目交付与估值逻辑。