从吴恩达信号洞察Agent：中国AI机会在执行权而非模型

Agent 的商业化难点，不只是模型能力，而是企业是否愿意把一部分业务执行权交给 AI。

判断：当AI从回答问题走向替人干活，真正的商业化难点不再只是模型选择，而是企业敢不敢把一部分业务动作交给它。

吴恩达在其著作中曾指出一个关键：改进AI系统，与其频繁更换模型，不如先搞清楚系统何时出错、为何出错、以及该从哪里改起。这个思路，过去指导着图像识别与搜索排序的优化。

如今，当我们谈论智能体时，这条逻辑的内涵变了：当AI的任务从“回答问题”变成“替人干活”，衡量标准也就从模型得分，变成了企业敢不敢让它干、干了之后出了问题谁来负责。

这才是当前Agent热潮背后，中国AI创业者最该看清的本质。

界面之下，是新的执行权

过去几十年，企业软件的逻辑始终是“人操作系统”。无论CRM、财务系统还是代码库，软件只管记录、规范和沉淀，而做判断、点确认、担责任的，始终是人。

Agent带来的深层变革在于，软件正试图从“记下你干了什么”转向“替你干一部分”。这远非把按钮换成对话框那么简单，其核心是一种权力的让渡——我们称之为执行权。

它意味着系统开始接手、推进甚至完成那些原本必须由人点击的业务动作：新建一条客户记录、发起一笔付款审批、发送一封外部邮件、提交一行代码修改。一旦动作跨过“建议”的红线，进入“执行”的领域，那么决定成败的就不再是模型的好坏，而是公司里那套“谁有权、谁审批、谁承担后果”的规矩。

吴恩达最近关于智能体工作流、上下文中心和编程智能体的讨论，信号意义就在于此。竞争的焦点，正在从“谁的话说得漂亮”悄悄转向“谁能把事拆开、调用工具、检查结果、迭代到完成，并且整个过程能被追查、能被验收、出了问题能找到人”。

单个任务做得好不好，是模型的事；能不能把一个流程里的具体步骤走完，是业务的事。前者回答“能不能干”，后者要回答“干完了，公司敢不敢认这笔账”。

执行权，公司不会轻易给

企业中任何一个微小操作的背后，都嵌套着一套规矩：这件事谁有权限、依据是什么、要谁批准、操作留没留痕、最后谁担责任。这是公司运转的底层逻辑。

很多Agent产品就卡在这里。它们能出方案，但推不动流程；能总结信息，但调不动系统；能写代码，但看不懂公司内部那套东西；能答制度题，但不知道制度是不是已经改了；能给建议，但出了事责任不沾边。

瓶颈往往不是模型不够聪明，而是Agent根本不知道企业内部流程如何运行。它不知道哪个内部接口已经变了，不清楚哪个数据字段不能碰，不晓得走到哪一步需要领导点头，不明白这条客户信息能不能发出去，更不懂出错后如何回滚、补救和追责。

吴恩达以编程智能体为例，指出它们会因为拿不到最新、最准的API文档而“瞎猜”、乱调用。对于要在企业里干活的Agent，这问题更致命：它面对的是各个部门自己的系统、复杂的审批规矩、历史遗留的数据和一大堆内部规定。对干活的智能体来说，准确的信息不是参考材料，而是它动手的“施工图”。没有这张图，执行权就无从谈起。

能批预算的，是“控制层”不是聊天框

这指向一个更基础、可能也更不“炫”的机会：打造企业内部的控制层。把散落在各处的知识库、规章制度、操作手册、API文档、权限体系和业务系统全都打通、管起来，让它成为Agent动手前必须看懂、并且绝对不准越界的行动指南。

过去的知识库解决“让人能查到”，而Agent时代的控制层要解决“让AI能基于对的信息干活，并且事后能说清楚自己凭什么这么干、用了什么、有没有越界”。

上下文层解决“知道该怎么做”，控制层解决“被允许做到哪里”。公司不会轻易把一个很会聊天的东西放进核心流程，却可能为一个能管住上下文、权限、接口和操作记录的系统付钱。这种能力可能不好讲故事，但更容易让客户批预算、走付款流程。

前台的Agent或许很酷，但帮助Agent在公司里安全、合规跑起来的“连接-管控-审计”链条，可能更早产生真实的收入。

流程的本质，是责任链不是对话流

Agent要产生价值，必须能接入ERP、CRM、OA、财务、供应链这些实在的系统。这条路听起来不性感，却比再造一个聊天入口更可能让客户掏钱。

一个销售Agent，如果只能生成话术，价值有限；如果能读取CRM里的客户阶段、自动调报价系统、生成待办任务并写回系统，才算跑通销售流程。

一个财务Agent，如果只能解释制度，价值有限；如果能自动核对发票和合同、发现异常自动预警、推起审批流并留下审计痕迹，才算跑通财务流程。

一个客服Agent，如果只能回答问题，那只是替代了知识库；如果能自动判断问题、查订单、看权限、创建或流转工单，才算跑通客服流程。

它的价值不来自于“有多像人”，而在于能否成为公司里一个靠谱的环节。“靠谱”意味着：知道什么事能干什么事不能干、操作都留了记录、出了岔子能倒查、能撤回。

所以，早期真正能卖出钱的Agent，很可能出自特别具体的业务环节：外贸业务员的客户跟进闭环、连锁店的线上客诉处理、工厂的设备预警派单、金融机构的内部合规查询、研发团队的内部代码助手。它们没有“通用智能”的宏大故事，但更可能收到钱，更重要的是——更容易被重复地卖给同类客户。

做细分不是把市场做小，而是为了先算清楚账：到底服务谁、具体干什么活、干一次的成本是多少。只有当一家公司能在同一个场景下连续拿下十个客户，且每个客户的实施成本越来越低，规模化才算看到曙光。如果每个客户都得从头定制、重新对接系统、重新定义怎么才算验收合格，那生意就太重了。

编程智能体的未来：不止于写代码

吴恩达说过，编程智能体对不同开发任务的提速效果天差地别。在中国，这一点更明显，因为大量有价值的东西都藏在公司私有的代码库、内部祖传的组件、过时的文档、陈年Bug和没人敢动的老系统里，不在公开的GitHub上。

所以，中国编程智能体的机会，远不止“帮程序员写代码”，而在于钻进企业研发的实际流程里：能看懂内部代码和依赖，能结合历史工单看问题，能辅助写测试，能留下谁改了啥的记录，并且确保敏感代码绝不外泄。

一个只会写代码的智能体，客户未必愿意买单；而一个能减少重复劳动、降低测试工作量、帮团队理顺陈年老代码、并且保证一切在安全范围内运行的智能体，才更可能进入采购清单。两者的区别，还是那四个字：接入业务。

AgentOps不是运维，而是执行控制

当Agent真的开始替人操作，客户马上就会问：它干了啥？为啥这么干？调了哪个工具？有没有乱来？搞错了能不能回退？操作留痕了吗？谁让它干的？结果给谁了？

这些问题表面是运维问题，实质是控制权问题。传统运维是保障系统不挂，而针对Agent的运维是保障它不越权、不失控。它不是个附加功能，而是Agent能上线干活的前提条件。

在金融、政务、医疗这些地方，没有严格的权限控制、操作日志、审计追踪和回退机制的Agent，永远只能做演示。只有那些能被全程盯着、能被管着、出了事能立刻拉闸的Agent，才有可能真的用起来。

从产品到公司：商业化的那道坎

Agent这股热闹过去之后，投资人看项目就不会只看“有没有Agent”了。他们会问更实际的问题：它用在公司哪个具体环节？谁拍板付钱？效果怎么衡量？真能省人吗？是项目制、年费还是按用量收费？用出了问题谁负责？

对一家做Agent的创业公司来说，最值钱的可能不是模型，而是对某个行业业务流程的深刻理解、和各路系统打交道的经验、成熟的权限与审计方案，或是搞定某类任务验收的独家方法。它的增长飞轮在于：客户用得越多，沉淀的行业流程、工具连接和知识是否就越多；它的增长杠杆在于：做第二家、第三家同类客户的成本是不是越来越低。

更现实的路径，往往是从一个很小但很扎实的业务点切进去：客户画像清晰、要干的活明确、结果好坏可衡量、交付成本能控住。先在一个流程里证明客户愿意付钱、项目能赚钱，再把其中能复用的部分变成标准产品。

到了这一步，资本的作用才清晰起来：它不是用来验证需求有没有，也不是给一个个定制项目填坑的，而是帮助已经被验证的能力，更快地复制到更多客户、更多场景里去。

钱能放大能力，但给不了你能力。

能不能进入客户的业务流程，决定了客户会不会批预算。能不能让客户从“试试看”变成“离不开”，则决定了一款Agent产品能否长成一家真正的Agent公司。

作者

闫峻，SCMP Opinion 撰稿人，前快的/滴滴政府事务与政企合作负责人，科技创业者。曾创办并运营获多轮融资的科技公司，长期关注AI、机器人与硬科技项目进入真实产业系统后的资本判断、收入质量、市场准入、项目交付与估值逻辑。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

从吴恩达的信号看Agent：中国AI的机会在执行权，不在模型