HomeArticle

Andrew Ng's Y Combinator speech: How to avoid pitfalls in AI startups? Vague ideas = burning money, specific plans = printing money.

36氪的朋友们2025-07-11 16:55
Although the industry's attention is mostly focused on underlying technologies, the real business opportunities often lie in the application layer.

7月11日消息,在硅谷创业孵化器YC举办的创业学院活动中,吴恩达分享了他最新的洞见:执行速度比任何时候都更加关键,智能体工作流如何重塑初创公司的开发边界,以及为何具体方案总能在将创意转化为产品时战胜模糊构想。

此外,吴恩达还探讨了 AI 编程助手的兴起、产品开发瓶颈的演变,及其如何推动技术进步。同时,他强调,在这个软件加速发展的时代,人类的判断力和责任感仍然是决定未来创业成败的核心因素。

以下为吴恩达演讲核心观点:

虽然行业关注多聚焦底层技术,但真正的商业机会常在应用层。只有应用层盈利,才能反哺模型、算力与芯片的发展。同时,各层级也各有机会。

未来最具商业价值的机会,就在于将已有或新设计的工作流程转化为智能体架构。

AI技术栈正在形成新的“智能体编排层”,承接底层模型与上层应用,帮助开发者更高效地构建复杂AI应用。

领域专家直觉,胜过数据滞后:深耕领域的专家凭直觉做出的产品判断,往往比初创公司依赖数据驱动的慢速反馈更具前瞻性。

验证速度就是竞争力:构建粗糙原型、验证想法是否成立,是AI时代创业成功的关键路径,避免过早优化和资源浪费。

AI使得技术决策变灵活:过去技术选型是单向门,如今重构成本下降,许多架构决策已具可逆性,快速试错、灵活调整成为新常态。

AI开发范式转向“拼积木式构建”:通过掌握提示工程、RAG、微调等模块化技术,创业者能像拼乐高一样快速组合出应用原型,实现指数级的创新组合空间。

编程成为新型表达力:即便AI能写代码,懂编程依然重要。它不仅是技术能力,更是清晰表达需求、引导AI完成任务的关键能力。

AI危险性被夸大了:AI本身中性,关键在于人类如何使用。安全不应被神化,负责任地使用AI,才是决定其利弊的根本。

AGI存在认知误区:AGI概念被严重炒作。在可预见的未来,AI仍难以替代人类在创造力、判断力等多领域的独特能力。

开源是AI创新的护城河:开放协作是AI创新的基石,必须警惕以“安全”为名的技术垄断行为,共同维护自由开放的创新生态。

以下为吴恩达YC演讲和问答精华内容:

今天,我想与大家分享一下在AI Fund积累的创业经验。AI Fund是一家风险投资基金,我们的业务模式是每月创立一家初创公司。作为联合创始人,我们不仅需要帮助创业者编写代码、调研客户、设计功能,还要制定定价策略,这些都让我们积累了丰富的实战经验。

1

AI商业真正的风口在应用层

今天的分享将聚焦于“速度”这一主题,尤其是围绕着AI技术不断发展的背景和它所带来的新机会。

作为创业者,执行速度是预测创业成功的关键指标。我特别欣赏那些行动迅速的创业者,而新一代AI技术正在大幅提升创业效率。接下来,我将分享一些关于如何提高执行速度的最佳实践,这些方法能够帮助你们更频繁地迭代产品,进而提高创业的成功几率。

在讨论速度之前,很多人都会问:“当前创业的机会在哪里?”对于我来说,AI技术栈的结构可以分为几个层级:最底层是半导体公司,之上是超大规模云服务商(hyperscalers),再往上则是AI基础模型公司。

虽然媒体的关注点和行业炒作往往集中在这些技术层面,但从商业角度来看,真正的机会往往出现在应用层。因为只有应用层产生了足够的收益,才能进一步支持底层的基础模型、云计算和半导体技术的发展。但无论如何,各个技术层级都存在着不同的商业机会。

2

采用智能体工作流,或将决定项目成败

过去一年,AI技术发生了显著变化,其中最重要的趋势就是智能体的崛起。大约一年半前,当我开始四处演讲,试图向大家阐述智能体的潜力时,没想到这一概念在去年夏天被营销人员过度炒作,导致其核心意义被稀释。

今天,我想从技术角度,给大家分享为什么智能体如此令人兴奋且重要,并且它为创业者提供了大量的新机会。

当前,大多数用户与大语言模型互动的方式是,直接输入提示词并获取输出结果。这种方式就像让一个人(或者AI)一次性写完一篇文章,从头到尾没有回溯和修改。然而,实际上,人类的最佳创作状态并不是线性的输出方式,AI同样也不该如此。

尽管当前大语言模型的使用模式通常是线性的,但它们已经表现出惊人的能力。通过智能体的工作流,我们可以让AI系统执行更复杂的创作过程,例如:先列提纲、进行网络调研、获取相关网页内容、撰写初稿、自我评估、反复修改……最终形成一个迭代式的工作流程。虽然这种模式可能会比线性输出稍慢,但它能够通过多次思考、研究和修改的循环,产生质量大幅提升的结果。

在AI Fund参与的多个项目中,无论是生成合规文件、进行医疗诊断,还是处理法律文书的推理工作,我们都发现,是否采用智能体工作流往往决定了项目的成败。未来最具商业价值的机会就在于如何将现有的,或全新设计的工作流程转化为智能体架构

此外,AI 技术栈正迎来新层级:智能体编排层(Agentic Orchestration Layer),作为连接底层模型与上层应用的中介,正在帮助开发者更高效地构建复杂 AI 应用。

尽管这个编排层让应用开发变得更简单,但我的核心观点依然没有改变:在整个技术栈中,应用层依旧是最具价值的部分,值得我们投入主要精力。

3

AI创业避坑

模糊想法=烧钱,具体方案=印钞

现在,我想分享一些有助于初创公司快速发展的实践经验。在AI Fund,我们始终坚持一个原则:只专注于具体的产品创意。这里所说的“具体”,是指工程师能够根据明确的需求描述,立即开始开发的程度

举个例子,“用AI优化医疗资源”这样的想法太过模糊,基于这个想法,工程师可能会开发出完全不同的产品;而“开发一个让患者在线预约MRI设备的软件”则是一个具体的产品创意,工程师可以在当天开始编程,快速推进开发。

具体的创意能够带来巨大优势,尤其是在创业过程中。尽管像“用AI提升邮件效率”这样的创意听起来很吸引人,也容易获得认可,但只有具体的方案才能快速验证其可行性

在AI Fund的运营中,我们始终要求团队提出具体的创意,原因主要有三个:

第一,明确的方向能让团队全速推进开发工作;

第二,无论验证结果是成功还是失败,都能迅速得出结论;

第三,优秀的具体创意通常源自于领域专家对某个问题的长期思考和深入理解。

举个例子,在创办在线教育平台Coursera之前,我花了好几年的时间专注于在线教育领域。

我不断与潜在用户交流,反复推敲如何构建一个能够真正解决问题的教育科技平台。经过长时间的思考(正如Y Combinator所说的那样,“在创意迷宫中徘徊”),我意识到那些深耕某个领域多年的专家,往往能够凭借直觉快速做出高质量的决策。

当你对某个领域进行了足够深入的思考,并与用户进行了充分交流后,如果突然被问到“该开发这个功能还是那个功能”,你的直觉反应——即那种瞬间的判断——可能反而非常准确。但对于许多初创公司来说,获取数据反而是一个相对缓慢的过程。相比之下,领域专家的直觉判断往往能够帮助公司实现更快速的决策。

另一个重要观察是,成功的初创公司在任何时刻都专注于验证一个明确的假设。毕竟,初创公司资源有限,不可能同时在多个方向上进行尝试。

因此,创业者应该选定一个方向,并全力推进。如果数据证明这个方向不可行,那么就迅速转向另一个具体的方案

但是,需要注意的是:如果每个新数据点都让你改变方向,可能说明你对该领域的理解还不够深入。而如果每次与客户交流后你都改变主意,那说明你还没有形成高质量的具体创意。这时,你需要找到一位在这个问题上有长期思考经验的专家,来帮助指引方向。

我也一直在思考如何构建快速的反馈循环,特别是当AI编程辅助工具被广泛应用时。开发应用时,最大的风险通常在于市场接受度。

很多初创公司失败的原因并不是技术实现困难,而是因为开发出的产品没有市场需求。我们通常的开发流程是:工程师开发产品→获取用户反馈→产品经理调整方向→继续开发,这样的循环持续进行,直到实现产品市场匹配(Product-Market Fit)。

然而,随着AI编程助手的加入,开发速度正在飞速提升,开发成本也在急剧下降。这一变化正在彻底改变我们推动初创公司发展的反馈循环机制。在我看来,软件开发可以分为两大类型:

快速构建原型以验证创意是否可行:这种方式主要是通过快速构建粗糙的原型,来验证创意的可行性。例如,如果我们要测试一个新的客服聊天机器人,或者开发一个处理法律文档的AI工具,我们会迅速搭建一个功能原型来验证这些想法是否可行。

维护成熟的代码库:许多分析显示,使用AI辅助工具后,编写可实际运营代码的效率提升了30-50%。但是,在构建原型的过程中,效率提升并不是50%——我认为至少能提升10倍,甚至更高。

造成这种差异的原因很多,比如构建原型时不需要与现有系统进行复杂的集成,对代码的可靠性、扩展性和安全性等方面的要求相对较低。

就像我经常对团队说的:“可以先写出不完美的代码。”因为如果软件只在你自己的笔记本上运行,且你并不打算恶意攻击自己的电脑,那么暂时的不安全并不会有太大问题。当然,在正式发布之前,所有的安全问题都需要解决,毕竟泄露敏感数据是非常严重的。然而,在验证阶段,快速实现比追求完美更加重要。

如今,初创公司已经开始通过构建大量原型(例如20个原型)来筛选创新方向。尽管有些人担心“太多概念验证无法产品化”,但当验证的成本足够低时,未能成功的原型也是完全可以接受的。我知道,“快速行动,打破常规”这一口号曾引发争议,但我告诉团队:“快速行动,保持责任”——这两者完全可以兼顾。

其次,在AI编程助手的帮助下,开发者的效率正在不断提升

几年前,像GitHub Copilot这样的代码自动补全工具就已经广受欢迎,随后出现了一代AI驱动的集成开发环境(IDE),如Cursor。而最近几个月,又出现了高度自主的编程助手。

对我个人而言,我认为OpenAI的o3编程工具体验非常好,Claude Code也非常棒。这些工具的迭代速度惊人——也许几个月后我会转向新工具,但这种高度自主的编码助手仍然在持续提升开发效率。

需要注意的是,工具代际差距会带来实质性影响。我的团队现在的工程实践,与半年前相比已截然不同。最出人意料的是:代码的价值属性正在发生变化。过去,代码被视为珍贵的资产,但如今,软件工程成本大幅降低,我们上个月就完全重构了某个代码库三次,因为选择新的数据架构变得轻而易举。

4

编程成为AI时代的新型表达力

这让我想起了亚马逊创始人杰夫·贝索斯提出的“单向门决策”(one-way door decisions)与“双向门决策”(two-way door decisions)理论:单向门决策意味着你做出的决定一旦改变,就无法轻易退出或逆转;而双向门决策则是可以随时改变或撤回的,代价相对较小。

过去,选择技术栈和软件架构就像经过单向门——一旦选择了某个技术栈并开始构建系统,特别是确定了数据库结构,后期再进行改变就变得非常困难。

但现在,情况发生了显著变化,虽然还不能完全说是“双向门”,但我发现,团队经常遇到这种情况:我们先使用某个技术栈开发一周,然后改变主意,抛弃整个代码库,换用全新的技术栈从头开始重写。

当然,重构总是需要付出一定代价的,我们并非总是这样做。但随着软件开发成本的大幅降低,我的团队经常会重新思考:哪些决策仍然是单向门,而哪些已经变成了可以反悔的双向门。

更进一步说,我认为现在正是让每个人都掌握AI构建能力的最佳时机。

过去一年,一些人以“AI将自动化编程”为由,建议大家不要学习编程,我认为这可能是史上最糟糕的职业建议之一。

回顾历史,当几十年前我们从打孔卡转向键盘终端时,编程变得更容易了;当我们从汇编语言转向COBOL等高级语言时,甚至有人发表论文声称,“有了COBOL就不再需要程序员了”,然而这些观点后来被证明是完全错误的。编程语言让编码变得更简单,反而让更多人学会了编程。今天,AI编程助手的出现也有类似效果。

我有一个可能颇具争议的观点:现在是时候让每个岗位的人都学习编程了

在我的团队中,从CFO、人才主管、招聘专员到前台接待,所有人都具备一定的编程能力。我亲眼见证了这种能力如何让他们在各自岗位上表现得更加出色。或许我的团队在这方面走得比较前,但我相信,未来越来越多的公司将会朝着这个方向发展。

我想通过一个亲身经历,来说明为什么应该培养这种能力:当我在Coursera教授生成式AI课程时,我们需要用Midjourney生成一些背景图。团队中有一位熟悉艺术史的成员,能够通过精准的提示词——包括艺术流派、调色板、灵感来源等——精确控制生成的图像效果,最终我们全都采用了他生成的图像。

相比之下,我这个艺术门外汉只能给出“请生成一些漂亮的机器人图片”这样模糊的指令,始终无法达到他那样的精准控制。

这次经历让我深刻意识到:在计算机时代,最重要的核心技能之一就是能够清晰地向计算机表达你的需求。学习编程并不意味着你要亲自写代码,而是学会引导AI来编写代码。在我看来,这种能力将是未来很长一段时间内最有效的工具。

5

当AI让开发变快10倍

产品设计与管理却成了最大瓶颈

随着软件工程效率的大幅提升,我观察到一个非常有趣的现象:产品管理——包括收集用户反馈、决定开发哪些功能——正逐渐成为整个开发流程中的瓶颈。过去一年里,我注意到多个团队都出现了这样的趋势:工程师的效率提升了,而产品设计和工程管理的速度却没能同步跟上。

这让我想起硅谷曾经的经验法则:通常,一个产品经理对接六七个工程师。然而,随着工程师效率的急剧提升,产品管理的速度却跟不上。就在昨天,我遇到了一个非常典型的例子——某个团队在规划人员配置时,提出了2个产品经理对接1个工程师的方案,也就是说,产品经理的人数竟然是工程师的两倍!这是我职业生涯中第一次遇到这种情况。虽然还不确定这种配置是否合理,但它确实预示着行业正在发生深刻的变化。

在这样的环境下,我发现那些懂编程的产品经理或者具备产品思维的工程师往往表现得更为出色。对于初创公司领导者而言,随着工程开发速度的加快,建立快速获取反馈的机制变得尤为重要。我总结了一套获取产品反馈的战术体系,按照从快到慢、从粗略到精确的顺序排列:

最快的方法是亲自体验产品后凭直觉做出判断。如果你是领域专家,这种方式通常非常有效;

稍慢一点的方法,是请三五个朋友或同事试用并给出反馈;

再慢一些的策略是邀请三到十个陌生人试用产品并收集他们的意见。事实上,我发现,在咖啡厅或酒店大堂等人流密集的地方,礼貌地邀请陌生人试用产品是非常有效的用户调研方式;

当然,如果有现成的用户群体可以快速实施,那么向100名测试用户发送原型也是一种不错的选择;

最慢(但最精确)的方法是通过A/B测试——虽然硅谷一直推崇这种方式,但在我的战术体系中,A/B测试反而是最慢的反馈渠道,尤其是当用户基数不大时。

值得注意的是,在使用除第一种方法外的任何反馈方式时,很多团队往往会直接根据数据做出决定。然而,真正关键的点在于:进行A/B测试时,不能仅仅停留在数据的表面。如果某个功能的数据表现不佳,我们需要深入挖掘背后的原因——是因为功能设计不合理?还是目标用户定位不准确?只有通过这种深度分析,才能真正推动产品迭代的有效改进。

我们始终强调,A/B测试的结果不能简单地决定方案A或B的选择。我的团队会深入分析数据,通过这种方式不断完善我们的产品直觉。 通过这样的深度反思,我们能够利用所有的数据来更新自己的心智模型,从而提升快速决策的质量。事实上,这种深度思考已经被证明对我们至关重要。

6

创业成功加速法则:

执行力比idea更重要

在讨论了具体创意、加速工程开发和产品反馈之后,我想强调最后一个关键点:理解AI技术的重要性,它能够显著提升工作效率。

对于智能手机等成熟技术,大多数人,甚至是非技术人员,对其功能都已有基本的认知。同样,营销、HR等成熟领域虽然工作繁重且复杂,但相关知识普及程度已相对较高。然而,AI作为一项新兴技术,真正能够掌握其精髓的人仍然较少。这也意味着,理解AI的团队,相较于不了解的团队,更具明显的竞争优势。

举个例子,在构建客服聊天机器人时,你必须判断:应采用提示工程还是微调工作流?如何实现低延迟语音输出?这些技术决策一旦做对,可能几天就能解决问题;如果判断错误,可能在错误的方向上浪费数月的时间。

我观察到一个有趣的现象:面对二选一的技术架构决策(理论上最多影响2倍的效率),如果选错方向,实际可能导致10倍的效率损失。这正是为什么做出正确的技术判断对初创公司至关重要的原因。

此外,我发现,持续关注AI的最新进展对初创公司非常有帮助。过去两年,我们见证了大量令人惊叹的生成AI工具和模块的出现。例如,提示生成、工作流优化、模型评估、保护机制、语音合成、异步编程、大量ETL工具、嵌入式技术、微调、图数据库等。这些工具和模块的组合,让我们能够迅速构建出一些几乎无人能在一年前想到的应用。对于初创公司而言,这意味着前所未有的新机会,能够构建全新的产品和服务。

当我了解这些AI构建模块时,脑海中总是浮现出这样的画面:就像玩乐高积木一样,每掌握一个新的技术模块,就相当于获得了一块新的积木。最初你可能只有一块基础的白色积木——比如学会了提示工程,它就已经能够帮你构建一些很酷的应用。但当你再获得一块黑色积木——比如学会了开发聊天机器人,你的创造力空间就会大幅扩展。接着,随着你掌握更多的模块(比如蓝色、红色、黄色积木),这些积木的组合方式几乎呈指数级增长,带来的创意也变得越来越丰富。

深度学习对我的最大影响之一,就是让我在学习这些模块时,能够感受到它们的加成效果。就像在不断积累新的构建模块,可以组合成过去一年或两年内无法实现的软件应用。我亲自参加了许多深度学习课程,并与世界顶尖的AI公司合作,手把手地学习如何利用这些构建模块。通过这些学习,我能够看到更多丰富的组合形式,从而打造出更具创新性的产品和技术。

在本次分享的总结部分,我想强调一个核心观点:在创业过程中,虽然成功需要诸多因素的配合,但根据AI Fund的投资经验,团队的执行速度与创业成功率有着极强的正相关性。

我们总结出了几个关键的加速法则:

专注于具体可行的创意:创意必须明确且具备实施的可行性。

提高决策速度:作为决策者,不仅要确保决策质量,更要重视决策的速度。

充分利用AI编程辅助工具:这些工具能够极大提升开发效率。

建立高效的用户反馈机制:包括克服心理障碍,像在咖啡厅等场所礼貌地邀请陌生人试用产品等策略。

持续追踪技术动态:紧跟前沿技术,能够帮助节省时间、提高开发速度。

以下为现场问答环节:

7

AI并非失控力量

安全问题不应被“妖魔化”

问:当AI不断发展时,你认为人类更应该去开发工具,还是应该更好地学习如何使用这些工具?在一个智能日益普及的世界里,我们应该如何定位自己,保持自己的重要性?

吴恩达:我认为通用人工智能(AGI)被过度炒作了,未来很长一段时间内,AI仍然有很多领域无法做到人类所能完成的工作。因此,在可预见的未来,人类仍然拥有AI无法替代的独特价值。基于这个原因,

我认为,掌握AI工具至关重要。虽然有些人会开发工具,但我们其他人也可以直接使用这些工具。所以,我们不必担心被AI取代,但必须意识到:能够精通AI协作的人将比那些不擅长使用AI的人更具竞争力。

问:随着我们朝着更强大的AI迈进,你认为计算的未来会是什么样子?有些人说要将GPU送到太空,也有人讨论要使用核能供电的数据中心。你怎么看这些问题?

吴恩达:过去几年,AI领域确实存在一些夸大其词的宣传。某些企业为了吸引投资或提高关注度,有意渲染了一些耸人听闻的论调。由于AI技术的复杂性,这些说法往往缺乏有效的监督,也很难验证其真实性。

例如,“AI将导致人类灭绝”的言论完全脱离了技术的现实,但这种末日叙事引发了广泛关注,甚至还帮助某些公司达成了融资目标。同样,关于“AI将取代所有工作”的论调也并不成立。

实际上,AI不仅没有取代就业机会,反而正在创造新的工作岗位,并改变现有岗位的性质。至于“一个大模型就能摧毁整个初创企业生态”的说法,除个别案例外,这种情况并没有广泛发生。

再比如,关于AI需要大量电力的问题,声称只有核能才能支持这一点的观点其实并不准确。风能、太阳能等可再生能源同样有潜力满足这一需求。我认为,将GPU送上太空或建造核能数据中心的想法看起来很吸引眼球,但从实际需求来看,地面计算设施仍有巨大的优化空间。总的来说,许多被夸大其词的叙事并没有实际的技术依据,对未来的发展并无实质性帮助。

问:在AI领域,有很多炒作的内容,而关于未来如何应用这些技术,很多人并没有明确答案。你认为,在这些炒作的内容中,最危险的偏见是什么?

吴恩达:我认为当前关于AI危险性的讨论被过度夸大了。AI就像电力一样,是一种强大的工具,既可以用在有益的地方,也可能被滥用。

我个人不太常使用“AI安全”这个术语,并不是因为不重视安全,而是因为安全性本身并不是技术的内在属性,它取决于我们如何使用它。就像电动机制造商无法保证其产品不会被用于制造炸弹装置一样,AI的安全性也完全取决于应用的方式。因此,我更倾向于讨论“负责任的AI”,因为决定AI最终产生积极影响还是消极影响的,正是我们如何使用它。

最近,《华尔街日报》有篇关于AI失控的报道,完全属于典型的夸大其词。文章将实验室中的极端案例渲染成了耸人听闻的故事,虽然这些报道因公众对技术的理解有限而广泛传播,但它们没有提供足够的实证,甚至有时被用作攻击开源软件的武器。这种做法令人遗憾。

8

AI时代创业的核心不是技术壁垒

而是用户的喜爱和反馈回路

问:作为创业者,我们应该如何思考业务,尤其是在如今任何东西都可以在一天之内被颠覆的情况下?我们拥有的优秀模式、产品或者功能,竞争者们只需几行代码、几小时内就能复制出来。

吴恩达:实际上,当你开始创业时,会面临许多需要考虑的因素。我认为,最关键的是打造用户真正喜爱的产品。虽然市场渠道、定价策略和技术壁垒等因素都很重要,但如果没有解决“产品与市场匹配”这个根本问题,其他的工作都是空谈。事实上,大多数成功的企业,都是先做出了优秀的产品,然后才逐渐建立起竞争壁垒。

在AI Fund,我们会对这些因素进行系统分析,以决定是否继续推进项目。但在当前的市场环境下,更重要的是把握那些尚未被开发的商业机会——其实现在可实现的创新点子远远超过了有能力实现这些点子的人。因此,在应用层面,我认为仍然有很多空白领域,可以创造出别人尚未涉及的新产品。我建议大家专注于打造一个用户喜爱的、值得去做的产品,剩下的工作可以在后续过程中逐步解决,尽管这些问题同样重要。

问:你提到当前的AI工具就像积木一样,可以通过积累来构建产品。那你认为,未来这种AI工具的积累效应会是什么样的?

吴恩达:对于开发者来说,虽然确实存在token成本和时间开销等动态工程挑战,但我认为在初期阶段不必过度担心这些问题。实际上,真正需要关注token成本的情况非常少——这通常意味着你的产品已经拥有大量用户。即便遇到这种情况,我们也可以通过优化提示工程、微调等技术手段来有效控制成本。

我注意到很多智能体工作流已经成功整合了多种技术模块,例如,客户服务聊天机器人就可能同时运用提示工程、优化结果、评估系统、安全护栏和检索增强生成(RAG)等技术。因此,我认为这些功能在不断扩展,并且取得了显著的进展。

不过,我有一个实用的建议:在软件架构设计时,就应考虑不同技术模块的可替换性。比如,我们的很多产品虽然基于某个基础模型构建,但具体使用哪个模型版本常常会有所变化——当新模型在评估中表现更好时,工程师们会直接切换,而无需专门通知我。保持技术选择的灵活性,可以确保在叠加更多功能时,仍然能够快速迭代。

问:在教育领域应用AI,当前存在两种主要范式:一种是AI辅助教师提升工作效率,比如自动批改作业;另一种是为每个学生提供个性化AI导师。你怎么看这两种观点的融合?未来五年教育会是什么样的?

吴恩达:我认为,每个人都能感受到教育领域即将发生变革,但目前这种变革还没有完全到来。我看到很多人在进行不同的尝试。在Coursera,我们开发了Coursera Coach;DeepLearn则专注于教学AI,并内置了聊天机器人。还有许多团队在尝试自动评分系统。像Duolingo这样的语言学习平台已经展示了AI在教育中的变革潜力,但对于更广泛的教育场景来说,真正的颠覆性变革尚未出现。

我个人认为,未来教育将朝着高度个性化的方向发展,但具体的实现形式——是通过虚拟形象、文字聊天机器人,还是其他交互方式——仍在不断探索之中。几年前关于“AGI将彻底改变教育”的炒作确实过于夸大。教育工作本身具有高度复杂性,未来十年我们需要持续探索如何将教育工作流程与AI智能体工作流相结合。这是一个需要长期投入的渐进过程。

问:AI具有巨大的潜力,但也可能带来很多负面影响,比如加剧经济不平等等问题。你认为作为AI开发者,我们应该如何平衡产品开发与可能的社会负面影响?我们如何在快速发展的同时,又保持责任感?

吴恩达:我认为开发者需要秉持一个基本原则:如果你内心深处不确信自己的产品能让大众生活变得更好,那么就不要去做。我知道这听起来很简单,但在实际操作中,这是一项非常困难的挑战。在AI Fund,我们已经叫停了多个可能带来经济效益但却可能产生负面社会影响的项目。同时,我们也要确保AI的红利能惠及所有人——比如在我的营销团队中,掌握编程技能的成员表现明显更出色,这促使整个团队都学习了编程技能。

问:随着AI变得越来越强大且广泛应用,似乎人们对AI的认知与它实际能够做的事情之间的差距也在不断增大。除了教育技术人员之外,你认为我们是否也需要让普通大众了解深度学习,帮助他们更好地理解AI的实际能力和工作原理?

吴恩达:我认为这非常重要,知识的普及应该逐渐跟上技术发展的步伐。DeepLearning.AI的使命就是让更多人掌握AI技能。尽管如此,我认为我们目前面临两个主要挑战:一是知识普及的速度可能无法跟上技术发展的速度;二是需要警惕一些企业通过夸大AI风险来建立技术垄断。比如,加州的SB-1047法案(幸好被否决了)就是一个典型的例子,这类监管提案并不会提高安全性,反而会扼杀开源创新,最终加剧技术不平等。

我认为,AI所面临的一个社会不平等问题是,如果这些恶劣的监管政策最终成功,它们会通过使少数公司成为“守门人”来压制创新,导致许多创业公司无法自由创新。因此,保护开源软件,防止这些监管政策的出台显得尤为重要。到目前为止,我们在这方面取得了一些进展,但挑战依然存在,我们仍需不断努力。

本文来自微信公众号“腾讯科技”,编译:金鹿,编辑:海伦,36氪经授权发布。