量子位独家专访陶哲轩：当下为何创办AI x Science组织

未来可能会有10000个陶哲轩

数学家陶哲轩，公开了AI新身份——SAIR Foundation联合创始人。

之前，他是举世闻名的数学天才，年少成名的传奇数学家、13岁加冕IMO的最年轻金牌得主……24岁就成为加州大学洛杉矶分校（UCLA）史上最年轻的终身正教授。

最近几年，随着ChatGPT火爆，他也成为了AI×数学的旗帜性人物，并且开始更加高频地思考和谈论AI与基础科学交叉的可能性。

而就在2026年刚开年，50岁的陶哲轩更进一步，以联合创始人的身份发起SAIR Foundation，希望这个旨在重塑AI与科学关系的非营利性联盟，能够连接学术界和产业界，并且能够团结和帮助更多的年轻科学家一起推进两大目标：

一，用科学的方法打造AI；二，借助AI重塑基础科学研究。

△SAIR Foundation主要专家成员

在SAIR Foundation对外官宣后，陶哲轩和Chuck NG——SAIR的两位联创，也在量子位的独家专访中，谈论了他们关于AI x Science、数学、基础科研等等相关的一切。

在他们看来，AI x Science最令人兴奋的地方，在于科研的普惠化。他们希望通过SAIR这座桥梁，能为更多年轻人打开象牙塔的大门。

未来，世界上可能会有10000个陶哲轩。

上面这些只是冰山一角。在这场超90分钟的深度对谈中，你还会看到以下精彩观点：

如果AI在回答时能表达置信度，比如“我比较有把握”或“这里不太确定”，其实际可用性会大幅提升。

学术界和产业界各司其职的模式走不通，速度太慢了，AI时代需要二者紧密合作。

相比金融和医疗，科学是一个更安全的AI试验场，相对而言，算错一道数学题几乎没什么损失。

看似重复、枯燥的基础性工作，对人的成长其实非常重要，青年人需要这些宝贵的训练机会。

大部分学科都在彼此交流，而AI正是促成这种跨学科互动的重要催化剂。

不要简单禁止新技术，高校的任务是教会学生如何正确使用它。

需要解决科研体系的结构性瓶颈，通过跨学科的全球协作，以科学、安全的方式加速通用人工智能（AGI）和超级人工智能（ASI）的演进。

下面附上精校后的完整访谈文字，全文超过1.5万字。为了提升可读性，量子位在不改变原意的前提下，对内容做了适当整理和删减。

请享用。

AI X Science需要自己的垂直AI

量子位：首先，祝贺SAIR Foundation成立。能和我们聊聊发起这个AI X Science机构的动机吗？

陶哲轩：我认为AI将从根本上改变科研模式，而我们首先要厘清的核心问题是：如何在科研场景中合理、高效地运用AI？

事实上，我们需要一些高质量的试点项目，来展示什么是最佳实践，让其他科学家可以参考、学习。

过去，这类工作主要由大学、科研机构和政府部门来推动。但在当前环境下，来自其他领域的支持同样非常重要。它更灵活，能有助于我们尝试一些创新性的事。

我很高兴能参与创立这个机构，希望借此探索新想法，尝试更大胆的路径，看看当AI和科学以一种更审慎的方式结合时，究竟能走多远。

Chuck：我一直都很享受和优秀科学家合作，能和Terry（陶哲轩）一起发起这个组织，我真的非常兴奋。同时还有多位诺贝尔奖和图灵奖得主一起加入。

Terry刚才更多讲了学术侧，而我自己长期推动学术和产业融合发展，这也是我们对这个项目格外有热情的原因之一。

如果你看看我们的启动活动，就会发现，参与者汇聚了全球顶尖学术研究者及多家科技领域企业代表，包括NVIDIA、OpenAI、Amazon、Microsoft等，各方围绕AI x Science的发展展开交流探讨，为后续跨领域协作奠定基础。

当学术界和产业界坐在一起，会带来很多机会，可做的事情非常多。

量子位：从你们的角度看，当下AI技术的主要短板在哪里？为什么科研领域不能直接用OpenAI或其他公司的模型？

陶哲轩：我们其实已经在尝试使用一些主流LLM，也确实有研究者用它们做出了成果。

问题在于，模型会产生幻觉，这对科研来说是个非常严重的问题。科研需要可验证、值得信任的系统。

另一个挑战是可解释性。模型有时会给出一个看起来不错的想法，但它往往不会说明这个想法是来自训练数据里的既有文献，还是某种新的组合，也说不清它和已有工作的关系。

科学并不只是解决一个个孤立的问题，更重要的是把新结果放进已有知识体系中，让后来者可以在此基础上继续推进。这就要求结果具备可追溯性、规范的引用，以及清楚说明如何扩展或修改。

商业化的大模型有时能做到这些，但并不稳定。如果我们能有专门为科研设计的AI，或者通过更好的工作流去强制验证，并系统性地把结果和文献体系连接起来，对科学的帮助会大得多。

最终很可能的方向，是把现有模型嵌入到一个更严格的框架中，配合强有力的验证和校验机制，让它们真正成为科学发现的工具。

Chuck：事实上，在日常层面，比如写作，AI表现已经不错了。

但一旦进入更深、更专业的技术领域，情况就完全不一样。很多细分科学领域，高质量、结构化的数据本身就非常有限。这也是为什么必须和科学家紧密合作。

我们的目标，是把这些系统打磨到可以可靠地用于科研。最终，我们希望让先进的AI能被绝大部分人使用，也就是“AI普惠化”。

陶哲轩：我举一个非常简单的例子。

科学家在提出一个结论时，通常会同时说明自己对这个结论的信心程度，比如“我对此非常有把握”“我有一定把握”“这个想法目前还不太成熟”。

AI并不会这样做，它们几乎总是用一种百分之百确定的语气给出答案。如果AI能够明确表达不同层级的置信度，它在科研中的实用性会提升很多。

量子位：现在整个行业的主线都在谈Scaling，更多数据、更大的模型、更强的算力。但SAIR更关心“Scaling the Science of AI”，这具体指什么？

陶哲轩：目前为止，科技公司所采用的路线确实非常成功。当算力和训练数据提升一个数量级时，模型能力会有明显跃升。这套方法到现在为止效果还都比较好。

但从长远看，它会撞墙。数据不是无限的，公开互联网基本已经被用得差不多了，同时还存在能源和算力等方面的约束。

另外，现在的AI能解决非常困难的问题，但往往很低效。一个人类数学家，可能看十个例子就能抓住问题的核心，然后举一反三；而现有的AI，往往需要数百万个训练样本，还要反复尝试，甚至运行上百次，才能得到一个正确结果。

放到科研中看，我们并不总是需要最大、最通用的模型。很多科研任务本身非常专门化。在一些场景下，体量更小、功耗更低、成本更低的模型，甚至能直接在个人电脑上运行，就已经足够用了。

大型公司更关注打造“什么都能做”的通用模型；而科研场景，可能更需要为特定工作流量身定制的专用工具。开发和支持这类工具，正是我们希望通过SAIR去推动的一件事。

量子位：我能不能这样理解，在AI x Science这个方向上，真正关键的，是更好的原则和方法论，而不是一味把模型做得更大？

陶哲轩：可以这么理解。我们需要更好的方式去评估可信度、表达置信水平，也需要提升系统的可解释性。

我们同样需要改进人类与AI协作的方式。现在最常见的交互模式，是你给模型一个提示，它直接给出一个完整答案。

但在很多科研场景中，研究者往往不只关心最终结论，还希望看到推理过程本身。你可能想在中途介入，补充新的信息，或者探索不同的路径。

目前不少研究者对AI的应用仍持观望态度，一方面是因亲身经历过系统出错的情况，另一方面是现有工具与他们的核心研究需求不匹配。

如果科学家能够开发真正贴合自身工作流和研究需求的工具，我相信这些系统的使用率会显著提高。

Chuck：我想从另一个和可信度相关的角度补充一下，“数据质量”。

我们的一位密切合作伙伴，John Hennessy，一直在为SAIR Foundation提供建议。他是图灵奖得主，同时也是Alphabet的董事长。他经常强调，在科研中，提升数据质量的重要性不亚于提升模型本身。

信任本身也是一个更宏观的社会问题。在不同地区，人们对数据和技术的信任程度并不一样。美国社会对一个东西的信任水平大概在70%到80%，而对AIGC的信任度，往往只有这个数字的一半左右。

这种落差，也解释了为什么很多组织，包括OpenAI、xAI以及其他AI公司，都希望与我们合作。信任、可靠性和科学严谨性至关重要。

量子位：随着AI不断降低科研门槛，会给整个行业，以及全球科研格局带来哪些变化？

Chuck：这个问题很好。我觉得最终的目标，是在和顶尖科学家、研究者一起合作的过程中，把AI提升到一个“默认值得信任”的水平。

一旦AI达到这样的程度，它就不会只被专家使用。普通人也能放心用，比如你的父母，甚至爷爷奶奶，都可以在日常生活中依赖AI，而不用担心它靠不靠谱。

这也正是我们为什么要把一流的科学家和产业界的伙伴聚到一起，彼此学习、共同推进。只有通过这样的协作，技术本身以及它在真实科研场景中的应用，才能一起向前走。

我们希望AI能成为一种日常工具，就像汽车一样。当AI达到这样的可靠性水平时，全球科研格局才会真正发生变化。

量子位：SAIR具体会如何参与并推动这一转变？

Chuck：我们的做法，是把学术界和产业界以一种更直接、更有组织的方式拉到一起。

在学术侧，很多研究者缺乏算力，也很难获得长期、稳定的资金支持；在产业侧，公司拥有算力、资本和工程能力，但现有模型和工具和科研需求之间还有明显错位。

科研领域越来越需要更广泛的社会力量参与进来，包括捐助者、基金会、投资人和创业者。把这些人聚在一起，能更好地支持那些真正长期、具有高影响力的研究方向。

我们相信，这种协作模式能把科学的边界推得更远。

陶哲轩：在过去几十年里，一个主流模式是：学术界主要依赖官方资金支持，产业界则负责把研究成果转化为应用。学术研究者提出基础性的想法，产业界或其他主体再把这些想法变成知识产权、专利和商业产品。

这条链路能运转，但速度相对较慢。在一些国家里，学术界并没有动力去考虑市场化问题，而产业界也很少投入到真正长期、基础性的研究，更关注短期回报。

我们可以重新思考，在21世纪，从基础科学到应用研究，再到现实世界产品的这条路径应该如何设计，怎样才能更高效，也更贴合社会需求。

Chuck：这是一个非常特殊的历史节点。过去，大学和科研机构可以依赖相对稳定的政府资助；现在，尤其是在美国，这种支持出现了变化，新的合作模式变得非常必要。

我们把这看作一个机会，各方都在探索新的资源整合模式，像SAIR这样的组织也站出来了，支持杰出的研究者，并与产业伙伴紧密合作。

量子位：AI模型的质量在很大程度上取决于数据。你们觉得，在不同基础科学领域里，数据的多少是否会导致AI落地难度的差异？

陶哲轩：AI在那些高质量数据比较充足的科学领域里，进展往往最快。

一个很典型的例子就是蛋白质折叠。这个领域经过了几十年持续投入，积累了大量经过精心整理的高质量蛋白质数据。

但在其他领域，情况就完全不一样了。比如对单个细胞进行建模，乍一看好像是相近的问题，但我们目前并没有同等质量、同等规模的数据。

AI对数据的依赖程度非常高，远超许多传统科学方法，这是一个真实存在的瓶颈。

有人寄希望于用合成数据来替代真实数据，但如果生成方式不够严谨、标准不够高，可能适得其反。低质量的合成数据会污染原有数据集。

Chuck：我完全同意，而且我也觉得，不同学科之间的难度差异非常大。

如果想在这些领域解决更难的问题，强大的基础模型当然很重要。但正如Terry说的，没有高质量数据，再复杂的模型也会举步维艰。

有一句老话叫“garbage in, garbage out”，在这里体现得非常明显。这也是为什么AI x Science这样的项目如此重要。

在2月10日的活动中，我们把来自不同学科、不同机构的一些顶尖学者聚到了一起。参与者包括来自UCLA、Berkeley、Caltech，以及美国和北美各地高校的研究者。

我们的主旨演讲嘉宾中，还有一位最近获得图灵奖、同时也是强化学习领域的奠基者之一，理查德·萨顿。

我们也在促进跨地区研究者交流。推动AI x Science，离不开全球范围内的共同参与。

量子位：SAIR具体如何支持科学家之间的跨学科、跨国家合作？

Chuck：IPAM（Institute for Pure and Applied Mathematics）和UCLA其实已经在这方面做了很多年，而且做得非常好。IPAM长期以来都有组织跨学科主题项目和工作坊的传统，时间跨度往往很长，参与领域也很广。

我前段时间去新加坡和马来西亚，其实就是参加了一个由OpenMind组织的冬季学术营。OpenMind的创办者也就是图灵奖得主理查德·萨顿，该组织主要面向来自世界各地的年轻研究者。

那次活动的参与者很多都来自亚洲，包括新加坡、马来西亚、中国、菲律宾、韩国等地。大家聚在一起，交流想法，讨论更高效的模型，一起思考AI接下来应该往哪里走。

这种跨地区、跨学科的合作框架，和SAIR希望支持的方向高度一致。

陶哲轩：SAIR今年才刚刚起步，但IPAM已经运作了二十多年。

IPAM最有代表性的活动之一，是为期大约三个月的长期主题项目。在这些项目中，我们会邀请来自不同领域的学生、教师，有时也包括产业界的研究者，围绕一个主题深入交流，比如心脏相关科学，或者自动驾驶。

事实上，我们在深度学习真正大规模兴起之前，就已经办过相关的研讨会。

虽然IPAM并不是一个专门做AI的机构，但它举办了很多在AI相关方向上具有影响力的活动。核心理念，就是把那些平时很少有机会交流的群体聚到一起，比如纯数学家、应用数学家、物理学家、工程师，以及其他科学家。

过去，这种合作更多集中在学术内部。通过SAIR，我们希望把这个模式再往前推进一步，加强与产业界的连接，同时更关注一些中短期内能够产生实际影响的应用。

我自己的背景仍然主要在数学，但现在我们也在更广义地理解数学，把它放进一个连接理论、计算和现实影响的生态中。

我们希望尝试新的形式，探索更多把不同社群聚在一起的可能性。

Chuck：IPAM和UCLA花了几十年时间，打下了坚实的协作基础，而通过SAIR，我们可以把这套模式在地域上、在学术与产业之间进一步扩展

SAIR的核心目标，是基于已经行之有效的基础，把它扩展成一个真正全球化、跨学科，并且紧密连接真实科学问题的合作网络。

量子位：AI for Science的发展，会不会反过来影响今天产业界开发和使用AI的方式？它有没有可能成为一条通向AGI的更优路径？

陶哲轩：我觉得这是一个非常有前景的方向。

在数学和科学中，尤其是在数学里，很多输出是可以被形式化验证的，这给了我们一种约束AI的方式。把AI放进一个可以验证的环境中，这有助于减少幻觉。

如果我们能在数学或科学中，建立起可靠、可验证的AI框架，这些原则是有可能推广到其他领域的。

现在在医学、金融等领域，完全信任AI依然风险很高。你可以把它当作辅助工具，但在涉及生命安全或巨额资金时，很难放心地把控制权交给AI。

如果我们能先在科学领域解决可靠性和验证的问题，之后这些成果就有机会迁移到更广泛的应用中。

Chuck：以金融为例，大多数人并不会愿意把敏感的金融决策完全交给AI；医学也是一样，错误可能直接关系到生死。

正因为如此，AI for Science，以及反过来的Science for AI，才显得尤为重要。

如果我们能在科学环境中打造出真正值得信任的AI系统，我们希望这些进展可以在不久的将来，迁移到那些关键性应用场景中。

陶哲轩：没错。数学和科学为AI提供了一个非常安全的试验场。

如果AI在医疗或金融场景中出错，后果可能非常严重；但如果它算错了一道数学题，最多就是再试一次，几乎没有损失。

这让数学成为一个理想的环境，用来打磨可靠AI的系统。

Chuck：还有一个优势在于，数学研究通常不需要像其他应用那样消耗巨大的算力。这让我们可以更高效地反复实验，用相对较低的成本探索新思路。

陶哲轩：这也是为什么从这里起步。药物研发当然非常重要，但临床试验的成本极高、周期又很长，为了验证一种AI方法就投入数十亿美元是很难实现的。

相比之下，在数学中开发和测试AI，可以更快、更安全地验证想法，再逐步走向那些高风险、高投入的领域。

量子位：有一种担忧是，更高层次的研究能力，比如“品味”，本应建立在扎实的基础训练之上，但AI可能正在拆掉这些年轻研究者的成长阶梯。你们怎么看？

陶哲轩：现在，AI已经能完成很多过去属于研究生或初级研究者训练内容的工作，比如解一些标准问题、做实验中的部分环节、或者整理文献。

这些事情越来越容易被自动化，于是会产生一种诱惑：既然AI更快，那干脆全部让AI来做。

但问题在于，这些看起来重复、甚至有点枯燥的训练，对人的成长非常重要。我自己，包括很多资深研究者的能力，很大一部分就来自这些初级工作。

所以必须有一个平衡。即便AI能做，我们也要有意识地为年轻研究者保留有价值的训练过程。等一个人积累了足够的经验，比如亲手做过一定数量的实验之后，再逐步引入自动化。

Chuck：现在已经能看到一些过度依赖的趋势。大家都知道AI并不能百分之百可信，但很多人还是会第一时间把问题丢给AI，直接要答案或建议，这其实会削弱独立思考的能力。

这也是为什么我们特别强调让顶尖科学家参与进来。像Terry这样的研究者，或者其他诺奖级别的科学家，都是在没有AI工具的时代接受过严格训练的人。

通过建立一种类似“师徒制”的结构，让经验丰富的研究者与有潜力的年轻人紧密合作，能逐步形成更好的实践方式、更好的模型，也包括更好的平台，在支持创新的同时，不牺牲学习本身。

陶哲轩：这里其实也有一个很有意思的历史类比。计算器刚出现的时候，很多人担心学生会不会从此不学基本的算术了。

这种担忧在某种程度上确实有道理，所以直到今天，我们仍然会先教孩子手算加减乘除，再让他们用计算器。

但另一方面，计算器也极大地拓展了人们探索的空间。它让人更容易去试验数字、发现规律、探索原本很难触及的想法。

工具本身并不会自动让人变弱，它同样可以激发探索和创造力。关键在于如何使用。

面对AI，我们也需要做出类似的判断：什么时候该用，什么时候该克制，以及如何把它引入训练体系，同时不削弱那些真正重要的核心能力。

量子位：随着AI逐步替代很多现有的科研流程和技能，未来研究者最重要的能力和特质会是什么？

陶哲轩：未来的科研会越来越多地以更大规模、更多元化的团队形式展开。团队里可能既有学术研究者、产业研究人员、数学家和科学家，也会有AI系统和不同背景的人一起协作。

在这种情况下，如何在大型团队中高效合作，会变成一项非常重要的能力。

过去，人们常把科学描绘成“孤独天才”的事业，但现实里它早就是团队合作，而且这种趋势只会继续加强。沟通能力，以及我们常说的那些软技能，会变得越来越重要。

在这个背景下，“品味”很关键。能够形成整体判断，识别哪些方向值得投入，再借助AI工具或其他合作者把想法展开，这种能力非常重要。

我们很可能会看到比过去更细致的分工。

传统上，尤其是在数学领域，工作方式几百年几乎没怎么变，有时甚至带点“中世纪风格”。一个人要同时负责检查细节、做计算、发展想法、写论文、申请经费、再去做报告。

但在未来，大型项目会由很多人共同完成。有人负责长期愿景，有人擅长和AI工具深度协作，有人负责团队协调，有人负责将其讲给更多人听。

能为数学和科学做出贡献的能力类型，会变得丰富得多。

Chuck：我经常半开玩笑地说自己是个“立志当科学家的人”，很大程度上是因为我有机会和像Terry这样的杰出科学家、数学家长期合作。

我的背景并不在科研，而更多在商业领域。但我听过一些非常成功、打造过数十亿美元公司的人说过，他们见过最优秀的一些prompt工程师，背景并不是工程或计算机，而是会计、法律。

这恰恰说明，未来的科研会变得更加开放。借助AI和新的工具，来自完全不同背景的人，都有机会以有意义的方式参与科研。这也是我们所说的“科学和AI普惠化”的重要内涵之一。

陶哲轩：我现在参与的很多项目，以及SAIR希望支持的方向，本身就已经是高度协作的。它们往往汇集了职业数学家、学生、其他学科的研究者，有时甚至还包括公众参与者。

随着AI和相关工具的发展，从事严肃科学和数学研究的门槛正在降低。这是这次技术变革中，最令人兴奋的一点。

量子位：那是不是意味着，未来连我还在读初中的弟弟，都有可能在《Nature》上发论文？

陶哲轩：这是有可能的（笑）。

未来可能会有论文拥有成千上万名作者，每个人都贡献其中一小块，但都是真实、有价值的贡献。从这个意义上说，很年轻的人参与其中，并不是不可能。

事实上，在数学领域已经出现过这样的例子：有青少年在AI的帮助下，给某个已知问题找到了新的解法。它未必是最重大的突破，但确实是新的结果。

这种情况将来会变得多普遍，但现在还不好说，唯一的办法就是继续尝试、不断探索不同的研究方式。

Chuck：我其实非常希望能看到那样的场景。在过去，如果你没有很强的STEM或工程背景，几乎不可能直接参与前沿科研。

如果来自非传统背景的人，也能以有意义的方式参与科研，并真正对世界产生积极影响，那将是一件非常了不起的事情。

量子位：结合我们前面的讨论，你们能不能举一些更具体的例子，说说SAIR未来会如何支持青年研究者的成长？

Chuck：这是个特别好的问题，说实话，这也是我个人非常投入的一件事。我很多年来一直在做和导师制相关的工作，从大学阶段就开始了。

从我的观察来看，培养年轻研究者，最重要的一点是树立榜样。

人在不同阶段，都会寻找榜样。小时候，在家里看父母；进了学校，看老师；再往后，就会把目光投向更广阔的社会。

这也是为什么我们如此重视把不同领域的杰出科学家聚在一起。每一位创始成员，成功的路径都很不一样。

Barry Barish的科研经历非常有代表性。爱因斯坦在早期论文中就预测了引力波的存在，但从提出这个理论，到实验上真正观测到引力波，中间走了将近一百年。

但直到2016年前后，人类才首次探测到引力波，Barry Barish也因此在2017年获得诺贝尔奖，目前Barry Barish也是SAIR顾问委员会创始成员。这个例子很好地诠释了什么叫几十年如一日。

这些杰出科学家的价值，不只在于他们的成果，也在于他们能够分享自己在不确定性、挫折和失败中是如何坚持下来的。这是导师制中非常重要的一部分。

年轻科学家并不缺天赋，只是刚刚起步。所以我才会如此重视和Terry、以及整个创始团队一起做这件事，因为现在最需要支持的，恰恰就是这些年轻人。

Terry是独一无二的，但如果借助AI和更好的培养渠道，未来能不能不只有一个陶哲轩，而是10000个陶哲轩？这难道不是件非常令人兴奋的事吗？！

陶哲轩：是的。SAIR只是众多尝试中的一种，它不可能包揽所有事情。支持下一代研究者的需求非常广泛，没有任何一个组织能独立完成培养整个科研队伍的任务。SAIR能做的，是专注于少数有针对性的项目。

以IPAM为例，我们可以支持暑期学校、研讨班，以及面向公众的科普和交流活动。一些协作式、众包式的研究项目，本身就会自然地吸引年轻研究者参与，有些情况下，他们甚至可以承担领导角色。

我们希望，SAIR能够对其他组织产生启发，让更多机构也愿意站出来，在支持下一代科研人才这件事上承担起重要责任。

陶哲轩如何用AI？

量子位：接下来我想把话题转到数学上。Terry，您最近在做些什么？有没有哪些方向是您现在特别感兴趣的？

陶哲轩：我现在大概有一半时间，仍然花在比较传统的纯数学研究上，也就是我过去23年里一直在做的那类工作。比如研究数字中的模式，理解高度结构化、周期性的函数和非常随机的函数之间有什么本质差异，以及研究一些偏微分方程，比如来自流体力学的方程。

不过在这些方向上，我现在越来越多地把一些最前沿、最技术性的推进交给更年轻的合作者来完成。相应地，我自己研究中的一个越来越重要的部分，开始和新技术联系在一起，尤其是“如何做数学”“如何协作做数学”的新方式。

我目前非常感兴趣的一个方向是形式化，也就是不再只依赖纸笔证明，而是把数学写成计算机可以理解和自动验证的形式化语言。这会深刻改变协作方式。它不仅让我们可以和AI系统一起工作，也让我们能够和很多并不认识的研究者协作。

在过去，如果一个陌生人给你发来一份证明，你很可能会对它是否正确保持怀疑；但如果这份数学内容是用可形式化验证的语言写成的，这种顾虑基本就不存在了。

借助这些方法，我们已经能在一些项目中实现几十人的协作，有时甚至五十人以上，而且其中很多人彼此从未见过面。大家可以一起解决那种单靠个人几乎不可能完成的大问题。

我们也在尝试把AI当作证明助手来使用，同时借鉴现代软件工程里的很多理念，比如用GitHub做版本控制、进行单元测试、做质量检查等等。

从某种意义上说，我正在学习软件工程的工具，并把它们引入到一种可以称为“数学工程”的实践中。

对我来说，这一切都更像是一系列实验。并不是每一次尝试都会成功，但即便弄清楚什么行不通，本身也很有价值。

量子位：感觉您一直都很愿意把新技术引入自己的研究流程。距离你上一次接受Lex Fridman采访已经过去半年了，这段时间里，你对AI的看法有变化吗？

陶哲轩：整体来看，变化不大。但有一点出乎我意料，AI在数学方向上的进展，比我原先预期的要快一些，当然，距离真正成熟还有很长的路要走。

变化更明显的，其实是整个学术社区的态度。我开始看到越来越多的同事接受这样一个事实：AI不会消失，它会长期存在下去。大家对尝试不同使用方式的开放度，也明显提高了。

不过，现在仍然缺少一个被广泛理解和认可的中间态。很多时候，感觉只有两个极端选择：要么几乎什么都用AI，要么就完全不用。

真正理想的情况，应该是混合式工作流——大部分研究仍然用传统方式完成，但把某些环节有意识、有控制地交给AI。目前我们还没有真的找到那个最合适的平衡点。

我经常拿互联网来类比。互联网非常有用，但我们并不会用它来做所有事情。我们仍然会选择线下见朋友，而不是永远开视频会议；但在某些场景下，比如现在这样的对话，互联网又恰到好处。

经过多年，我们逐渐学会了什么时候、怎样用好互联网。我觉得，对AI来说，我们还正处在摸索这种平衡的过程中。

量子位：Terry，您是世界顶尖的数学家之一，也和很多一流数学家长期合作。你们在日常研究中，具体是怎么使用AI的？

陶哲轩：其实挺日常的。我主要把AI用在一些偏辅助性的事情上。比如做文献检索，如果我一时想不起某个数学结论的具体形式，或者它和另一个结果之间的关系，我就会直接问AI。再比如需要快速画个图、做个简单可视化，也会让AI来帮忙。

在和文字相关的工作上，我用得更多。写作时我几乎一直开着自动补全。有时候我会先把一篇论文的结构分成五步，自己写完前两步，后面几步就让AI帮我起草一下。

以至于现在，如果我在飞机上、没法用AI写东西，偶尔还会下意识地想：“怎么还不帮我把这句话补完”，然后才反应过来AI不在。

如果有人给我发来一段很长的论证，或者一篇论文，我也常常先让AI帮我总结一遍。在这些方面，它确实是一个非常好用的工具。

但在真正做深度思考的时候，比如我在努力解决一个很难的研究问题时，我基本不会用AI。这种时候我还是更依赖纸和笔。

我也尝试过直接和AI一起推研究级别的问题，但目前的体验并不理想。它给出的建议往往比较套路，有时还会打断我的思路。不过，在围绕科研的那些辅助环节上，AI已经变得非常有价值了。

量子位：过去一年里，有没有出现什么新的Aha-Moment？

陶哲轩：有的，通常是在一个问题上想了好几个月，突然有一天意识到：“哦，原来这么简单，我怎么之前没想到？”

在这之前，你往往已经试过很多条路，有时候八种、九种方法，全都走不通。但正是这些失败的尝试，一步步把不可能的方向排除掉，最后只剩下一条真正可行的路。等你终于看到那条路时，回头看就会觉得它显而易见。

这种时刻常常伴随着一种错觉，好像之前那些尝试都是在浪费时间。但实际上，正是不断试错、不断排除，才让你真正理解什么方向行得通。我自己的数学“顿悟”，到现在基本还是这样产生的。

AI目前还做不到复现这种过程。它确实能提出很多想法，但这些想法往往显得比较随机，也看不出它能像人一样，从失败中逐步学习、调整方向。到现在为止，我还没能真正用AI来直接解决研究级别的难题。

不过，一旦我已经有了清晰的思路或者解法，AI就会变得非常有用。它可以帮我把结果写出来、和已有文献建立联系、生成代码，或者在某些数学环节上提供计算支持。

从这个意义上说，它非常有价值，但更多是一种互补工具。它在支持我的工作，而不是替代我最在意的那一部分。

我觉得总体来说，人们更倾向于把AI用在自己不太享受的那些任务上，而把真正喜欢做的部分留给自己。对我来说，数学问题本身就是我最享受的事情，这也是我做数学的核心动力，所以这部分我还是会亲自来。

但有些事情，我就非常乐意交给AI。比如在文献中查找，有没有人以前用过类似的方法，或者在成百上千篇论文里筛选出相关工作，这对我来说就是一个非常理想的AI使用场景。再比如一些又长又繁琐的计算，也很适合交给AI。

当然，这件事因人而异。不同研究者享受的环节不一样，而AI本身又是一个非常宽泛的工具。对一个人来说特别有用的功能，对另一个人可能就没那么重要。所以也谈不上什么“最好的模型”或“标准工作流”。

关键还是看你希望AI帮你做什么，以及你更愿意把哪些事情留给自己来完成。

量子位：数学曾经从其他学科中汲取养分。这次，数学已经从AI身上学到了什么，或者未来可能会学到什么？

陶哲轩：有一件事我自己正在大量学习，那就是软件开发。未来的数学，可能会越来越像今天的软件开发。

如果回到五六十年前，软件往往是由一个人独立完成的：一个人写代码、测试、调试，所有事情都自己来。

但今天，软件开发已经变成了一整个成熟的行业。有人专门写代码，有人做UI，有人负责质量控制，还有一整套成熟的工作流、工具和最佳实践，还有大量踩坑经验。

数学正在开始向这个模式学习，包括它成功的地方，也包括它失败过的地方。

传统上，数学和物理学的联系非常紧密。但现在，我们越来越多地和生命科学、社会科学等领域发生互动。这些领域的问题往往更复杂、更混乱，方程没有物理里那么干净，而且对数据的依赖也强得多。

从这个角度看，AI可能非常适合处理这类复杂、嘈杂，不那么容易被形式化的问题。

我觉得，我们正在进入一个更加跨学科的时代。数学不再只是和物理对话，而是几乎所有学科都在彼此交流，而AI正是推动这种跨学科互动的重要力量之一。

量子位：所以你现在也算是在“做软件”了，对吧？

陶哲轩：某种意义上是这样。我现在参与的项目不少，但越来越多时候，我更像是在做项目管理。真正去证明定理的，往往是其他合作者，而我更多是在协调整体工作，把不同部分拼接起来。

这是一个挺有意思的角色。在一些项目里，我并不是主要的“解题者”，而是负责组织、推动，让每个人都能把自己的能力发挥到最好。事实证明，这样的方式在科研中也可以运转得相当不错。

量子位：AI不仅降低了做数学的门槛，看起来也在降低你刚才提到的很多其他领域的门槛，比如编程、物理和医学。AI有没有促使你对其他学科产生兴趣？

陶哲轩：非常明显。有一件让我自己都挺意外的事情是，我现在合作的人，背景比以前多样得多。

十年前，我几乎只和数学家合作，偶尔会和统计学家或电子工程师一起做点事情，也就到此为止了。

但现在，我在和来自各个领域的人合作，尤其是产业界的人，比如Chuck这样的伙伴。真的有一种感觉，大家都开始彼此对话了，而且在这个过程中互相学习。

其他学科的研究者，往往能从更偏数学的思考方式中受益；而数学家也能从更贴近现实世界的视角中学到很多东西。

之所以能做到这一点，很大程度上是因为我们现在有了很多工具，其中不少是由AI驱动的，它们帮助我们理解彼此的语言和工作方式，让合作变得更顺畅、更高效。

我觉得这是当下这个阶段真正令人兴奋的地方之一：学科之间的壁垒正在降低，我们开始学会用过去很难实现的方式一起工作。

量子位：和背景差异很大的人一起工作，感觉怎么样？

陶哲轩：我其实非常享受这种状态。当然，我也想先说清楚一点：深度领域专家永远都有不可替代的位置。那种在非常狭窄的子领域里做到世界顶尖的人，我们依然非常需要，这一点并没有改变。

变化在于，这些专家现在可以和另一类人更紧密地合作，他们也许不专精于某一个具体领域，但擅长把不同学科的想法串联起来，看到整体图景。

这几年里，我自己学到了很多原本完全不在我训练范围内的东西，比如生物学、经济学、政策、科研资助机制等等。有些内容确实出乎意料，有时也挺有挑战性。

但我也发现，数学里的一些核心观念，能以一种很自然的方式迁移到其他领域，尤其是关于验证、严谨性和清晰思考的那一套方法。

对我来说，这是一段持续学习的过程，而且我真的很享受。我觉得，在新的科研环境里，那些愿意保持开放心态、乐于跨学科沟通、也不怕学习新“语言”的人，更容易如鱼得水。

Chuck：Terry刚才说的，其实正好呼应了我们之前聊到的“技术普惠化”，尤其是AI。借助现在的技术，也包括SAIR在做的事情，我们正在把来自非常不同领域的一流人才聚到一起。

当你拥有这样一个网络时，事情会变得容易很多。不只是更容易发现真正有挑战性的问题，也更容易迅速判断，谁是最适合来解决这些问题的人。有时候，这些人已经手里有一部分答案；有时候，他们能立刻把你引荐给更合适的合作者。

在我看来，这种高效连接问题和人才的能力，就是“AI普惠化”在现实中的一个非常具体的体现。

陶哲轩：从传统上看，科研往往是围绕学科来组织的，比如数学系、物理系、经济系等等。这种结构，自然会让数学家主要和数学家交流，物理学家主要和物理学家交流，真正的跨学科合作并不常见。

我对SAIR抱有期待的一点在于，它在一开始就刻意聚集了一群背景和兴趣都非常多元的人。这种设计本身，就更容易促成一些在传统体系里不太容易出现的连接。

通过降低制度层面和学科层面的壁垒，我们有机会推动那些原本很难发生的合作。

AI时代，高校需要新的培养方式

量子位：Terry，你刚才提到传统高等教育，正好也是我接下来想聊的话题。Chuck，在AI时代，你觉得哪些能力对大学生更重要？

Chuck：这些年我做过不少学生的导师。我的感受是，即便是博士生，真正长期、密切合作的导师数量也很有限，通常三到五位，多一点可能也就十位左右。这其实会限制他们接触到的视角范围。

但现在情况正在发生变化，尤其是在AI x Science这样的方向上。我们可以更容易地把不同类型的专业能力汇聚到一起。这类问题天然是跨学科的，而AI让来自不同背景的大规模协作变得可行。

在这种环境下，有一项能力会变得格外重要，那就是批判性思维。很多人喜欢谈“提示词工程”，但在我看来，提示词工程本质上就是另一种形式的批判性思维。

你得清楚自己要解决什么问题，如何把问题表述清楚，以及你真正想要什么样的答案。如果这些想不明白，AI其实也帮不了你太多。

所以，清晰思考、提出好问题、抓住问题核心，这些能力依然非常关键。

与此同时，AI也在降低非传统STEM背景人群的参与门槛。我自己就是一个例子，我并没有接受过系统的科研训练，背景更多在商业领域。

但借助AI，我依然可以有意义地参与科学讨论，理解一些核心思想，并做出贡献。这种体验非常有力量。

未来并不只是STEM和非STEM的区分，而是让不同技能结构的人，用不同方式参与进来。这正是AI x Science和SAIR如此重要的原因。

陶哲轩：事实上，对科学感兴趣、希望参与其中的人，远远多于接受过正式科研训练的人。而AI正好扩大了能够参与科研的人群范围。

未来的科学发展，并不只取决于技术能力，尽管技术依然重要。组织能力、沟通能力、与他人协作的能力，正在变得越来越有价值。

但同时，是否具备整体视野，知道哪些问题值得投入精力，以及什么时候该用技术、什么时候该克制，这些也非常重要。

量子位：现有的大学体系已经存在了很长时间。如今有了AI，很多人都觉得一场大的变革正在到来。你们觉得高等教育应该如何去适应？

陶哲轩：这是个非常棘手的问题。说实话，我希望我们能有更多时间，来慢慢想清楚这些事。但现实是，我们只能“边走边想”。

已经能看到一些令人担忧的现象。有些学生过度依赖AI，成绩看起来很好，但实际上学到的东西并不多。

也有一些学生坚持完全用传统方式学习，几乎不用AI。他们往往理解得更扎实，但在效率和结果上，可能又会落后于那些大量使用工具的同学。

所以，很明显需要重新找一个平衡点。学校必须教会学生如何负责任地使用AI，也要让他们知道在什么时候不该用。

我觉得，未来会更多地转向小组项目和协作式学习，这本身也更贴近科研和产业的真实形态。

另外，课程之间可能需要更紧密地整合。现在的教育体系，往往把知识拆分成一个个相对孤立的专业模块。将来，也许需要一种更整体的结构，更强调通用的问题解决能力。

过去，学生是在作业、考试、以及和难题死磕的过程中，慢慢学会如何学习、如何面对失败、如何承受压力的。到目前为止，我们还没有为这些能力找到一个结构清晰、系统性的替代方案。

大学眼下不得不被很多现实的问题牵着走，比如维持日常运转、保障研究生经费、平衡预算等等，很难真正停下来，从零开始重新设计教育体系。

从历史上看，我们也并不是第一次面对这种冲击。计算机普及的时候，教育变过一次；互联网出现后，又变过一次；维基百科刚出现时，也有一段时间，学生直接复制粘贴内容交作业。

后来大家发现，解决办法并不是彻底禁止新技术，而是教学生如何正确使用它，把它当作起点，而不是终点。

我觉得AI也是类似的情况。它可以成为探索和研究的一个起点，但不能替代思考本身。学生不能只是向AI要一个答案，粘贴进作业里。

高等教育真正的挑战，在于如何找到那个平衡点：一方面充分发挥AI的优势，另一方面又不牺牲深度学习和真正的智力成长。

Chuck：往往产业界的变化比学术界要快。在AI时代，这种差距变得越来越清晰。而这正是SAIR Foundation看到的机会所在——把学术界和产业界拉到一起，让双方相互学习。

从我和创业者打交道的经验来看，他们有一个非常共同的特质：强烈的问题导向。不管问题有多难，他们都会盯着“怎么解决”，并且愿意为此付出一切努力。

这种心态，是我希望高等教育能够更多吸收的，尤其是在AI已经成为核心工具的背景下。大学的培养模式应该随之调整，让学生学会如何用AI去解决真实世界的问题，而不只是掌握一块块割裂的知识。

还有一个绕不开的大问题是成本。在很多发达国家，尤其是美国，高等教育极其昂贵。一些顶尖大学，一年的学费加相关费用接近10万美元，四年下来就是40万美元。

如果这种趋势继续下去，尤其是在AI已经提供了获取知识和技能的新路径之后，人们自然会开始质疑：大学学位到底还值不值得？

这也是为什么，让教育与产业更紧密地对齐变得如此重要。我们需要更清楚地知道，社会真正需要哪些能力，以及大学该如何调整自身的培养方式来回应这些需求。

在接下来的一系列项目中，我们会把产业界和高等教育的负责人同时请到一起。我们正在组织一些圆桌讨论，邀请来自宾夕法尼亚大学、南加州大学、UCLA等高校的代表，坦诚地讨论课程体系和培养模式应该如何演进，以应对这些挑战。

另外，我对像OpenMind这样的组织印象很深。我们也在思考，是否可以做类似的实验。通过SAIR，联合IPAM和UCLA，我们正在探索举办更密集的项目，比如暑期学校。

这种形式的好处在于，它能让我们更快地迭代课程内容，不必受制于传统学期制度，同时也更贴合AI发展本身的节奏。

量子位：最后一个问题。Terry，如果未来真的实现了AGI，它的数学能力全面超过人类，我们还有必要学数学吗？

陶哲轩：AGI本身其实是一个非常模糊的概念，不同的人对它的理解差别很大。

我举个例子，交通工具。过去，人们靠走路、骑马出行；后来有了汽车和飞机，效率远远高于步行。但我们并没有因此就不走路了，并不是因为必须这样做，而是因为喜欢，或者因为这对身体有益。

科学和数学将来可能也会是类似的情况。即便有一天，借助AGI，科学发现的速度远远快于人类单独完成的速度，人们依然会想亲自去做科学、做数学。

它可能会更多地变成一种手艺、一种爱好，或者一种出于兴趣、好奇心和自我满足的智力活动。

同时我也相信，无论AI变得多么强大，人类都会以不同于机器的方式继续创造价值。

人类学习和推理的方式，与AI非常不一样。AI可以通过海量数据和计算得出结论；而人类有时却能在极少的数据、极低的计算量下，做出相当不错的判断。这种能力，很可能在未来依然重要。

科研的规模和方式，可能会发生巨大变化。今天，一个研究者通常一次只解决一个问题；未来，也许可以同时推进成千上万、甚至上百万个问题。由人类把握少数关键方向，AI来填充其余部分。

我们现在还没到那一步，但这是一个合理的演进方向。即便在那样的未来，学习数学依然有意义，只是它的角色和目的，可能会和今天非常不一样。

本文来自微信公众号 “量子位”（ID：QbitAI），作者：Jay，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

量子位专访陶哲轩：我为什么现在创办一个AI x Science组织

AI X Science需要自己的垂直AI

陶哲轩如何用AI？

AI时代，高校需要新的培养方式