量子位专访陶哲轩:我为什么现在创办一个AI x Science组织
数学家陶哲轩,公开了AI新身份——SAIR Foundation联合创始人。
之前,他是举世闻名的数学天才,年少成名的传奇数学家、13岁加冕IMO的最年轻金牌得主……24岁就成为加州大学洛杉矶分校(UCLA)史上最年轻的终身正教授。
最近几年,随着ChatGPT火爆,他也成为了AI×数学的旗帜性人物,并且开始更加高频地思考和谈论AI与基础科学交叉的可能性。
而就在2026年刚开年,50岁的陶哲轩更进一步,以联合创始人的身份发起SAIR Foundation,希望这个旨在重塑AI与科学关系的非营利性联盟,能够连接学术界和产业界,并且能够团结和帮助更多的年轻科学家一起推进两大目标:
一,用科学的方法打造AI;二,借助AI重塑基础科学研究。
△SAIR Foundation主要专家成员
在SAIR Foundation对外官宣后,陶哲轩和Chuck NG——SAIR的两位联创,也在量子位的独家专访中,谈论了他们关于AI x Science、数学、基础科研等等相关的一切。
在他们看来,AI x Science最令人兴奋的地方,在于科研的普惠化。他们希望通过SAIR这座桥梁,能为更多年轻人打开象牙塔的大门。
未来,世界上可能会有10000个陶哲轩。
上面这些只是冰山一角。在这场超90分钟的深度对谈中,你还会看到以下精彩观点:
如果AI在回答时能表达置信度,比如“我比较有把握”或“这里不太确定”,其实际可用性会大幅提升。
学术界和产业界各司其职的模式走不通,速度太慢了,AI时代需要二者紧密合作。
相比金融和医疗,科学是一个更安全的AI试验场,相对而言,算错一道数学题几乎没什么损失。
看似重复、枯燥的基础性工作,对人的成长其实非常重要,青年人需要这些宝贵的训练机会。
大部分学科都在彼此交流,而AI正是促成这种跨学科互动的重要催化剂。
不要简单禁止新技术,高校的任务是教会学生如何正确使用它。
需要解决科研体系的结构性瓶颈,通过跨学科的全球协作,以科学、安全的方式加速通用人工智能(AGI)和超级人工智能(ASI)的演进。
下面附上精校后的完整访谈文字,全文超过1.5万字。为了提升可读性,量子位在不改变原意的前提下,对内容做了适当整理和删减。
请享用。
AI X Science需要自己的垂直AI
量子位:首先,祝贺SAIR Foundation成立。能和我们聊聊发起这个AI X Science机构的动机吗?
陶哲轩:我认为AI将从根本上改变科研模式,而我们首先要厘清的核心问题是:如何在科研场景中合理、高效地运用AI?
事实上,我们需要一些高质量的试点项目,来展示什么是最佳实践,让其他科学家可以参考、学习。
过去,这类工作主要由大学、科研机构和政府部门来推动。但在当前环境下,来自其他领域的支持同样非常重要。它更灵活,能有助于我们尝试一些创新性的事。
我很高兴能参与创立这个机构,希望借此探索新想法,尝试更大胆的路径,看看当AI和科学以一种更审慎的方式结合时,究竟能走多远。
Chuck:我一直都很享受和优秀科学家合作,能和Terry(陶哲轩)一起发起这个组织,我真的非常兴奋。同时还有多位诺贝尔奖和图灵奖得主一起加入。
Terry刚才更多讲了学术侧,而我自己长期推动学术和产业融合发展,这也是我们对这个项目格外有热情的原因之一。
如果你看看我们的启动活动,就会发现,参与者汇聚了全球顶尖学术研究者及多家科技领域企业代表,包括NVIDIA、OpenAI、Amazon、Microsoft等,各方围绕AI x Science的发展展开交流探讨,为后续跨领域协作奠定基础。
当学术界和产业界坐在一起,会带来很多机会,可做的事情非常多。
量子位:从你们的角度看,当下AI技术的主要短板在哪里?为什么科研领域不能直接用OpenAI或其他公司的模型?
陶哲轩:我们其实已经在尝试使用一些主流LLM,也确实有研究者用它们做出了成果。
问题在于,模型会产生幻觉,这对科研来说是个非常严重的问题。科研需要可验证、值得信任的系统。
另一个挑战是可解释性。模型有时会给出一个看起来不错的想法,但它往往不会说明这个想法是来自训练数据里的既有文献,还是某种新的组合,也说不清它和已有工作的关系。
科学并不只是解决一个个孤立的问题,更重要的是把新结果放进已有知识体系中,让后来者可以在此基础上继续推进。这就要求结果具备可追溯性、规范的引用,以及清楚说明如何扩展或修改。
商业化的大模型有时能做到这些,但并不稳定。如果我们能有专门为科研设计的AI,或者通过更好的工作流去强制验证,并系统性地把结果和文献体系连接起来,对科学的帮助会大得多。
最终很可能的方向,是把现有模型嵌入到一个更严格的框架中,配合强有力的验证和校验机制,让它们真正成为科学发现的工具。
Chuck:事实上,在日常层面,比如写作,AI表现已经不错了。
但一旦进入更深、更专业的技术领域,情况就完全不一样。很多细分科学领域,高质量、结构化的数据本身就非常有限。这也是为什么必须和科学家紧密合作。
我们的目标,是把这些系统打磨到可以可靠地用于科研。最终,我们希望让先进的AI能被绝大部分人使用,也就是“AI普惠化”。
陶哲轩:我举一个非常简单的例子。
科学家在提出一个结论时,通常会同时说明自己对这个结论的信心程度,比如“我对此非常有把握”“我有一定把握”“这个想法目前还不太成熟”。
AI并不会这样做,它们几乎总是用一种百分之百确定的语气给出答案。如果AI能够明确表达不同层级的置信度,它在科研中的实用性会提升很多。
量子位:现在整个行业的主线都在谈Scaling,更多数据、更大的模型、更强的算力。但SAIR更关心“Scaling the Science of AI”,这具体指什么?
陶哲轩:目前为止,科技公司所采用的路线确实非常成功。当算力和训练数据提升一个数量级时,模型能力会有明显跃升。这套方法到现在为止效果还都比较好。
但从长远看,它会撞墙。数据不是无限的,公开互联网基本已经被用得差不多了,同时还存在能源和算力等方面的约束。
另外,现在的AI能解决非常困难的问题,但往往很低效。一个人类数学家,可能看十个例子就能抓住问题的核心,然后举一反三;而现有的AI,往往需要数百万个训练样本,还要反复尝试,甚至运行上百次,才能得到一个正确结果。
放到科研中看,我们并不总是需要最大、最通用的模型。很多科研任务本身非常专门化。在一些场景下,体量更小、功耗更低、成本更低的模型,甚至能直接在个人电脑上运行,就已经足够用了。
大型公司更关注打造“什么都能做”的通用模型;而科研场景,可能更需要为特定工作流量身定制的专用工具。开发和支持这类工具,正是我们希望通过SAIR去推动的一件事。
量子位:我能不能这样理解,在AI x Science这个方向上,真正关键的,是更好的原则和方法论,而不是一味把模型做得更大?
陶哲轩:可以这么理解。我们需要更好的方式去评估可信度、表达置信水平,也需要提升系统的可解释性。
我们同样需要改进人类与AI协作的方式。现在最常见的交互模式,是你给模型一个提示,它直接给出一个完整答案。
但在很多科研场景中,研究者往往不只关心最终结论,还希望看到推理过程本身。你可能想在中途介入,补充新的信息,或者探索不同的路径。
目前不少研究者对AI的应用仍持观望态度,一方面是因亲身经历过系统出错的情况,另一方面是现有工具与他们的核心研究需求不匹配。
如果科学家能够开发真正贴合自身工作流和研究需求的工具,我相信这些系统的使用率会显著提高。
Chuck:我想从另一个和可信度相关的角度补充一下,“数据质量”。
我们的一位密切合作伙伴,John Hennessy,一直在为SAIR Foundation提供建议。他是图灵奖得主,同时也是Alphabet的董事长。他经常强调,在科研中,提升数据质量的重要性不亚于提升模型本身。
信任本身也是一个更宏观的社会问题。在不同地区,人们对数据和技术的信任程度并不一样。美国社会对一个东西的信任水平大概在70%到80%,而对AIGC的信任度,往往只有这个数字的一半左右。
这种落差,也解释了为什么很多组织,包括OpenAI、xAI以及其他AI公司,都希望与我们合作。信任、可靠性和科学严谨性至关重要。
量子位:随着AI不断降低科研门槛,会给整个行业,以及全球科研格局带来哪些变化?
Chuck:这个问题很好。我觉得最终的目标,是在和顶尖科学家、研究者一起合作的过程中,把AI提升到一个“默认值得信任”的水平。
一旦AI达到这样的程度,它就不会只被专家使用。普通人也能放心用,比如你的父母,甚至爷爷奶奶,都可以在日常生活中依赖AI,而不用担心它靠不靠谱。
这也正是我们为什么要把一流的科学家和产业界的伙伴聚到一起,彼此学习、共同推进。只有通过这样的协作,技术本身以及它在真实科研场景中的应用,才能一起向前走。
我们希望AI能成为一种日常工具,就像汽车一样。当AI达到这样的可靠性水平时,全球科研格局才会真正发生变化。
量子位:SAIR具体会如何参与并推动这一转变?
Chuck:我们的做法,是把学术界和产业界以一种更直接、更有组织的方式拉到一起。
在学术侧,很多研究者缺乏算力,也很难获得长期、稳定的资金支持;在产业侧,公司拥有算力、资本和工程能力,但现有模型和工具和科研需求之间还有明显错位。
科研领域越来越需要更广泛的社会力量参与进来,包括捐助者、基金会、投资人和创业者。把这些人聚在一起,能更好地支持那些真正长期、具有高影响力的研究方向。
我们相信,这种协作模式能把科学的边界推得更远。
陶哲轩:在过去几十年里,一个主流模式是:学术界主要依赖官方资金支持,产业界则负责把研究成果转化为应用。学术研究者提出基础性的想法,产业界或其他主体再把这些想法变成知识产权、专利和商业产品。
这条链路能运转,但速度相对较慢。在一些国家里,学术界并没有动力去考虑市场化问题,而产业界也很少投入到真正长期、基础性的研究,更关注短期回报。
我们可以重新思考,在21世纪,从基础科学到应用研究,再到现实世界产品的这条路径应该如何设计,怎样才能更高效,也更贴合社会需求。
Chuck:这是一个非常特殊的历史节点。过去,大学和科研机构可以依赖相对稳定的政府资助;现在,尤其是在美国,这种支持出现了变化,新的合作模式变得非常必要。
我们把这看作一个机会,各方都在探索新的资源整合模式,像SAIR这样的组织也站出来了,支持杰出的研究者,并与产业伙伴紧密合作。
量子位:AI模型的质量在很大程度上取决于数据。你们觉得,在不同基础科学领域里,数据的多少是否会导致AI落地难度的差异?
陶哲轩:AI在那些高质量数据比较充足的科学领域里,进展往往最快。
一个很典型的例子就是蛋白质折叠。这个领域经过了几十年持续投入,积累了大量经过精心整理的高质量蛋白质数据。
但在其他领域,情况就完全不一样了。比如对单个细胞进行建模,乍一看好像是相近的问题,但我们目前并没有同等质量、同等规模的数据。
AI对数据的依赖程度非常高,远超许多传统科学方法,这是一个真实存在的瓶颈。
有人寄希望于用合成数据来替代真实数据,但如果生成方式不够严谨、标准不够高,可能适得其反。低质量的合成数据会污染原有数据集。
Chuck:我完全同意,而且我也觉得,不同学科之间的难度差异非常大。
如果想在这些领域解决更难的问题,强大的基础模型当然很重要。但正如Terry说的,没有高质量数据,再复杂的模型也会举步维艰。
有一句老话叫“garbage in, garbage out”,在这里体现得非常明显。这也是为什么AI x Science这样的项目如此重要。
在2月10日的活动中,我们把来自不同学科、不同机构的一些顶尖学者聚到了一起。参与者包括来自UCLA、Berkeley、Caltech,以及美国和北美各地高校的研究者。
我们的主旨演讲嘉宾中,还有一位最近获得图灵奖、同时也是强化学习领域的奠基者之一,理查德·萨顿。
我们也在促进跨地区研究者交流。推动AI x Science,离不开全球范围内的共同参与。
量子位:SAIR具体如何支持科学家之间的跨学科、跨国家合作?
Chuck:IPAM(Institute for Pure and Applied Mathematics)和UCLA其实已经在这方面做了很多年,而且做得非常好。IPAM长期以来都有组织跨学科主题项目和工作坊的传统,时间跨度往往很长,参与领域也很广。
我前段时间去新加坡和马来西亚,其实就是参加了一个由OpenMind组织的冬季学术营。OpenMind的创办者也就是图灵奖得主理查德·萨顿,该组织主要面向来自世界各地的年轻研究者。
那次活动的参与者很多都来自亚洲,包括新加坡、马来西亚、中国、菲律宾、韩国等地。大家聚在一起,交流想法,讨论更高效的模型,一起思考AI接下来应该往哪里走。
这种跨地区、跨学科的合作框架,和SAIR希望支持的方向高度一致。
陶哲轩:SAIR今年才刚刚起步,但IPAM已经运作了二十多年。
IPAM最有代表性的活动之一,是为期大约三个月的长期主题项目。在这些项目中,我们会邀请来自不同领域的学生、教师,有时也包括产业界的研究者,围绕一个主题深入交流,比如心脏相关科学,或者自动驾驶。
事实上,我们在深度学习真正大规模兴起之前,就已经办过相关的研讨会。
虽然IPAM并不是一个专门做AI的机构,但它举办了很多在AI相关方向上具有影响力的活动。核心理念,就是把那些平时很少有机会交流的群体聚到一起,比如纯数学家、应用数学家、物理学家、工程师,以及其他科学家。
过去,这种合作更多集中在学术内部。通过SAIR,我们希望把这个模式再往前推进一步,加强与产业界的连接,同时更关注一些中短期内能够产生实际影响的应用。
我自己的背景仍然主要在数学,但现在我们也在更广义地理解数学,把它放进一个连接理论、计算和现实影响的生态中。
我们希望尝试新的形式,探索更多把不同社群聚在一起的可能性。
Chuck:IPAM和UCLA花了几十年时间,打下了坚实的协作基础,而通过SAIR,我们可以把这套模式在地域上、在学术与产业之间进一步扩展
SAIR的核心目标,是基于已经行之有效的基础,把它扩展成一个真正全球化、跨学科,并且紧密连接真实科学问题的合作网络。
量子位:AI for Science的发展,会不会反过来影响今天产业界开发和使用AI的方式?它有没有可能成为一条通向AGI的更优路径?
陶哲轩:我觉得这是一个非常有前景的方向。
在数学和科学中,尤其是在数学里,很多输出是可以被形式化验证的,这给了我们一种约束AI的方式。把AI放进一个可以验证的环境中,这有助于减少幻觉。
如果我们能在数学或科学中,建立起可靠、可验证的AI框架,这些原则是有可能推广到其他领域的。
现在在医学、金融等领域,完全信任AI依然风险很高。你可以把它当作辅助工具,但在涉及生命安全或巨额资金时,很难放心地把控制权交给AI。
如果我们能先在科学领域解决可靠性和验证的问题,之后这些成果就有机会迁移到更广泛的应用中。
Chuck:以金融为例,大多数人并不会愿意把敏感的金融决策完全交给AI;医学也是一样,错误可能直接关系到生死。
正因为如此,AI for Science,以及反过来的Science for AI,才显得尤为重要。
如果我们能在科学环境中打造出真正值得信任的AI系统,我们希望这些进展可以在不久的将来,迁移到那些关键性应用场景中。
陶哲轩:没错。数学和科学为AI提供了一个非常安全的试验场。
如果AI在医疗或金融场景中出错,后果可能非常严重;但如果它算错了一道数学题,最多就是再试一次,几乎没有损失。
这让数学成为一个理想的环境,用来打磨可靠AI的系统。
Chuck:还有一个优势在于,数学研究通常不需要像其他应用那样消耗巨大的算力。这让我们可以更高效地反复实验,用相对较低的成本探索新思路。
陶哲轩:这也是为什么从这里起步。药物研发当然非常重要,但临床试验的成本极高、周期又很长,为了验证一种AI方法就投入数十亿美元是很难实现的。
相比之下,在数学中开发和测试AI,可以更快、更安全地验证想法,再逐步走向那些高风险、高投入的领域。
量子位:有一种担忧是,更高层次的研究能力,比如“品味”,本应建立在扎实的基础训练之上,但AI可能正在拆掉这些年轻研究者的成长阶梯。你们怎么看?
陶哲轩:现在,AI已经能完成很多过去属于研究生或初级研究者训练内容的工作,比如解一些标准问题、做实验中的部分环节、或者整理文献。
这些事情越来越容易被自动化,于是会产生一种诱惑:既然AI更快,那干脆全部让AI来做。
但问题在于,这些看起来重复、甚至有点枯燥的训练,对人的成长非常重要。我自己,包括很多资深研究者的能力,很大一部分就来自这些初级工作。
所以必须有一个平衡。即便AI能做,我们也要有意识地为年轻研究者保留有价值的训练过程。等一个人积累了足够的经验,比如亲手做过一定数量的实验之后,再逐步引入自动化。
Chuck:现在已经能看到一些过度依赖的趋势。大家都知道AI并不能百分之百可信,但很多人还是会第一时间把问题丢给AI,直接要答案或建议,这其实会削弱独立思考的能力。
这也是为什么我们特别强调让顶尖科学家参与进来。像Terry这样的研究者,或者其他诺奖级别的科学家,都是在没有AI工具的时代接受过严格训练的人。
通过建立一种类似“师徒制”的结构,让经验丰富的研究者与有潜力的年轻人紧密合作,能逐步形成更好的实践方式、更好的模型,也包括更好的平台,在支持创新的同时,不牺牲学习本身。
陶哲轩:这里其实也有一个很有意思的历史类比。计算器刚出现的时候,很多人担心学生会不会从此不学基本的算术了。
这种担忧在某种程度上确实有道理,所以直到今天,我们仍然会先教孩子手算加减乘除,再让他们用计算器。
但另一方面,计算器也极大地拓展了人们探索的空间。它让人更容易去试验数字、发现规律、探索原本很难触及的想法。
工具本身并不会自动让人变弱,它同样可以激发探索和创造力。关键在于如何使用。
面对AI,我们也需要做出类似的判断:什么时候该用,什么时候该克制,以及如何把它引入训练体系,同时不削弱那些真正重要的核心能力。
量子位:随着AI逐步替代很多现有的科研流程和技能,未来研究者最重要的能力和特质会是什么?
陶哲轩:未来的科研会越来越多地以更大规模、更多元化的团队形式展开。团队里可能既有学术研究者、产业研究人员、数学家和科学家,也会有AI系统和不同背景的人一起协作。
在这种情况下,如何在大型团队中高效合作,会变成一项非常重要的能力。
过去,人们常把科学描绘成“孤独天才”的事业,但现实里它早就是团队合作,而且这种趋势只会继续加强。沟通能力,以及我们常说的那些软技能,会变得越来越重要。
在这个背景下,“品味”很关键。能够形成整体判断,识别哪些方向值得投入,再借助AI工具或其他合作者把想法展开,这种能力非常重要。
我们很可能会看到比过去更细致的分工。
传统上,尤其是在数学领域,工作方式几百年几乎没怎么变,有时甚至带点“中世纪风格”。一个人要同时负责检查细节、做计算、发展想法、写论文、申请经费、再去做报告。
但在未来,大型项目会由很多人共同完成。有人负责长期愿景,有人擅长和AI工具深度协作,有人负责团队协调,有人负责将其讲给更多人听。
能为数学和科学做出贡献的能力类型,会变得丰富得多。
Chuck:我经常半开玩笑地说自己是个“立志当科学家的人”,很大程度上是因为我有机会和像Terry这样的杰出科学家、数学家长期合作。
我的背景并不在科研,而更多在商业领域。但我听过一些非常成功、打造过数十亿美元公司的人说过,他们见过最优秀的一些prompt工程师,背景并不是工程或计算机,而是会计、法律。
这恰恰说明,未来的科研会变得更加开放。借助AI和新的工具,来自完全不同背景的人,都有机会以有意义的方式参与科研。这也是我们所说的“科学和AI普惠化”的重要内涵之一。
陶哲轩:我现在参与的很多项目,以及SAIR希望支持的方向,本身就已经是高度协作的。它们往往汇集了职业数学家、学生、其他学科的研究者,有时甚至还包括公众参与者。
随着AI和相关工具的发展,从事严肃科学和数学研究的门槛正在降低。这是这次技术变革中,最令人兴奋的一点。
量子位:那是不是意味着,未来连我还在读初中的弟弟,都有可能在《Nature》上发论文?
陶哲轩:这是有可能的(笑)。
未来可能会有论文拥有成千上万名作者,每个人都贡献其中一小块,但都是真实、有价值的贡献。从这个意义上说,很年轻的人参与其中,并不是不可能。
事实上,在数学领域已经出现过这样的例子:有青少年在AI的帮助下,给某个已知问题找到了新的解法。它未必是最重大的突破,但确实是新的结果。
这种情况将来会变得多普遍,但现在还不好说,唯一的办法就是继续尝试、不断探索不同的研究方式。
Chuck:我其实非常希望能看到那样的场景。在过去,如果你没有很强的STEM或工程背景,几乎不可能直接参与前沿科研。
如果来自非传统背景的人,也能以有意义的方式参与科研,并真正对世界产生积极影响,那将是一件非常了不起的事情。
量子位:结合我们前面的讨论,你们能不能举一些更具体的例子,说说SAIR未来会如何支持青年研究者的成长?
Chuck:这是个特别好的问题,说实话,这也是我个人非常投入的一件事。我很多年来一直在做和导师制相关的工作,从大学阶段就开始了。
从我的观察来看,培养年轻研究者,最重要的一点是树立榜样。
人在不同阶段,都会寻找榜样。小时候,在家里看父母;进了学校,看老师;再往后,就会把目光投向更广阔的社会。
这也是为什么我们如此重视把不同领域的杰出科学家聚在一起。每一位创始成员,成功的路径都很不一样。
Barry Barish的科研经历非常有代表性。爱因斯坦在早期论文中就预测了引力波的存在,但从提出这个理论,到实验上真正观测到引力波,中间走了将近一百年。
但直到2016年前后,人类才首次探测到引力波,Barry Barish也因此在2017年获得诺贝尔奖,目前Barry Barish也是SAIR顾问委员会创始成员。这个例子很好地诠释了什么叫几十年如一日。
这些杰出科学家的价值,不只在于他们的成果,也在于他们能够分享自己在不确定性、挫折和失败中是如何坚持下来的。这是导师制中非常重要的一部分。
年轻科学家并不缺天赋,只是刚刚起步。所以我才会如此重视和Terry、以及整个创始团队一起做这件事,因为现在最需要支持的,恰恰就是这些年轻人。
Terry是独一无二的,但如果借助AI和更好的培养渠道,未来能不能不只有一个陶哲轩,而是10000个陶哲轩?这难道不是件非常令人兴奋的事吗?!
陶哲轩:是的。SAIR只是众多尝试中的一种,它不可能包揽所有事情。支持下一代研究者的需求非常广泛,没有任何一个组织能独立完成培养整个科研队伍的任务。SAIR能做的,是专注于少数有针对性的项目。
以IPAM为例,我们可以支持暑期学校、研讨班,以及面向公众的科普和交流活动。一些协作式、众包式的研究项目,本身就会自然地吸引年轻研究者参与,有些情况下,他们甚至可以承担领导角色。
我们希望,SAIR能够对其他组织产生启发,让更多机构也愿意站出来,在支持下一代科研人才这件事上承担起重要责任。
陶哲轩如何用AI?
量子位:接下来我想把话题转到数学上。Terry,您最近在做些什么?有没有哪些方向是您现在特别感兴趣的?
陶哲轩:我现在大概有一半时间,仍然花在比较传统的纯数学研究上,也就是我过去23年里一直在做的那类工作。比如研究数字中的模式,理解高度结构化、周期性的函数和非常随机的函数之间有什么本质差异,以及研究一些偏微分方程,比如来自流体力学的方程。
不过在这些方向上,我现在越来越多地把一些最前沿、最技术性的推进交给更年轻的合作者来完成。相应地,我自己研究中的一个越来越重要的部分,开始和新技术联系在一起,尤其是“如何做数学”“如何协作做数学”的新方式。
我目前非常感兴趣的一个方向是形式化,也就是不再只依赖纸笔证明,而是把数学写成计算机可以理解和自动验证的形式化语言。这会深刻改变协作方式。它不仅让我们可以和AI系统一起工作,也让我们能够和很多并不认识的研究者协作。
在过去,如果一个陌生人给你发来一份证明,你很可能会对它是否正确保持怀疑;但如果这份数学内容是用可形式化验证的语言写成的,这种顾虑基本就不存在了。
借助这些方法,我们已经能在一些项目中实现几十人的协作,有时甚至五十人以上,而且其中很多人彼此从未见过面。大家可以一起解决那种单靠个人几乎不可能完成的大问题。
我们也在尝试把AI当作证明助手来使用,同时借鉴现代软件工程里的很多理念,比如用GitHub做版本控制、进行单元测试、做质量检查等等。
从某种意义上说,我正在学习软件工程的工具,并把它们引入到一种可以称为“数学工程”的实践中。
对我来说,这一切都更像是一系列实验。并不是每一次尝试都会成功,但即便弄清楚什么行不通,本身也很有价值。
量子位:感觉您一直都很愿意把新技术引入自己的研究流程。距离你上一次接受Lex Fridman采访已经过去半年了,这段时间里,你对AI的看法有变化吗?
陶哲轩:整体来看,变化不大。但有一点出乎我意料,AI在数学方向上的进展,比我原先预期的要快一些,当然,距离真正成熟还有很长的路要走。
变化更明显的,其实是整个学术社区的态度。我开始看到越来越多的同事接受这样一个事实:AI不会消失,它会长期存在下去。大家对尝试不同使用方式的开放度,也明显提高了。
不过,现在仍然缺少一个被广泛理解和认可的中间态。很多时候,感觉只有两个极端选择:要么几乎什么都用AI,要么就完全不用。
真正理想的情况,应该是混合式工作流——大部分研究仍然用传统方式完成,但把某些环节有意识、有控制地交给AI。目前我们还没有真的找到那个最合适的平衡点。
我经常拿互联网来类比。互联网非常有用,但我们并不会用它来做所有事情。我们仍然会选择线下见朋友,而不是永远开视频会议;但在某些场景下,比如现在这样的对话,互联网又恰到好处。
经过多年,我们逐渐学会了什么时候、怎样用好互联网。我觉得,对AI来说,我们还正处在摸索这种平衡的过程中。
量子位:Terry,您是世界顶尖的数学家之一,也和很多一流数学家长期合作。你们在日常研究中,具体是怎么使用AI的?
陶哲轩:其实挺日常的。我主要把AI用在一些偏辅助性的事情上。比如做文献检索,如果我一时想不起某个数学结论的具体形式,或者它和另一个结果之间的关系,我就会直接问AI。再比如需要快速画个图、做个简单可视化,也会让AI来帮忙。
在和文字相关的工作上,我用得更多。写作时我几乎一直开着自动补全。有时候我会先把一篇论文的结构分成五步,自己写完前两步,后面几步就让AI帮我起草一下。
以至于现在,如果我在飞机上、没法用AI写东西,偶尔还会下意识地想:“怎么还不帮我把这句话补完”,然后才反应过来AI不在。
如果有人给我发来一段很长的论证,或者一篇论文,我也常常先让AI帮我总结一遍。在这些方面,它确实是一个非常好用的工具。
但在真正做深度思考的时候,比如我在努力解决一个很难的研究问题时,我基本不会用AI。这种时候我还是更依赖纸和笔。
我也尝试过直接和AI一起推研究级别的问题,但目前的体验并不理想。它给出的建议往往比较套路,有时还会打断我的思路。不过,在围绕科研的那些辅助环节上,AI已经变得非常有价值了。
量子位:过去一年里,有没有出现什么新的Aha-Moment?
陶哲轩:有的,通常是在一个问题上想了好几个月,突然有一天意识到:“哦,原来这么简单,我怎么之前没想到?”
在这之前,你往往已经试过很多条路,有时候八种、九种方法,全都走不通。但正是这些失败的尝试,一步步把不可能的方向排除掉,最后只剩下一条真正可行的路。等你终于看到那条路时,回头看就会觉得它显而易见。
这种时刻常常伴随着一种错觉,好像之前那些尝试都是在浪费时间。但实际上,正是不断试错、不断排除,才让你真正理解什么方向行得通。我自己的数学“顿悟”,到现在基本还是这样产生的。
AI目前还做不到复现这种过程。它确实能提出很多想法,但这些想法往往显得比较随机,也看不出它能像人一样,从失败中逐步学习、调整方向。到现在为止,我还没能真正用AI来直接解决研究级别的难题。
不过,一旦我已经有了清晰的思路或者解法,AI就会变得非常有用。它可以帮我把结果写出来、和已有文献建立联系、生成代码,或者在某些数学环节上提供计算支持。
从这个意义上说,它非常有价值,但更多是一种互补工具。它在支持我的工作,而不是替代我最在意的那一部分。
我觉得总体来说,人们更倾向于把AI用在自己不太享受的那些任务上,而把真正喜欢做的部分留给自己。对我来说,数学问题本身就是我最享受的事情,这也是我做数学的核心动力,所以这部分我还是会亲自来。
但有些事情,我就非常乐意交给AI。比如在文献中查找,有没有人以前用过类似的方法,或者在成百上千篇论文里筛选出相关工作,这对我来说就是一个非常理想的AI使用场景。再比如一些又长又繁琐的计算,也很适合交给AI。
当然,这件事因人而异。不同研究者享受的环节不一样,而AI本身又是一个非常宽泛的工具。对一个人来说特别有用的功能,对另一个人可能就没那么重要。所以也谈不上什么“最好的模型”或“标准工作流”。
关键还是看你希望AI帮你做什么,以及你更愿意把哪些事情留给自己来完成。
量子位:数学曾经从其他学科中汲取养分。这次,数学已经从AI身上学到了什么,或者未来可能会学到什么?
陶哲轩:有一件事我自己正在大量学习,那就是软件开发。未来的数学,可能会越来越像今天的软件开发。
如果回到五六十年前,软件往往是由一个人独立完成的:一个人写代码、测试、调试,所有事情都自己来。
但今天,软件开发已经变成了一整个成熟的行业。有人专门写代码,有人做UI,有人负责质量控制,还有一整套成熟的工作流、工具和最佳实践,还有大量踩坑经验。
数学正在开始向这个模式学习,包括它成功的地方,也包括它失败过的地方。
传统上,数学和物理学的联系非常紧密。但现在,我们越来越多地和生命科学、社会科学等领域发生互动。这些领域的问题往往更复杂、更混乱,方程没有物理里那么干净,而且对数据的依赖也强得多。
从这个角度看,AI可能非常适合处理这类复杂、嘈杂,不那么容易被形式化的问题。
我觉得,我们正在进入一个更加跨学科的时代。数学不再只是和物理对话,而是几乎所有学科都在彼此交流,而AI正是推动这种跨学科互动的重要力量之一。
量子位:所以你现在也算是在“做软件”了,对吧?
陶哲轩:某种意义上是这样。我现在参与的项目不少,但越来越多时候,我更像是在做项目管理。真正去证明定理的,往往是其他合作者,而我更多是在协调整体工作,把不同部分拼接起来。
这是一个挺有意思的角色。在一些项目里,我并不是主要的“解题者”,而是负责组织、推动,让每个人都能把自己的能力发挥到最好。事实证明,这样的方式在科研中也可以运转得相当不错。
量子位:AI不仅降低了做数学的门槛,看起来也在降低你刚才提到的很多其他领域的门槛,比如编程、物理和医学。AI有没有促使你对其他学科产生兴趣?
陶哲轩:非常明显。有一件让我自己都挺意外的事情是,我现在合作的人,背景比以前多样得多。
十年前,我几乎只和数学家合作,偶尔会和统计学家或电子工程师一起做点事情,也就到此为止了。
但现在,我在和来自各个领域的人合作,尤其是产业界的人,比如Chuck这样的伙伴。真的有一种感觉,大家都开始彼此对话了,而且在这个过程中互相学习。
其他学科的研究者,往往能从更偏数学的思考方式中受益;而数学家也能从更贴近现实世界的视角中学到很多东西。
之所以能做到这一点,很大程度上是因为我们现在有了很多工具,其中不少是由AI驱动的,它们帮助我们理解彼此的语言和工作方式,让合作变得更顺畅、更高效。
我觉得这是当下这个阶段真正令人兴奋的地方之一:学科之间的壁垒正在降低,我们开始学会用过去很难实现的方式一起工作。
量子位:和背景差异很大的人一起工作,感觉怎么样?
陶哲轩:我其实非常享受这种状态。当然,我也想先说清楚一点:深度领域专家永远都有不可替代的位置。那种在非常狭窄的子领域里做到世界顶尖的人,我们依然非常需要,这一点并没有改变。
变化在于,这些专家现在可以和另一类人更紧密地合作,他们也许不专精于某一个具体领域,但擅长把不同学科的想法串联起来,看到整体图景。
这几年里,我自己学到了很多原本完全不在我训练范围内的东西,比如生物学、经济学、政策、科研资助机制等等。有些内容确实出乎意料,有时也挺有挑战性。
但我也发现,数学里的一些核心观念,能以一种很自然的方式迁移到其他领域,尤其是关于验证、严谨性和清晰思考的那一套方法。
对我来说,这是一段持续学习的过程,而且我真的很享受。我觉得,在新的科研环境里,那些愿意保持开放心态、乐于跨学科沟通、也不怕学习新“语言”的人,更容易如鱼得水。
Chuck:Terry刚才说的,其实正好呼应了我们之前聊到的“技术普惠化”,尤其是AI。借助现在的技术,也包括SAIR在做的事情,我们正在把来自非常不同领域的一流人才聚到一起。
当你拥有这样一个网络时,事情会变得容易很多。不只是更容易发现真正有挑战性的问题,也更容易迅速判断,谁是最适合来解决这些问题的人。有时候,这些人已经手里有一部分答案;有时候,他们能立刻把你引荐给更合适的合作者。
在我看来,这种高效连接问题和人才的能力,就是“AI普惠化”在现实中的一个非常具体的体现。
陶哲轩:从传统上看,科研往往是围绕学科来组织的,比如数学系、物理系、经济系等等。这种结构,自然会让数学家主要和数学家交流,物理学家主要和物理学家交流,真正的跨学科合作并不常见。
我对SAIR抱有期待的一点在于,它在一开始就刻意聚集了一群背景和兴趣都非常多元的人。这种设计本身,就更容易促成一些在传统体系里不太容易出现的连接。
通过降低制度层面和学科层面的壁垒,我们有机会推动那些原本很难发生的合作。
AI时代,高校需要新的培养方式
量子位:Terry,你刚才提到传统高等教育,正好也是我接下来想聊的话题。Chuck,在AI时代,你觉得哪些能力对大学生更重要?
Chuck:这些年我做过不少学生的导师。我的感受是,即便是博士生,真正长期、密切合作的导师数量也很有限,通常三到五位,多一点可能也就十位左右。这其实会限制他们接触到的视角范围。
但现在情况正在发生变化,尤其是在AI x Science这样的方向上。我们可以更容易地把不同类型的专业能力汇聚到一起。这类问题天然是跨学科的,而AI让来自不同背景的大规模协作变得可行。
在这种环境下,有一项能力会变得格外重要,那就是批判性思维。很多人喜欢谈“提示词工程”,但在我看来,提示词工程本质上就是另一种形式的批判性思维。
你得清楚自己要解决什么问题,如何把问题表述清楚,以及你真正想要什么样的答案。如果这些想不明白,AI其实也帮不了你太多。
所以,清晰思考、提出好问题、抓住问题核心,这些能力依然非常关键。
与此同时,AI也在降低非传统STEM背景人群的参与门槛。我自己就是一个例子,我并没有接受过系统的科研训练,背景更多在商业领域。
但借助AI,我依然可以有意义地参与科学讨论,理解一些核心思想,并做出贡献。这种体验非常有力量。
未来并不只是STEM和非STEM的区分,而是让不同技能结构的人,用不同方式参与进来。这正是AI x Science和SAIR如此重要的原因。
陶哲轩:事实上,对科学感兴趣、希望参与其中的人,远远多于接受过正式科研训练的人。而AI正好扩大了能够参与科研的人群范围。
未来的科学发展,并不只取决于技术能力,尽管技术依然重要。组织能力、沟通能力、与他人协作的能力,正在变得越来越有价值。
但同时,是否具备整体视野,知道哪些问题值得投入精力,以及什么时候该用技术、什么时候该克制,这些也非常重要。
量子位:现有的大学体系已经存在了很长时间。如今有了AI,很多人都觉得一场大的变革正在到来。你们觉得高等教育应该如何去适应?
陶哲轩:这是个非常棘手的问题。说实话,我希望我们能有更多时间,来慢慢想清楚这些事。但现实是,我们只能“边走边想”。
已经能看到一些令人担忧的现象。有些学生过度依赖AI,成绩看起来很好,但实际上学到的东西并不多。
也有一些学生坚持完全用传统方式学习,几乎不用AI。他们往往理解得更扎实,但在效率和结果上,可能又会落后于那些大量使用工具的同学。
所以,很明显需要重新找一个平衡点。学校必须教会学生如何负责任地使用AI,也要让他们知道在什么时候不该用。
我觉得,未来会更多地转向小组项目和协作式学习,这本身也更贴近科研和产业的真实形态。
另外,课程之间可能需要更紧密地整合。现在的教育体系,往往把知识拆分成一个个相对孤立的专业模块。将来,也许需要一种更整体的结构,更强调通用的问题解决能力。
过去,学生是在作业、考试、以及和难题死磕的过程中,慢慢学会如何学习、如何面对失败、如何承受压力的。到目前为止,我们还没有为这些能力找到一个结构清晰、系统性的替代方案。
大学眼下不得不被很多现实的问题牵着走,比如维持日常运转、保障研究生经费、平衡预算等等,很难真正停下来,从零开始重新设计教育体系。
从历史上看,我们也并不是第一次面对这种冲击。计算机普及的时候,教育变过一次;互联网出现后,又变过一次;维基百科刚出现时,也有一段时间,学生直接复制粘贴内容交作业。
后来大家发现,解决办法并不是彻底禁止新技术,而是教学生如何正确使用它,把它当作起点,而不是终点。
我觉得AI也是类似的情况。它可以成为探索和研究的一个起点,但不能替代思考本身。学生不能只是向AI要一个答案,粘贴进作业里。
高等教育真正的挑战,在于如何找到那个平衡点:一方面充分发挥AI的优势,另一方面又不牺牲深度学习和真正的智力成长。
Chuck:往往产业界的变化比学术界要快。在AI时代,这种差距变得越来越清晰。而这正是SAIR Foundation看到的机会所在——把学术界和产业界拉到一起,让双方相互学习。
从我和创业者打交道的经验来看,他们有一个非常共同的特质:强烈的问题导向。不管问题有多难,他们都会盯着“怎么解决”,并且愿意为此付出一切努力。
这种心态,是我希望高等教育能够更多吸收的,尤其是在AI已经成为核心工具的背景下。大学的培养模式应该随之调整,让学生学会如何用AI去解决真实世界的问题,而不只是掌握一块块割裂的知识。
还有一个绕不开的大问题是成本。在很多发达国家,尤其是美国,高等教育极其昂贵。一些顶尖大学,一年的学费加相关费用接近10万美元,四年下来就是40万美元。
如果这种趋势继续下去,尤其是在AI已经提供了获取知识和技能的新路径之后,人们自然会开始质疑:大学学位到底还值不值得?
这也是为什么,让教育与产业更紧密地对齐变得如此重要。我们需要更清楚地知道,社会真正需要哪些能力,以及大学该如何调整自身的培养方式来回应这些需求。
在接下来的一系列项目中,我们会把产业界和高等教育的负责人同时请到一起。我们正在组织一些圆桌讨论,邀请来自宾夕法尼亚大学、南加州大学、UCLA等高校的代表,坦诚地讨论课程体系和培养模式应该如何演进,以应对这些挑战。
另外,我对像OpenMind这样的组织印象很深。我们也在思考,是否可以做类似的实验。通过SAIR,联合IPAM和UCLA,我们正在探索举办更密集的项目,比如暑期学校。
这种形式的好处在于,它能让我们更快地迭代课程内容,不必受制于传统学期制度,同时也更贴合AI发展本身的节奏。
量子位:最后一个问题。Terry,如果未来真的实现了AGI,它的数学能力全面超过人类,我们还有必要学数学吗?
陶哲轩:AGI本身其实是一个非常模糊的概念,不同的人对它的理解差别很大。
我举个例子,交通工具。过去,人们靠走路、骑马出行;后来有了汽车和飞机,效率远远高于步行。但我们并没有因此就不走路了,并不是因为必须这样做,而是因为喜欢,或者因为这对身体有益。
科学和数学将来可能也会是类似的情况。即便有一天,借助AGI,科学发现的速度远远快于人类单独完成的速度,人们依然会想亲自去做科学、做数学。
它可能会更多地变成一种手艺、一种爱好,或者一种出于兴趣、好奇心和自我满足的智力活动。
同时我也相信,无论AI变得多么强大,人类都会以不同于机器的方式继续创造价值。
人类学习和推理的方式,与AI非常不一样。AI可以通过海量数据和计算得出结论;而人类有时却能在极少的数据、极低的计算量下,做出相当不错的判断。这种能力,很可能在未来依然重要。
科研的规模和方式,可能会发生巨大变化。今天,一个研究者通常一次只解决一个问题;未来,也许可以同时推进成千上万、甚至上百万个问题。由人类把握少数关键方向,AI来填充其余部分。
我们现在还没到那一步,但这是一个合理的演进方向。即便在那样的未来,学习数学依然有意义,只是它的角色和目的,可能会和今天非常不一样。
本文来自微信公众号 “量子位”(ID:QbitAI),作者:Jay,36氪经授权发布。