首页文章详情

两位95后创立光计算芯片公司,研发全球首颗存算一体光芯片

36氪VClub2025-07-22 10:22
弯道超车电芯片。

作者 | 吴若瑜

编辑 | 彭孝秋

2022年,两个未满30岁的年轻人:一个关掉美国公司、一个暂停牛津大学读博,双双回国创办了一家叫“光本位”的公司。

如今三年时间过去,光本位完成了全球首颗算力密度和算力精度达到商用标准的光计算芯片流片,成为全球唯一一家实现存算一体,并将128*128矩阵规模光芯片集成到单颗晶粒上的光计算芯片公司。

关掉美国公司的是光本位联合创始人&董事长熊胤江,现在负责运营与商业化,他是芝加哥大学硕士,具备多年大模型算法与 AI agent 的工程化实战经验;暂停读博的是光本位联合创始人&CEO程唐盛,现在负责研发攻关及工程化落地,程唐盛曾师从全球“相变材料光计算”第一人、英国皇家工程院院士Harish Bhaskaran。

光本位两位联合创始人,左为熊胤江、右为程唐盛

熊胤江和程唐盛之所以孤注一掷想要创业,是因为他们对光计算领域的创业机会已关注多年,在创业前他们已完成3×3、4×4等小矩阵芯片的流片与应用验证,积累了流片、设计、材料等全流程经验。2022年AI需求爆发,利用光的速度和优势革新芯片制造,或许能够真正突破摩尔定律,解决算力焦虑,他们觉得最好的时机到了。特别今年以来,随着大模型和生成式AI的进一步兴起,行业对算力的需求极具膨胀。不单是模型训练本身,后续的实践推理阶段,都使得能源消耗更高。

据国际能源署发布的《能源与AI》报告显示,2024年,全球数据中心消耗约415太瓦时电力,占全球用电量的1.5%。预计这一数据到2030年,全球数据中心的电力消耗会增加一倍以上,达到约945太瓦时,将超过当前日本的总用电量。

同时,芯片的算力与其所容纳的晶体管数量直接挂钩,目前光刻工艺3纳米,已接近原子物理极限0.3纳米,电芯片在制程上想要进一步提升算力性能,只能通过堆叠等先进封装延续摩尔定律。但也只是勉力支撑,无法长久解决能源消耗与算力供需的矛盾。

2017年以来牛津大学和MIT对光计算相关的学术讨论引发国内外关注,人们发现除了平地起高楼式的堆叠芯片晶体管,光芯片能够光学技术进行信号处理,拥有比电芯片高1000倍以上的算力提升潜力,并且能耗更低,宽带更大。

近几年,除了政府、资本市场和算力生态企业关注光计算芯片的进展,海内外也出现了多家光计算芯片公司。光本位就是在这种背景下成立,其专注研发基于硅光+相变材料(PCM)异质集成的光子存内计算芯片。

从实验室到商业落地

推动光计算芯片从实验室走向产业应用,需要攻克两大核心关隘:一是如何将光从光纤尺度微缩至芯片尺度;二是在完成尺寸微缩的同时,保留芯片处理复杂计算任务的能力,确保其能满足大模型、智算中心等场景的实际需求。

光本位的破局,始于对入场时机的精准判断。“2017年,光计算芯片虽凭借诸多优势引发关注,但彼时国内外Fab制造、封装工艺等产业链环节尚未成熟,尤其是芯片封装等关键工艺的短板,让光计算芯片商业化落地难以推进。”光本位联合创始人&董事长熊胤江说。

到2022年,AI爆发加上整体产业链逐渐走向成熟,恰恰需要设计公司下场,主动向前一步,通过需求牵引推动生产链加速迭代,为商业化落地按下快进键。因此,光本位选择在此时入场。

与技术公司的常规节奏相比,光本位的产品化进程推进速度明显更快。

公司成立后,快速完成16x16、25x25等矩阵规模的迭代。2023年做到了64x64矩阵规模的流片,并在次年6月完成了128x128矩阵规模的突破。

128*128矩阵规模光计算芯片

但128×128矩阵流片,仅是触摸商业化门槛的第一步。“单纯卷矩阵数值建不起护城河,很多方案的节点是固定值,只能用于特定计算,无法适配不同模型。”熊胤江强调,光本位芯片的价值,还在于打造了首个“16000 + 节点且每个节点完全可调”的架构。

对大模型等场景而言,128×128是当前模型分拆“经济可行”的规模,而节点的实时可调性,让芯片能适配任意模型的参数变化,为矩阵运算的可编程性打开了关键空间——这正是光计算芯片从科研走向商用的核心标志。

支撑这一突破的,是光本位对技术路线的独特选择:硅光+相变材料的异质集成以及独有的Crossbar光子矩阵计算结构,它给出了“尺度微缩”与“算力能耗平衡”两个问题的核心解法。

Crossbar技术路线演示

“传统的纯硅架构可编程计算单元尺寸大,在标准芯片面积上最多放置数百个单元,标准GHZ主频下算力仅为个位数Tops,远无法满足AI的需求。更重要的是,纯硅材料在计算中需24小时持续供电维持状态,这部分功耗占到了系统总功耗的70-80%,对散热提出了很高的要求,也与算力需求爆发的时代趋势背道而驰。”熊胤江介绍道。

通过研究,光本位利用相变材料将单元尺寸缩小至传统方案的1/10-1/20,可容纳的矩阵规模提升至10-20倍。关于AI芯片的能耗问题,光本位在设计阶段也做了优化。

如今,基于硅光+相变材料异质集成的芯片只需要极低能量单次脉冲即可完成参数刷新,且因相变材料的非易失性特性使得无需持续能量维持状态,达到接近0功耗。

此外,基于PCM相变材料的储存功能,光本位完成了存储单元与计算单元的融合,实现存算一体的存内计算,进一步缓解储存压力,提升芯片性能。

光芯片,怎么卖出去?

进入商业化阶段,对技术公司的要求更加务实。当前光本位面向的两类云侧场景客户群体,诉求差异显著却各有清晰指向。

以互联网大厂为代表的终端需求方,也是算力生态的“终局战场”。这类客户自身拥有成熟的算力集群与大模型研发能力,对他们而言,若光计算芯片能在能效比、算力密度等核心指标上有大幅的超越,即使前期投入较高,也具备明确的商业合理性。并且,模型迭代速度快,需要硬件走在“软件之前”,兼容新一代软件生态。

另一类云侧场景客户是政府主导的智算中心,其需求相对标准化,更看重项目的经济效益。两类客户的诉求差异,本质上是技术价值在不同场景下的具象化,恰恰构成了光计算芯片从技术验证走向规模商用的完整市场坐标系。

光本位正在研发的光电融合计算卡可采用PCIe接口或其他通用标准进行数据交互,可以即插即用,并提供便于兼容的上层应用接口与生态,具备高能效比、高算法灵活度,适配不同的应用场景。

“未来我们的产品也会在端侧场景进行验证,云侧和端侧之间的客户需求差异就更大了。云侧场景的核心需求是高能效比与算法灵活度,需重点投入软件生态构建,针对性优化硬件与算法的适配性;端侧场景则强调稳定性,尤其车规级应用需应对极端温度等复杂环境,对硬件可靠性要求更高。”光本位联合创始人&CEO程唐盛补充道。

完成初步封装的光子AI计算demo硬件

目前,光本位同国内一线互联网大厂、GPU厂商、智算中心、高校等达成合作,等待进一步的应用验证,同时与卫星厂商、通信运营商、光模块厂商等围绕应用展开深度技术交流。

封装测试方面,光本位早早建立与Fab厂商的合作,联合厂商研发先进封装工艺,推动技术迭代。今年光本位将完成128×128矩阵光计算芯片和电芯片的合封与测试,形成第一代光电融合计算卡,同时推进256×256矩阵光计算芯片的流片,预计2026年更具竞争力的第二代光电融合计算卡将面世。

在新品面世之际,光本位于今年6月再次完成新融资,由敦鸿资产领投,浦东科技天使母基金、苏州未来天使产业基金、张江科投等国资基金跟投,老股东中赢创投再次加注。其中,中赢创投致力于挖掘和培育新时代具有巨大竞争潜力的硬科技领域初创企业,管理资金来源于中赢创新集团自有资金,总规模达20亿元人民币,是循环投资的常青基金,其在光本位早期便前瞻性地参与投资,并多次加注。

事实上,光本位2024年也完成过两次融资。一次是在3月,完成了天使+轮融资。另一次是同年12月,完成了由锦秋基金领投的融资,老股东中赢创投、慕石资本、小苗朗程均超额跟投。

后摩尔时代,要想实现光计算芯片的弯道超车,推动芯片“从 Demo 到产品级”的全流程突破,就需要啃下光计算先进封装的硬骨头,搭建起相关产业链。

首页图源|企业供图

排版|刘思雅

本文来自微信公众号“硬氪”,作者:吴若瑜,36氪经授权发布。