逐际动力创始人张巍:不跟风、不内卷,我们在「造新物种」
过去的2025年,什么赛道最火?
毫无疑问,具身智能。
根据投中嘉川数据,2025年全年,具身智能领域共有168家企业获得融资,融资规模共计329亿,同比大涨291%。资本的热度烧到了2026年,仅在开年的一个月内,国内具身智能领域又披露了近20起融资,金额在数亿人民币的屡见不鲜。
2025年,“具身智能”作为前瞻布局的未来产业,被写入“十五五”规划建议中,其明确提出推动具身智能等成为新的经济增长点。近日,工信部表示以人形机器人为小切口带动具身智能大产业发展。
然而,繁花似锦中,“寒冬论”、“泡沫论”悄然滋生。技术路线未收敛、商业路径难闭环、应用场景找不到,再配合上高昂如天价的企业估值……“2026下半年”成为不少行业人士心中的“具身智能寒冬”。
当然也有例外。
“那当然不了,这咋寒冬啊?我不认为2026年是什么寒冬,反而是具身落地的元年。今年会有各种细分场景的POC(Proof of Concept)验证,跑出来的27年会规模化起量。”逐际动力创始人张巍告诉36氪。
是的,在所有具身智能创业公司中,逐际动力始终是极特别的玩家。
年初,中共中央政治局常委、国务院总理李强广东调研期间,逐际动力就是受邀参与的企业之一。在现场,创始人张巍向李强总理展示了其人形机器人Oli上下楼梯,直观体现了他们“小脑基础模型”与“大小脑融合技术”的底层创新。
不到两周后,逐际动力将这项技术正式发布,并命名为“具身智能体系统LimX COSA”,是面向物理世界原生的Agentic OS。
逐际动力具身智能体系统LimX COSA
如果要打个比方,COSA相当于人形机器人的“智能神经系统”,它通过融合认知与运动控制,让机器人能像人一样边思考边行动。
张巍认为,“26年是去掉遥控器、人形场景落地元年,Agentic OS是关键”。而且他觉得“行业应该从关注单一模型能力转变到关注Agentic系统能力”,在这个路径上逐际动力做了原创突破。
与COSA同样“让人眼前一亮”的是逐际动力于去年12月发布的多形态具身机器人TRON 2。
在日趋同质化竞争的具身智能领域,TRON 2是特别的——它几乎跟市面上所有机器人都不一样,基于同一个机器人底座,TRON 2能够实现双臂、双足、双轮足三种构型的快速切换,并支持人形、四足等形态重构,极大程度榨干了具身智能机器人的通用性,堪称“买一送五”,大大降低了机器人场景落地探索的门槛。
TRON 2-具身机器人通用基座:一个本体,多种形态
不少网友说,这是具身智能机器人中国原创的代表。
从TRON 2到COSA,无论从哪个角度看,逐际动力都是一家对“原始创新”有着近乎偏执追求的企业,它胆子够大,敢于做只有极少数人敢押注的技术创新,对于打破边界有着异乎寻常的执着,拒绝一切“跟风”与“内卷”。
这周,逐际动力刚宣布完成B轮融资,吸金2亿美金,阿联酋Stone Venture、京东、东方富海等知名机构参投,老股东上汽、蔚来资本、明势创投等继续加码,是2026开年以来具身智能行业最大融资。
在这个节点上,36氪与逐际动力创始人张巍进行了一次深入交流。
与通常倚重技术的“教授型创始人”不同,张巍对于科技行业的真实商业逻辑有着深刻的理解,对于产品、竞争以及行业发展态势,都有着独到的解读。他乐观,幽默,对于“原始创新”与“改变世界”有着异常的坚持——这也是逐际动力团队所共享的底层基因。
在这次访谈中,张巍不仅分享了逐际动力TRON 2与COSA在“通用机器人”赛道的探索,小脑基础模型与大小脑融合技术的最新突破,更分享了其在2026年看好的两大具身操作技术变量(第一视角视频数据、后训练),并回应了不少业内关注度极高、又充满争议的问题:
2026年是不是具身智能的“寒冬”;业内的“巨大订单”能不能持续;具身智能的护城河在哪里;具身机器人公司做什么最有价值等等。
以下为访谈QA实录(Q:36氪,A:逐际动力创始人张巍)。
“重新定义机器人”
Q:逐际动力最新发布的COSA被称为“人形机器人自己的智能体系统”,这个概念是怎么定义的?
A:COSA的全名是Cognitive OS of Agents,就是用Agent的方式做给机器人用的OS系统,管理机器人身上的模型、技能、记忆、甚至情感,让它在真实世界“主动思考、自主干活”。
拿我们演示中人形机器人Oli“取水”这个任务来看,机器人在收到指令后,即使动作被新任务打断,它也能自动判断优先级,经过“思考”后,先完成取水,再去拿快递,在“大脑+小脑”能力结合下,自主完成。
搭载COSA的全尺寸人形机器人Oli完成移动操作,把两瓶水递给客人
Q:对于具身智能行业来说,COSA这种Agentic OS意义是什么?
A:26年行业会从关注单个模型能力,到关注具身Agentic系统能力,这是一个从技术demo为主导转变为以产品体验为主导的关键一步,我们率先迈出了这一步。我认为未来的操作系统(包括手机、计算机)都会升级为agentic的,而人形的OS一定必须是Agentic原生的。COSA就是为人形机器人设计的Agentic OS。
Q:做好COCA需要什么技术栈,有什么壁垒?
A:小脑基础模型,记住是“基础模型”,不是一个一个policy。不能是一个一个预先编好的动作舞蹈,而是要做到实时生成任意全身动作,这是整个系统的基石。
大小脑融合的高阶技能层,打通导航、避障、移动操作、上下楼梯等复杂行为和全身运控基础模型间的对齐,真正让大脑能力触达物理世界,这是运动智能与认知智能之间的桥梁。
具身智能体技术,以Agent原生理念来设计、调度、融合、管理所有模型、技能、工具、记忆、人格、情感等,实现自主思考能力。
Q:你提到的“小脑基础模型”和“大小脑融合”指的是什么技术?
A:所谓小脑基础模型,是一种能够实时生成运动指令的模型。现在行业里常见的运动控制,比如跳舞、翻跟头,通常都是靠预编程或预先训练好的策略,就像一个死记硬背台词的演员,一旦中间被打断,整个动作就会失败。而小脑基础模型不同,它是实时的运动生成系统,你可以随时指挥它做任何动作,即使是它从未“学”过的,机器人也能执行。
这是支持未来部署VLA模型在人形机器人上最重要的能力之一。VLA要在人形机器人上通用的话,必须得有一个小脑基础模型,运动不能是事先编程好的。比如大脑说我想去抓杯子,这个运动之前没见过,它就还得重新再训练一遍,这肯定不行。大脑想要什么动作,小脑就应该能实时执行什么动作。
全尺寸人形机器人Oli全自主捡网球
Q:最近逐际动力的另一个机器人TRON 2的关注度也很高,它的“底座”形态非常特殊,为什么选择这样的形态?
A:你看市面上的机器人,无非是轮式、双足、机械臂或是机器狗,TRON 2是全新的一个品类,就像机器人里的基础模型,你可以叫它Foundation Robot。它能适配各种场景:要单臂还是双臂?要移动底盘、腿足还是轮式?它作为具身机器人通用基座,通过更换不同的末端执行器,就能组合出你需要的形态。
TRON 2发布之后,国内外的反响也很激烈,甚至引发关于中美竞争力的讨论。TRON 2很可能是极少数由中国公司定义的一个全新的机器人品类。
我个人认为,如果需要不同形态的机器人,一个TRON 2这样的基座就能满足了。
Q:TRON 2的设计看起来跟市面上的机器人都不一样,为什么要做成这样?
A:因为我们想解决一个很实际的问题——探索场景的成本太高了。你看现在大家都想找具身智能的落地场景,但你要探索一个场景,可能得买一台轮式的、一台足式的、再加个机械臂,大几十万就出去了,试完发现不行,钱却花了。TRON 2的逻辑是“一个基座,多种形态”。你想试物流,装双臂;想试复杂地形,换成腿;想跑得快,上轮足。形态多样,但核心能力是复用的,你不用每次都买一整套新的,拼一拼就能适配新场景。而且它不是那种“只能演示”的样机,负载够大,真的能干活。我们希望它成为大家探索场景的“标配工具”——你拿着它,就可以去真实环境里验证场景。
TRON 2双臂形态超强负载
Q:行业里这么多形态的机器人,为什么还要再做一个新的,确实有必要吗?
A:我们反而不纠结形态,而是关注“这个问题应该怎么解决”。你看现在行业里,很多产品长得都差不多,大家都在卷参数、卷价格。但我们觉得,如果中国具身智能想真正领先,不能一直跟着别人的路线走,得有人去定义新的东西。TRON 2 就是这个思路的产物。我们没有去抄一个现成的品类,而是从实际需求出发,重新想“机器人应该长什么样”。最后做出来的东西,确实跟别人都不一样。
对我们来说,创新不是为了标新立异,是因为老路走不通。中国要在这个领域领先,靠跟风和内卷是不可能的,需要敢做不一样的事。
“靠PPT融不到资了,那不叫寒冬,那叫回归正常”
Q:2025年国内具身智能产业融资金额超过了200亿元人民币,同比飙升了400%。市场这么热,逐际动力在选择投资人方面会有什么倾向?
A:在产业链和场景方面有赋能的投资人。我们接下来会开始和Stone Venture在中东部署机器人,进一步拓展海外市场,也会和中鼎联合建产线,提升制造能力。我们和阿里、联想、招商、上汽这些老股东在具身技术与场景POC都有在互动。
Q:交流下来,你觉得过去一年投资人对具身智能项目的关注重点有变化吗?
A:(投资方)会逐渐更关注场景落地,早期看技术,后期更重视商业验证。这是好事,我们从第一天起就是产品导向的公司,我们虽然靠技术创新起步,但定位始终是产品。
Q:产品导向和技术导向有哪些区别?
A:我现在觉得教授创业还是有很大劣势的,哈哈,其实要经历很多蜕变,我总结需要经过4个重要转变:从学术导向——到技术导向——再到工程导向——进而到产品导向——最后是商业化导向。
Q:这几个阶段都分别有什么特点?
A:学术导向就是以发Paper(论文)、提出新想法为乐;技术导向以做出前沿、最好的技术为傲;工程导向追求把技术做得稳定、可靠;产品导向则关注创造用户价值,做出让人愿意用的产品;商业化导向的重心是实现商业闭环、可持续盈利。
早期市场可能为技术和学术优势买单,能融到资。但我们从一开始就定位于产品和商业化,只做有商业价值、可落地的技术。这就是为什么我们做TRON系列、做大小脑融合,聚焦的是那些真正能落地的重要技术。
Q:国内也有不少融资估值跑得更快的具身智能玩家,他们的存在会带来压力吗?
A:估值高不是挺好的嘛?好事啊,这市场还是很大的。我们自己也有非常大的价值,压力不来自于同行,而来自于我们迫切想解决用户的真实需求。(具身智能)这个领域还是有太多问题没有被解决,还没有完成落地;而不是说落地都跑通了,在比谁卷得狠。它是一片蓝海,大家都往海里头游;你在岸边上那儿挤,没有用啊。
Q:现在很多公司都说自己的机器人已经跑通落地,开始“卷订单”了。这里头有多少是可持续的商业模式,多少是“赔钱赚吆喝”?
A:坦白讲,我们更关注的是订单背后的东西——场景有没有被验证、客户是不是真的在用、能不能形成复购。这些比数字本身更重要。签一个框架协议很容易,但那只是起点,不是终点。我们有一些很好的订单,但没怎么对外说。
Q:所以你们不太热衷于对外宣传订单?
A:也不是刻意不说,主要是觉得现阶段把精力放在产品和场景验证上更有价值。现在行业还在早期,大部分都在尝试,我们希望先把自己的事做好。
Q:具身智能赛道虽然“热钱”很多,但实际上也有不少投资人逐渐变得悲观。只有PPT融不到钱了,有人认为2026年将是“具身智能寒冬”,你赞成这种看法吗?
A:那当然不赞成了,这咋寒冬啊?如果只是靠PPT融不到资了,那不叫寒冬,那叫回归正常。本来就不该拿到钱的那些项目,现在拿不到了,这反而说明市场更理性了。这对于真正做实事的团队其实是好事。
我首先是非常乐观的,我不认为2026年是什么寒冬,反而是具身落地的元年。今年会有各种细分场景的POC验证,虽然不一定马上起量,但到2027年应该就起来了。这我是乐观的。
Q:从机器人马拉松,到机器人扭秧歌、跳舞、调酒……这种五花八门的机器人表演,有人认为是“乱象”,有人认为是机器人走向大众必要的科普。你怎么看待它们?
A:这其实要看你的产品的定位。如果你的机器人是打算进工厂,你去跳舞、弹琴,这就很奇怪了。但如果你的定位就是表演型机器人,那当然可以,有一部分人真正在做这个生意,或者做这个产业化,可以不认同这个产品方向,但并不代表它没有价值。但那些自己该做的事做不了、又去凑热闹的,就没什么意义,属于市场乱象。
“我们做了一些业内没人做的东西”
Q:现在行业这么“卷”,你认为逐际动力的护城河是什么?
A:有几个层面。首先是技术,但其实我不太想先从技术角度去说。你想想看,很多有竞争力的产品,比如手机,真的是技术上谁都做不了吗?它的护城河到底是什么?我认为最终是产品竞争力,还是在于用户价值、市场规模、用户体量,这些才是真正的壁垒。
在具身智能这样的创新赛道里,早期因为技术还在突破,所以很多人会把护城河建立在技术上,比如大脑强还是小脑强。但这本质上还得落到产品和商业上。早期技术领先,是让你能更快、更好地找到场景、做出产品,从而更早进入正向循环,让别人觉得再跟进来不划算了。
具体到技术,现阶段我们的技术优势主要有三点:一是小脑基础运动控制模型,在人形尤其是全尺寸人形领域比较领先;二是基于小脑基础模型,我们在大小脑融合技术上有长年的积累,也有突破性的技术;三是我们有本体的硬件设计和制造能力。这三项全栈能力,让我们能更快地朝产品化和场景落地走,而不是只停留在展示技术。
全尺寸人形机器人Oli在跑步
更关键的是我们的产品选择和定位。我很早就说过,逐际动力两条腿的人形机器人是不进工厂的。当然我们的客户进工厂,我们会支持他们。但是我们自己是不会进的。 我们人形的口号是“Serve People, Not Process”,我们服务于人,而不是生产流程。我们瞄准的是商业场景,最终是家庭;服务于商业场景、服务于人、帮助人、增强人,所以不会去流水线上做事。这就是我们的战略选择,也会在这个方向持续深耕。
Q:无论是技术方向,还是赛道选择,这些路径在具身智能赛道里看起来都比较“小众”?
A:无论是“具身智能”,还是“人形机器人”,这些概念都很大,落地也很泛。首先我想澄清一个逻辑:我们做的是通用机器人。在人形这个方向上,通用的本质就是区别于专用机器人。任何单一场景、单一任务都不需要人形,无论是物流还是别的,你总能找到更高效的方式。
专用机器人的逻辑是软硬件深度结合,在特定场景下追求极致效率。而通用机器人的逻辑不同,有两种“通用”:
一种是通过“通用本体+APP”的方式,类似iPhone,在不变更硬件的情况下通过增加软件功能来适应不同任务。单个本体加一个APP,可能看起来不值钱、不划算;但两个、三个,到五六个的时候,就会出现一个拐点,过了这个点,所有能力都会爆发。这就像手机一样:如果只打电话,那不需要手机;只记笔记,有商务通就够了;只发消息,BB机最划算。但当这些功能都集成到一个设备上,其他专用设备就消失了。
这是我们COSA的思路。简单地说,COSA是一个具有记忆、认知、感知和技能调度的复杂操作系统。它跟计算机操作系统还不太一样,计算机操作系统管理硬件资源,满足计算需求,而机器人操作系统管理包括肢体、电机在内的所有硬件,以提供能够改变物理世界的运动服务。它需要对话、语言、交互等等很多Agent的能力,最终是一个Agentic OS——就像豆包手机,你去跟豆包这个Agent对话,它就能够把所有你想干的事干了。未来机器人也是这样,最后是一个Agentic的操作系统,你跟它交互,它就能把所有事情帮你做了。
另一种“通用”是,机器人面向的是单一但极致的任务场景,但通过一个通用的基座进行组合与适配,从而在各个场景中都能实现最优效率。这是我们TRON 2的思路,比如在物流分拣中,可以用TRON 2组合出双臂形态,完成任务。这实际上是在不同功能场景中沉淀出一个通用的基座能力。
你去世界机器人大会看,那么一大堆机器人,千奇百怪、各式各样,大家都觉得有点内卷或者同质化,对吧?而TRON 2提供了一种新的可能,让大家意识到“还可以这样”。我们重新定义了一类机器人,并且有能力真正推动产业落地。从这个角度看,TRON 2的历史价值蛮重要的。我觉得,过几年回过头来看,能被时代记住的机器人,TRON2一定是其中一个。
“具身智能Post-Training时代开启”
Q:2026年,会有哪些具身智能的关键技术突破?
A:2026年将会是整个具身智能实现场景化落地的元年。技术上,最大的变量有两个:一是视频数据训练,二是强化学习。
视频数据这块,我们在2024年就开始关注从视频中学习可泛化的操作能力。25年初发布了VGM。现在摇操真机数据非常低效,无法scale,整个具身智能领域又开始关注视频数据,尤其是第一视角视频。Eco-centric视频应该是预训练里最大的变量。
关于数据,我补充一句,我管数据叫“矿产”,其中的智能是“金子”。关键不在于矿石本身,数据到处都有,而在于你是否掌握“冶炼”技术。能用真机数据训练模型是最简单的“冶炼”技术,哈哈。
第二方面,从具身智能“大脑”能力来看,VLA已进入预训练尾声,具身智能开始转向Post-Training(后训练)阶段。预训练主要依赖遥操作、数据采集和模仿学习,而后训练则类似大模型的RLHF,需要依靠真实场景数据和强化学习来实现。
强化学习是我们的重要技术栈,在这块我们有很多积累。后训练的关键在于模型在真实场景中要能“越用越好”,这依赖于持续收集场景数据并通过强化学习优化,我们叫“真机强化学习”。具身领域的Post-Training甚至比大语言模型还重要,因为具身智能预训练的数据本身很少,必须让模型在具备一定泛化能力后,快速进入真实场景收集数据,通过真机强化学习进行迭代,形成“基座模型”与“场景数据”之间的飞轮。我们不能等一切都准备好了再开始,必须让这个飞轮在场景里先转起来。真机强化学习是另一个比较令人兴奋的东西。
“看重有成长欲望、开放、充满好奇心的人才”
Q:现在具身智能行业的人才争夺战非常激烈,逐际动力靠什么吸引并留住顶尖的人才不被挖走呢?
A:需要靠文化、靠你的价值观,肯定不是靠纯“堆钱”。现在市场薪酬在提升,你必须达到合理标准,这是有目共睹的。但很多人其实更看重的是在这里能学到什么、做出什么,大家在乎的是技术挑战、成长空间和真正的成就感。钱是基础、是及格线,但更重要的是技术氛围、学习机会和一起成事的可能。这才是我们看重的。单纯靠钱竞争是比较初级的做法。我做得还不够好,今年会重点关注文化建设。
Q:逐际动力在招聘过程中最看重候选人的什么特质?
A:靠谱、聪明、有上进跟成长的欲望。而且需要有好奇心和开放,不然个人过往经验对初创公司很可能是负资产,是包袱。
Q:你在中美两国都从事过机器人研究或者创业,从你的角度看,两国有什么差异吗?
A:具身智能这块,美国没优势。美国可能比较擅长原始Idea的创新,但具身智能从概念到整个落地的环节太长了,包括整个产品化设计、量产、制造、用户、市场,这些中国是更快的。纯AI的东西,如果不需要这么长链条的迭代,那美国可能还有一些竞争力,凡是带点硬件的东西,中国肯定跑得快很多。
举个例子,如果比亚迪和特斯拉当年同时起步做电动车,技术都一样,特斯拉甚至还开源,那今天还会有特斯拉吗?很可能不会。现在的具身领域,情况就类似这样。
Q:如果给2026年的逐际动力设定目标,会是什么?
A:人形的目标是去掉遥控器,完成几个场景的PMF(Product-Market Fit)验证,会推出新品,构建有特色的产品矩阵。技术层面,具身Agentic OS是重点,集合大小脑模型能力和系统能力。我们希望TRON 2成为具身智能科研探索和场景落地的通用基座,可能相当于英伟达的算力平台之于AI,成为大家的最佳选择。
具身智能是中国更可能在全球领先的行业之一,我们需要什么样的企业?
回看逐际动力的几次关键选择——从全尺寸人形,到通用基座,再到具身智能体系统——会发现他们在不断努力为这个新兴行业开路。在一个容易跟风、容易内卷的赛道里,逐际动力选择做创新的事,做面向真实场景的产品。
张巍的判断也很清醒:具身智能的竞争,不是模型崇拜,也不是技术参数堆砌,而是从技术到产品、从场景到规模的正循环。
如果说这个行业未来会留下少数真正有历史意义的公司,那一定不是跟随者,而是那些定义新范式、创造新物种、干实事的人。
引用张巍的一句话:只有敢于原始创新,才会被时代记住。