首页文章详情

智在无界与北京大学团队新突破,人类手感赋予机器人?

星连资本2026-06-06 12:00
智在无界团队推出UniTacHand,实现人类触觉技能向机器人零样本迁移

「星连资本」是专注于大模型生态的风险投资基金,侧重早期,连接产业。

当机器人能“看见”世界,我们便开始追问:它何时能“触摸”并“理解”世界? 

触觉是人类灵巧操作的基石,却是机器人迈向真正智能的巨大鸿沟。收集机器人触觉数据耗时耗力,而人类海量的触觉经验又因形态差异被阻隔在另一岸。 

今天,一道桥梁被架起——UniTacHand,一项来自BeingBeyond(智在无界)与北京大学团队的突破性研究,宣布仅需 10分钟 的人机配对数据,就能实现人类触觉技能向多指灵巧手的 “零样本”无损迁移。 

这意味着,机器人的“指尖”即将首次真正感受到世界的质地与力量。福布斯中国30 Under 30榜单旨在发掘和表彰中国30岁以下在不同领域展现出卓越领导力、创新精神与行业影响力的青年才俊。该榜单以其严格的评审标准与前瞻视野,已成为衡量青年创业者与行业变革者的重要标尺。 

01 破局关键

当前机器人触觉研究深陷“数据荒漠”“形态鸿沟”的双重困境。

UniTacHand的破局,始于一个核心洞察:抛开形态差异,人类与灵巧手操作物体的物理逻辑本质相通。

研究团队创造性地将MANO手部模型的UV映射作为“通用语言”。无论数据来自人类触觉手套还是灵巧手传感器,都被统一“翻译”到这张标准的二维触觉地图上,从而抹平了硬件与形态的差异。

仅将数据映射至统一空间,尚不足以实现真正的触觉迁移。

一个关键难题在于:人与机器即使执行同一任务,其操作策略也往往不同。例如,人手抓握物体时倾向于全掌包裹以增加稳定性,而诸如Inspire等灵巧手则多采用指尖捏取的方式。

这导致二者在与物体接触时,触觉信号的激活区域与压力分布模式存在本质差异。

UniTacHand设计了核心的跨域对比学习框架。其目标并非强求数据在空间上一一对应,而是教会模型理解触觉背后的物理语义与任务意图。

该框架采用双分支编码器架构,分别处理人与机器人的数据。每个分支均包含触觉编码器与手部姿态编码器,确保模型同时理解“触觉是什么”与“手正在做什么”,并以精心设计的三重损失函数进行协同优化。

通过这一过程,模型在其内部构建的共享隐空间中,逐渐学会将“人类手掌的全面压力分布”与“灵巧手指尖的集中力信号”映射为具有相同语义的高维特征

至此,触觉迁移不再是简单的信号转换,而上升为一种跨形态的触觉语义理解。机器人不仅能“看到”统一格式的触觉图像,更能“读懂”其中蕴含的物理作用与操作目的,从而实现真正意义上的感知对齐与技能传承。

02 真机验证

为系统验证UniTacHand框架的有效性,研究团队在搭载触觉传感器的Inspire灵巧手与RealMan机械臂集成平台上,设计了五类具有代表性的触觉交互任务进行测试。

01 零样本迁移

仅使用人类数据训练的模型无需任何机器人触觉数据即可直接部署

物体定位任务中成功率达到 100%,在软硬物体分类放置任务中成功率达 85%,显著超越传统基线方法。

02 少量配对数据的迁移:

柔顺控制任务中,机器人通过触觉理解施力方向的准确率达到 40%;在对10类未见物体进行分类的任务中,准确率达到 38.6%,展现出优秀的泛化能力。

03 单样本混合训练:

仅结合人类数据与一条真机数据,模型在视觉易混淆物体(如空瓶与满水瓶)的触觉辨别任务中,成功率高达 73.3%,不仅大幅超越纯机器人数据训练的方法,也显著优于其他混合训练基线。

这五项实验结果共同表明,UniTacHand 构建的“人类触觉→统一表征→机器人技能”路径,在数据效率、迁移性能和泛化能力上均实现了重要突破。

写在最后:

「智在无界」以“推动人形机器人从实验室走向日常生活”为使命,致力于通过人类数据与多模态大模型技术,构建人形机器人通用模型框架,解决具身智能的核心技术难题,引领人形机器人技术革命。

内容来源于

1.BeingBeyond《BeingBeyond最新成果:首次实现人手-机器人触觉数据迁移,直击灵巧手触觉数据难采痛点》

本文来自微信公众号“星连资本”,作者:星连资本,36氪经授权发布。