智在无界携手北大团队获新突破：赋予机器人人类手感？

智在无界团队推出UniTacHand，实现人类触觉技能向机器人零样本迁移

「星连资本」是专注于大模型生态的风险投资基金，侧重早期，连接产业。

当机器人能“看见”世界，我们便开始追问：它何时能“触摸”并“理解”世界？

触觉是人类灵巧操作的基石，却是机器人迈向真正智能的巨大鸿沟。收集机器人触觉数据耗时耗力，而人类海量的触觉经验又因形态差异被阻隔在另一岸。

今天，一道桥梁被架起——UniTacHand，一项来自BeingBeyond（智在无界）与北京大学团队的突破性研究，宣布仅需 10分钟的人机配对数据，就能实现人类触觉技能向多指灵巧手的 “零样本”无损迁移。

这意味着，机器人的“指尖”即将首次真正感受到世界的质地与力量。福布斯中国30 Under 30榜单旨在发掘和表彰中国30岁以下在不同领域展现出卓越领导力、创新精神与行业影响力的青年才俊。该榜单以其严格的评审标准与前瞻视野，已成为衡量青年创业者与行业变革者的重要标尺。

01 破局关键

当前机器人触觉研究深陷“数据荒漠”与“形态鸿沟”的双重困境。

UniTacHand的破局，始于一个核心洞察：抛开形态差异，人类与灵巧手操作物体的物理逻辑本质相通。

研究团队创造性地将MANO手部模型的UV映射作为“通用语言”。无论数据来自人类触觉手套还是灵巧手传感器，都被统一“翻译”到这张标准的二维触觉地图上，从而抹平了硬件与形态的差异。

仅将数据映射至统一空间，尚不足以实现真正的触觉迁移。

一个关键难题在于：人与机器即使执行同一任务，其操作策略也往往不同。例如，人手抓握物体时倾向于全掌包裹以增加稳定性，而诸如Inspire等灵巧手则多采用指尖捏取的方式。

这导致二者在与物体接触时，触觉信号的激活区域与压力分布模式存在本质差异。

UniTacHand设计了核心的跨域对比学习框架。其目标并非强求数据在空间上一一对应，而是教会模型理解触觉背后的物理语义与任务意图。

该框架采用双分支编码器架构，分别处理人与机器人的数据。每个分支均包含触觉编码器与手部姿态编码器，确保模型同时理解“触觉是什么”与“手正在做什么”，并以精心设计的三重损失函数进行协同优化。

通过这一过程，模型在其内部构建的共享隐空间中，逐渐学会将“人类手掌的全面压力分布”与“灵巧手指尖的集中力信号”映射为具有相同语义的高维特征。

至此，触觉迁移不再是简单的信号转换，而上升为一种跨形态的触觉语义理解。机器人不仅能“看到”统一格式的触觉图像，更能“读懂”其中蕴含的物理作用与操作目的，从而实现真正意义上的感知对齐与技能传承。

02 真机验证

为系统验证UniTacHand框架的有效性，研究团队在搭载触觉传感器的Inspire灵巧手与RealMan机械臂集成平台上，设计了五类具有代表性的触觉交互任务进行测试。

01 零样本迁移：

仅使用人类数据训练的模型无需任何机器人触觉数据即可直接部署。

在物体定位任务中成功率达到 100%，在软硬物体分类放置任务中成功率达 85%，显著超越传统基线方法。

02 少量配对数据的迁移：

在柔顺控制任务中，机器人通过触觉理解施力方向的准确率达到 40%；在对10类未见物体进行分类的任务中，准确率达到 38.6%，展现出优秀的泛化能力。

03 单样本混合训练：

仅结合人类数据与一条真机数据，模型在视觉易混淆物体（如空瓶与满水瓶）的触觉辨别任务中，成功率高达 73.3%，不仅大幅超越纯机器人数据训练的方法，也显著优于其他混合训练基线。

这五项实验结果共同表明，UniTacHand 构建的“人类触觉→统一表征→机器人技能”路径，在数据效率、迁移性能和泛化能力上均实现了重要突破。

写在最后：

「智在无界」以“推动人形机器人从实验室走向日常生活”为使命，致力于通过人类数据与多模态大模型技术，构建人形机器人通用模型框架，解决具身智能的核心技术难题，引领人形机器人技术革命。

内容来源于

1.BeingBeyond《BeingBeyond最新成果：首次实现人手-机器人触觉数据迁移，直击灵巧手触觉数据难采痛点》

本文来自微信公众号“星连资本”，作者：星连资本，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

智在无界与北京大学团队新突破，人类手感赋予机器人？