UniAct – 开启机器人跨平台通用行为控制新时代

一、UniAct 是什么

UniAct 是由清华、商汤、北大、上海 AI Lab 联合推出的具身基础模型框架,旨在解决不同机器人之间的行为异构性问题。通过学习通用行为,UniAct 能够捕捉不同机器人共享的原子行为特征,消除因物理形态和控制接口差异导致的行为异构性,从而实现跨平台控制。

二、核心功能

  • 通用动作编码 :UniAct 将不同机器人的原子行为通过向量量化形成一个通用的 codebook,每个 token 代表一种可跨平台共享的通用技能,如 “移动到目标位置” 或 “避开障碍物”。
  • 轻量化架构与高效性能 :UniAct-0.5B 模型仅需 0.5 亿参数,在真实与模拟环境的任务测试中,表现已经超过了参数达到 14 亿的 OpenVLA 模型。
  • 快速适应新环境和机器人 :UniAct 仅需 50 条专用示教数据即可完成模型在新环境中的微调,能快速适应新机器人和控制接口。通过添加新的轻量级解码器,可以轻松扩展到新的机器人平台。
  • 跨领域数据利用 :UniAct 通过通用行为空间,能更好地利用跨领域的数据进行训练,在不同机器人和环境中实现更高效的泛化。
  • 一致的行为模式 :在不同的部署场景和机器人类型上,同一个通用动作可以表现出一致的行为模式,为具身智能体的控制提供了新的便捷方式。

三、技术原理

  • 通用动作空间(Universal Action Space) :UniAct 通过向量量化构建了一个离散的通用动作空间,设计为向量化的码本,每个向量嵌入代表一种通用的原子行为。
  • 通用动作提取器(Universal Action Extractor) :基于视觉语言模型的通用动作提取器,在给定观察结果和任务目标的情况下,输出选择通用动作的概率,能从复杂的视觉和语言输入中提取出与任务进展直接相关的通用动作。
  • 异质解码器(Heterogeneous Decoders) :针对不同的机器人平台进行设计,能够根据机器人的具体特征将通用动作转换为具体的控制信号。

四、支持平台

目前 UniAct 主要支持以下机器人平台:

  • ** RiceCooker 类型** :包含 Franka、Panda、Kinova Mico2、UR5e、Wam、Kinova 3、Kinova 6、UR10e、Shadow 等。
  • Articulated 类型 :包含清大四足、Unitree A1 Pro、Unitree B1、Unitree Go1、Boston Dynamics Spot 等。
  • 其他类型 :如 Toyota、Valtorn、 Platforms Custom 等。

五、团队介绍

UniAct 由清华智能产业研究院(AIR)联合商汤研究院、鹏城实验室、北京大学理学部和上海人工智能实验室等机构共同打造。这些团队在人工智能领域拥有深厚的技术积累和丰富的研究经验,为 UniAct 的研发和创新提供了强大的支持。

六、项目资源

七、业务场景

  • 自动驾驶与智能交通 :UniAct 的技术原理和架构适用于自动驾驶领域,能为自动驾驶系统提供更高效的动作规划和控制。
  • 医疗机器人 :可用于辅助康复机器人或手术机器人,使医疗机器人更灵活地适应不同的患者需求和手术场景。
  • 工业自动化 :能够用于控制多种工业机器人,实现高效的生产流程优化,提高工业生产的灵活性和效率。
  • 智能家居与服务机器人 :让服务机器人更自然地与人类交互,完成各种家务任务。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注