FlexiAct – 灵活动作控制的未来已来

未分类 2025-06-22 14:34

FlexiAct是由清华大学与腾讯ARC实验室联合开发的先进动作迁移模型，能够在异构场景中将参考视频中的动作精准迁移到目标主体上，即使在空间结构差异显著或跨域的场景中，也能保持动作的适配性和外观一致性。

FlexiAct具备以下核心功能：

FlexiAct的技术核心包括两个关键模块：

RefAdapter（空间结构适配器）：通过在训练过程中随机选择视频帧作为条件输入，增强模型对多样姿态、布局及视角的适应能力。该模块通过注入少量可训练参数（如LoRA模块），在CogVideoX-I2V模型的MMDiT层中实现灵活的空间适配。
频率感知动作提取（FAE）：FAE是一种创新的动作提取方法，直接在去噪过程中完成动作信息的提取，无需依赖独立的时空架构。该模块基于动态调整注意力权重，在早期时间步优先提取动作特征，在后期时间步聚焦细节还原，从而实现精准的动作控制。

FlexiAct支持多种主流平台，包括：

FlexiAct由清华大学深圳国际研究生院和腾讯ARC实验室联合开发。开发团队在人工智能领域拥有深厚的技术积累和丰富的研究经验，致力于推动计算机视觉和动作控制技术的发展。

FlexiAct在多个领域具有广泛的应用前景：

FlexiAct凭借其卓越的技术性能和广泛的应用场景，正在成为动作迁移领域的重要工具，为内容创作和交互应用带来新的可能性。