LHM 是什么 :LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通义实验室推出的从单张图像重建可动画化 3D 人体模型的开源项目。它仅需一张人物图片,最快 2 秒就能生成可驱动的高保真 3D 数字人,支持跳舞、运动等多种动作,适用于虚拟人、游戏角色、XR 场景等多类应用,降低了 3D 内容创作门槛。
核心功能 :
快速重建 :几秒钟内完成从单张图像到 3D 可动画化模型的转换,无需复杂后处理。
高保真细节 :精确保留服装纹理、面部细节等关键信息,生成高质量的 3D 模型。
实时动画 :支持基于姿态控制的实时动画渲染,适用于沉浸式应用,如 AR/VR。
泛化能力强 :在开放环境上表现出色,适应多种场景和姿态。
技术原理 :
多模态 Transformer 架构 :融合 3D 几何特征和 2D 图像特征,有效处理几何和视觉信息。针对头部区域设计多尺度特征提取方案,聚合不同层次的特征增强面部细节的恢复能力。
3D 高斯点云表示 :基于 3D 高斯点云表示 3D 模型,支持实时、高质量的渲染。网络直接预测高斯点云的参数,实现从输入图像到 3D 模型的快速转换。
自监督学习 :基于大规模视频数据进行训练,用渲染损失和正则化项优化模型,无需依赖稀缺的 3D 扫描数据。
实时动画支持 :基于 SMPL-X 骨架参数将重建的 3D 模型变形到目标姿态,支持实时姿态控制动画,整个重建和动画化过程在单次前向传播中完成,适合实时应用。
支持平台 :包括 Linux、macOS 和 Windows 等主流操作系统,用户可以在这些平台上使用 LHM 进行 3D 模型的生成和动画制作。
团队介绍 :由阿里巴巴通义实验室开发。该团队在人工智能领域具有深厚的技术积累和创新能力,致力于推动 AI 技术在各个领域的应用和发展。