HRAvatar – 开启单目视频生成3D头像的新时代
HRAvatar是什么
HRAvatar(High-Quality and Relightable Gaussian Head Avatar)是由清华大学深圳国际研究生院与国际数字经济学院(IDEA)联合开发的高质量、可重光照的3D头像生成工具。它基于单目视频输入,能够生成细节丰富、可动画化且支持真实光照变化的3D头像,为数字人、虚拟主播、AR/VR等领域提供了高效的技术解决方案。
核心功能
HRAvatar的核心功能包括:
- 高质量重建:从普通单目视频中生成高保真、细节丰富的3D头像。
- 实时性:支持约155 FPS的实时渲染,满足实时交互需求。
- 可重光照:支持在不同光照条件下对头像进行重光照渲染。
- 动画化:驱动头像进行表情和动作的动画化。
- 材质编辑:允许用户调整头像的材质属性,如反照率、粗糙度和反射率。
- 跨视角渲染:支持从不同视角渲染头像,确保3D一致性和多视角支持。
技术原理
HRAvatar的技术原理基于以下创新:
- 精确表情追踪:通过端到端的表情编码器,联合优化提取更准确的表情参数,减少预追踪参数误差。
- 几何变形建模:采用可学习的线性形变基(LBS)和线性蒙皮技术,实现高斯点从标准姿态到各种表情和姿态的灵活变形。
- 外观建模:将头像外观分解为反照率、粗糙度和菲涅尔反射率等材质属性,结合BRDF物理渲染模型进行着色。
- 法线估计与材质先验:通过深度导数获得的法线图监督渲染的法线图,确保几何一致性。
支持平台
HRAvatar支持多种平台,包括但不限于:
- 桌面端:支持Windows、Linux和MacOS操作系统。
- 移动端:支持iOS和Android平台。
- 游戏引擎:兼容Unity和Unreal Engine。
- WebGL:支持在Web环境中使用。
团队介绍
HRAvatar由清华大学深圳国际研究生院与国际数字经济学院(IDEA)联合开发。团队成员包括计算机视觉、图形学和机器学习领域的专家,他们在3D重建、虚拟现实和数字人技术方面拥有深厚的研究背景。该团队的研究成果已被国际计算机视觉与模式识别会议CVPR 2025录用。
项目资源
- 项目官网:https://eastbeanzhang.github.io/HRAvatar/
- GitHub仓库:https://github.com/Pixel-Talk/HRAvatar
- 技术论文:https://arxiv.org/pdf/2503.08224
业务场景
HRAvatar在多个业务场景中具有广泛的应用潜力:
- 数字人与虚拟主播:生成高质量的虚拟形象,用于直播、新闻播报等。
- AR/VR:在虚拟现实和增强现实应用中提供逼真的3D头像。
- 影视特效:替代传统面部捕捉系统,降低制作成本。
- 沉浸式会议:通过普通摄像头实现眼神接触与微表情传递。
- 元宇宙社交:用户自拍生成个性化化身,保持材质物理真实性。