Step1X-3D – 开源3D大模型,开启高保真可控内容生成新时代
Step1X-3D是什么?
Step1X-3D是由阶跃星辰(StepFun AI)团队开源的一款高保真、可控的3D资产生成框架。作为阶跃星辰在多模态方向的最新成果,该模型总参数量达48亿,其中几何模块有13亿参数,纹理模块则有35亿参数。它专注于生成高保真、可控的3D内容,不仅追求视觉上的“好看”,更强调“好用”与“可控”,旨在为3D内容创作提供强大而可靠的技术引擎。
核心功能
- 高保真度和可控的3D资产生成:能够生成具有高保真度几何形状和多样化纹理贴图的3D资产,保持表面几何与纹理映射之间的卓越对齐。
- 支持多种条件输入:支持多模态条件输入,如文本、语义标签、多视图、边界框和骨骼等,实现更灵活的3D资产生成。
- 开源性:提供技术报告、推理代码和模型权重、训练代码的开源。
技术原理
- 数据整理:从超过500万个原始3D资产中筛选出200万个高质量样本,创建标准化的几何和纹理属性数据集。运用绕数技术提升网格到SDF转换的成功率,确保几何监督的准确性。
- 几何生成:采用基于感知器的潜在编码和锐边采样策略,生成高保真度的TSDF表示,基于整流流变换器进行高效扩散模型训练,保障几何生成的稳定性和高效性。
- 纹理生成:基于预训练的多视图图像生成模型,结合几何引导生成多视图一致的纹理,引入纹理空间同步模块,实现潜在空间对齐,确保纹理与几何的精确对齐。
- 可控性:基于LoRA微调技术,实现灵活的几何控制,支持对称性、几何细节级别等控制,兼容多模态条件输入。
支持平台
Step1X-3D的模型及相关代码已在多个平台开源,包括:
- GitHub仓库:https://github.com/stepfun-ai/Step1X-3D
- HuggingFace模型库:https://huggingface.co/stepfun-ai/Step1X-3D
- ModelScope:https://www.modelscope.cn/models/stepfun-ai/Step1X-3D
- 技术论文:https://arxiv.org/pdf/2505.07747
团队介绍
Step1X-3D由阶跃星辰(StepFun AI)团队推出,该团队在多模态AI领域具有深厚的技术积累和创新能力。他们通过构建高质量的数据集和先进的技术架构,致力于推动3D生成技术的发展。
项目资源
业务场景
Step1X-3D可广泛应用于多种业务场景,包括但不限于:
- 游戏开发:快速生成高质量的3D游戏资产,提高开发效率。
- 影视制作:用于创建逼真的3D场景和道具。
- 建筑设计:生成高保真的3D建筑模型。
- 虚拟现实(VR)和增强现实(AR):创建沉浸式的3D体验。
- 教育与培训:提供直观的3D教学资源。