Step1X-3D – 开源3D大模型,开启高保真可控内容生成新时代

Step1X-3D是什么?

Step1X-3D是由阶跃星辰(StepFun AI)团队开源的一款高保真、可控的3D资产生成框架。作为阶跃星辰在多模态方向的最新成果,该模型总参数量达48亿,其中几何模块有13亿参数,纹理模块则有35亿参数。它专注于生成高保真、可控的3D内容,不仅追求视觉上的“好看”,更强调“好用”与“可控”,旨在为3D内容创作提供强大而可靠的技术引擎。

核心功能

  • 高保真度和可控的3D资产生成:能够生成具有高保真度几何形状和多样化纹理贴图的3D资产,保持表面几何与纹理映射之间的卓越对齐。
  • 支持多种条件输入:支持多模态条件输入,如文本、语义标签、多视图、边界框和骨骼等,实现更灵活的3D资产生成。
  • 开源性:提供技术报告、推理代码和模型权重、训练代码的开源。

技术原理

  • 数据整理:从超过500万个原始3D资产中筛选出200万个高质量样本,创建标准化的几何和纹理属性数据集。运用绕数技术提升网格到SDF转换的成功率,确保几何监督的准确性。
  • 几何生成:采用基于感知器的潜在编码和锐边采样策略,生成高保真度的TSDF表示,基于整流流变换器进行高效扩散模型训练,保障几何生成的稳定性和高效性。
  • 纹理生成:基于预训练的多视图图像生成模型,结合几何引导生成多视图一致的纹理,引入纹理空间同步模块,实现潜在空间对齐,确保纹理与几何的精确对齐。
  • 可控性:基于LoRA微调技术,实现灵活的几何控制,支持对称性、几何细节级别等控制,兼容多模态条件输入。

支持平台

Step1X-3D的模型及相关代码已在多个平台开源,包括:

团队介绍

Step1X-3D由阶跃星辰(StepFun AI)团队推出,该团队在多模态AI领域具有深厚的技术积累和创新能力。他们通过构建高质量的数据集和先进的技术架构,致力于推动3D生成技术的发展。

项目资源

业务场景

Step1X-3D可广泛应用于多种业务场景,包括但不限于:

  • 游戏开发:快速生成高质量的3D游戏资产,提高开发效率。
  • 影视制作:用于创建逼真的3D场景和道具。
  • 建筑设计:生成高保真的3D建筑模型。
  • 虚拟现实(VR)和增强现实(AR):创建沉浸式的3D体验。
  • 教育与培训:提供直观的3D教学资源。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注