未分类
Cube 3D – 开源 AI 3D 生成模型
Cube 3D 是什么 Cube 3D 是由元宇宙游戏平台 Roblox 推出的基于生成式 AI 技术的开源系统,是一个三维基础模型,可直接通过文本提示在 Roblox 平台上创建...
GR00T N1 – 开启通用人形机器人新时代的基础模型
GR00T N1是什么 : GR00T N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。它基于多模态输入,如语言和图像,能在多样化环境中实现操作...
GR00T N1 – 开启通用人形机器人新时代的基础模型
GR00T N1是什么 : GR00T N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。它基于多模态输入,如语言和图像,能在多样化环境中实现操作...
UniFluid – 联合视觉生成与理解的多模态框架
UniFluid 是什么 UniFluid 是由谷歌 DeepMind 与麻省理工学院共同开发的一种前沿自回归框架,旨在处理视觉生成与理解的多重任务。该框架通过对多模态图像...
Multi-Speaker – 革新音频处理的多说话人分离模型
Multi-Speaker 是 AudioShake 推出的全球首个高分辨率多说话人分离模型,它能够将音频中的多个说话人精准分离到不同轨道,解决了传统音频工具在处理重叠语音...
UniAct – 开启机器人跨平台通用行为控制新时代
一、UniAct 是什么 UniAct 是由清华、商汤、北大、上海 AI Lab 联合推出的具身基础模型框架,旨在解决不同机器人之间的行为异构性问题。通过学习通用行为...
ReCamMaster – 视频重渲染的革新者
ReCamMaster是什么 ReCamMaster 是由浙江大学、快手科技等联合推出的视频重渲染框架,能够根据新的相机轨迹重新生成视频内容。通过预训练模型和帧维度条件...
Stable Virtual Camera – 重新定义图像与视频的创新工具
Stable Virtual Camera 是 Stability AI 推出的一款具有创新性的 AI 模型,能够将 2D 图像转换为具有真实深度和透视感的 3D 视频,为创作者带来全新的视觉创...
Instella – 开源语言模型的新标杆
Instella 是什么 Instella 是 AMD 推出的系列 30 亿参数的开源语言模型。它完全从零开始在 AMD Instinct™ MI300X GPU 上训练而成,基于自回归 Transformer...
Maestro – 智能规划与协调的 AI 利器
Maestro 是什么 Maestro 是一款由 AI21 Labs 开发的面向企业的 AI 规划与编排系统,于 2025 年推出。它能够帮助企业解决复杂任务,通过结构化规划,分析多...