未分类
LangManus – 智能之手,开启 AI 自动化新篇章
LangManus 是一个基于 LangChain 全家桶开发的 AI 自主深度研究系统,其名字来源于 LangChain 和拉丁语中的 Manus(意为手),寓意为 AI 的智能之手,帮助用...
Cube 3D – 开源 AI 3D 生成模型
Cube 3D 是什么 Cube 3D 是由元宇宙游戏平台 Roblox 推出的基于生成式 AI 技术的开源系统,是一个三维基础模型,可直接通过文本提示在 Roblox 平台上创建...
GR00T N1 – 开启通用人形机器人新时代的基础模型
GR00T N1是什么 : GR00T N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。它基于多模态输入,如语言和图像,能在多样化环境中实现操作...
GR00T N1 – 开启通用人形机器人新时代的基础模型
GR00T N1是什么 : GR00T N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。它基于多模态输入,如语言和图像,能在多样化环境中实现操作...
UniFluid – 联合视觉生成与理解的多模态框架
UniFluid 是什么 UniFluid 是由谷歌 DeepMind 与麻省理工学院共同开发的一种前沿自回归框架,旨在处理视觉生成与理解的多重任务。该框架通过对多模态图像...
Multi-Speaker – 革新音频处理的多说话人分离模型
Multi-Speaker 是 AudioShake 推出的全球首个高分辨率多说话人分离模型,它能够将音频中的多个说话人精准分离到不同轨道,解决了传统音频工具在处理重叠语音...
UniAct – 开启机器人跨平台通用行为控制新时代
一、UniAct 是什么 UniAct 是由清华、商汤、北大、上海 AI Lab 联合推出的具身基础模型框架,旨在解决不同机器人之间的行为异构性问题。通过学习通用行为...
ReCamMaster – 视频重渲染的革新者
ReCamMaster是什么 ReCamMaster 是由浙江大学、快手科技等联合推出的视频重渲染框架,能够根据新的相机轨迹重新生成视频内容。通过预训练模型和帧维度条件...
Stable Virtual Camera – 重新定义图像与视频的创新工具
Stable Virtual Camera 是 Stability AI 推出的一款具有创新性的 AI 模型,能够将 2D 图像转换为具有真实深度和透视感的 3D 视频,为创作者带来全新的视觉创...
Instella – 开源语言模型的新标杆
Instella 是什么 Instella 是 AMD 推出的系列 30 亿参数的开源语言模型。它完全从零开始在 AMD Instinct™ MI300X GPU 上训练而成,基于自回归 Transformer...