未分类
Being-M0 – 人形机器人通用动作生成模型的创新与应用
Being-M0是由北京大学、中国人民大学等顶尖学术机构联合开发的首个大规模人形机器人通用动作生成模型。它基于业界首个百万级动作数据集MotionLib,通过创新的...
DanceGRPO – 领航视觉生成的强化学习新框架
DanceGRPO是什么 DanceGRPO是由字节跳动Seed团队与香港大学联合开发的首个统一视觉生成强化学习框架。它将强化学习技术引入视觉内容生成领域,覆盖扩散模...
AlphaEvolve – 自主进化算法的智能体
AlphaEvolve是谷歌DeepMind推出的一款革命性的AI产品,旨在通过自主进化的方式发现和优化算法,推动科学和计算领域的突破。作为一款通用型的科学AI智能体,它...
WorldMem – 革新虚拟世界生成技术,构建持久一致的数字空间
WorldMem是什么 WorldMem是由南洋理工大学、北京大学和上海AI实验室联合推出的创新AI世界生成模型。该模型通过引入记忆机制,解决了传统世界生成模型在长...
GPDiT – 重新定义视频生成的未来
GPDiT(Generative Pre-trained Autoregressive Diffusion Transformer)是由北京大学、清华大学、StepFun公司以及中国科学技术大学联合推出的一款新型视频生...
Skywork-VL Reward – 多模态奖励模型的创新突破
Skywork-VL Reward 是一款由 Skywork AI 团队开发的多模态奖励模型,专为多模态理解和推理任务提供高质量的奖励信号。该模型基于 Qwen2.5-VL-7B-Instruct 架...
ChatUI – 构建高效对话式界面的开源组件库
ChatUI是什么 ChatUI是由阿里达摩院推出的一款专注于智能对话领域的开源组件库,旨在帮助开发者快速构建高质量的聊天应用。它基于阿里巴巴Alime Chatbot的...
FaceShot – 赋予角色生动表情的创新肖像动画生成框架
FaceShot是由同济大学、上海AI Lab和南京理工大学联合推出的一种新型无需训练的肖像动画生成框架。它通过外观引导的地标匹配模块和基于坐标的地标重定位模块...
MT-Color – 革新图像着色的AI框架
MT-Color是由上海交通大学联合哔哩哔哩推出的基于扩散模型的可控图像着色框架,旨在通过先进的AI技术为图像着色任务带来更高的精度和灵活性。该框架能够基于...
Speech-02 – 领先行业的多语言语音合成模型
Speech-02 是由 MiniMax Audio 推出的一款高性能、多功能的 AI 语音合成模型。它基于先进的深度学习技术,能够模拟人类语音的多种特征,生成高质量、高保真度...