未分类
TripoSG – 开启高保真 3D 形状合成新纪元
TripoSG 是什么 TripoSG 是 VAST-AI-Research 团队推出的一种基于大规模修正流模型的高保真 3D 形状合成技术。它通过大规模修正流变换器架构、混合监督训...
TripoSF – 重塑 3D 建模未来
TripoSF 是什么 TripoSF 是 VAST AI 推出的新一代 3D 基础模型,它突破了传统 3D 建模在细节、复杂结构和扩展性上的瓶颈。其采用 SparseFlex 表示方法,结...
DistilQwen2.5-R1 – 知识蒸馏赋能的小型化推理模型新选择
DistilQwen2.5-R1 是什么 DistilQwen2.5-R1 是阿里巴巴于 2025 年 3 月推出的基于知识蒸馏技术的小型化系列深度推理模型,包含 3B、7B、14B 和 32B 四个参...
PaddleSpeech – 开源语音大模型,赋能语音交互
PaddleSpeech 是什么 PaddleSpeech 是百度 PaddlePaddle 生态下的语音工具集,涵盖了语音识别、语音合成、声纹识别等多个语音相关的技术领域。它提供了简...
ChatAnyone – 阿里巴巴通义实验室的实时风格化肖像视频生成框架
ChatAnyone是什么 ChatAnyone 是阿里巴巴通义实验室推出的一款实时风格化肖像视频生成框架。它能够通过音频输入,生成具有丰富表情和上半身动作的肖像视频...
RoboBrain – 开源具身大脑模型,推动机器人智能进化
RoboBrain 是什么 RoboBrain 是由智源研究院开发的开源具身大脑模型,于 2025 年 3 月 29 日在中关村论坛上正式推出。它旨在推动单机智能向群体智能演进,...
RoboBrain – 开源具身大脑模型,推动机器人智能进化
RoboBrain 是什么 RoboBrain 是由智源研究院开发的开源具身大脑模型,于 2025 年 3 月 29 日在中关村论坛上正式推出。它旨在推动单机智能向群体智能演进,...
RoboOS – 开启智能机器人协作新时代的跨本体具身大小脑协作框架
RoboOS 是什么 RoboOS 是北京智源人工智能研究院推出的全球首个跨本体具身大小脑协作框架。它基于 “大脑 - 小脑” 分层架构,具身大脑 RoboBrain 负责全局...
Vidu Q1 – 领航 AI 视频生成新时代的高可控多模态模型
Vidu Q1 是什么 Vidu Q1 是由生数科技推出的新一代高性能生成式 AI 视频模型。它以极致的视觉质量、流畅的电影级过渡、精准音效和增强的动画风格等特点引...
ObjectMover – 图像编辑的新革命
ObjectMover 是香港大学和 Adobe Research 联合提出的新型图像编辑模型,它解决了图像中物体移动、插入和移除时出现的光照、阴影不协调以及物体失真等常见问...