未分类
Cosmos-Reason1 – 重塑 AI 物理推理能力的多模态大语言模型
Cosmos-Reason1 是什么 Cosmos-Reason1 是 NVIDIA 推出的系列多模态大型语言模型,包括 Cosmos-Reason1-8B 和 Cosmos-Reason1-56B 两种参数规模的模型。它...
RF-DETR – 实时目标检测的新标杆
RF-DETR 是什么 RF-DETR 是由 Roboflow 团队推出的一款基于 Transformer 的实时目标检测模型架构,目标是实现高精度和低延迟的目标检测,并且能够在边缘设...
Bolt3D – 3D 场景生成的革新之力
Bolt3D 是什么 Bolt3D 是由谷歌研究院、牛津大学 VGG 团队和谷歌 DeepMind 联合推出的新型 3D 场景生成技术,采用潜在扩散模型架构。它可在单个 GPU 上,...
Piece it Together – 创新图像生成框架助力创意设计
Piece it Together 是什么 Piece it Together(PiT)是由特拉维夫大学和 Bria AI 联合开发的创新图像生成框架,旨在帮助视觉设计师和艺术家从部分视觉组件...
TripoSR – 开源 3D 生成模型的革新之力
TripoSR 是什么 TripoSR 是由 Stability AI 和 VAST 联合推出的开源 3D 生成模型,可在不到 0.5 秒内从单张 2D 图像快速生成高质量的 3D 模型。它基于 Tra...
ModelEngine – 开源全流程 AI 开发工具链的创新之作
ModelEngine 是由华为开发并开源的全流程 AI 开发工具链,于 2025 年 3 月 27 日在华为中国合作伙伴大会上向全球开发者开源发布,旨在解决 AI 行业化落地过程...
BizGen – 革新信息图生成的 AI 利器
BizGen 是什么 BizGen 是清华大学和微软研究院联合推出的 AI 信息图生成工具,专注于文章级别的视觉文本渲染。它能够一键将长篇文章内容转化为专业级的信...
Ideogram 3.0 – 图像生成领域的重大突破
一、Ideogram 3.0 是什么 Ideogram 3.0 是由 Ideogram, Inc. 开发的一款先进的 AI 图像生成模型,于 2025 年 3 月正式推出。它在图像生成质量、真实感表现...
QVQ-Max – 视觉推理新纪元的开启者
QVQ-Max 是什么 QVQ-Max 是阿里通义团队基于 Qwen2.5-Max 模型打造的多模态视觉推理利器。它融合先进视觉编码技术和强大语言模型,使 AI 能从图像、视频中...
TxGemma – 谷歌 DeepMind 打造的高效药物研发 AI 模型
TxGemma 是什么 TxGemma 是谷歌 DeepMind 团队推出的一套专为医疗领域设计的通用人工智能模型,用于加速药物发现和治疗开发过程。它基于 Google 的 Gemma ...