未分类

Hummingbird-0 – 革新零样本唇形同步技术的 AI 模型

Hummingbird-0 是什么 Hummingbird-0 是 Tavus 推出的一款人工智能口型同步模型,基于 Phoenix-3 模型的架构开发,具备零样本学习的特性,能够在无需额外...

OpenMath-Nemotron – 数学推理领域的强大工具

OpenMath-Nemotron 是什么 OpenMath-Nemotron 是英伟达推出的一系列开源数学推理模型,专为解决复杂数学问题而设计,能够处理从基础数学到奥林匹克竞赛级...

Kimi-Audio – 开源音频基础模型的新标杆

Kimi-Audio是什么 Kimi-Audio 是 Moonshot AI 推出的开源音频基础模型,专注于音频理解、生成和对话任务。在超过 1300 万小时的多样化音频数据上进行预训...

Firefly Image Model 4 – 重新定义图像生成的边界

Firefly Image Model 4 是什么 Firefly Image Model 4 是 Adobe 于 2025 年 4 月 24 日推出的一款图像生成模型,是当前最先进的 Firefly 图像模型,标志着...

Step1X-Edit – 开源图像编辑新标杆

Step1X-Edit 是什么 Step1X-Edit 是由阶跃星辰团队推出的一款通用图像编辑框架,于 2025 年 4 月 25 日正式开源。其创新性地结合了多模态大语言模型(MLLM...

WebSSL – 开启视觉智能新时代的自监督学习模型

WebSSL 是什么 WebSSL(Web-scale Self-Supervised Learning)是由 Meta、纽约大学等机构联合开发的一系列视觉自监督学习(SSL)模型。它利用海量网络数据...

Paper2Code – 桥梁构建者:科研与实践的高效转化利器

Paper2Code 是什么 Paper2Code 是由韩国科学技术院和 DeepAuto.ai 联合推出的多智能体大语言模型(LLM)框架,专注于将机器学习领域的科学论文自动转换为...

EmaFusion – 重新定义企业级 AI 应用的多模型融合技术

EmaFusion 是什么 EmaFusion 是由人工智能初创企业 Ema 推出的一项先进的多模型融合技术。它致力于为企业级 AI 应用提供高效、灵活且经济实惠的解决方案。...

Lyria 2 – AI 音乐创作的全新篇章

Lyria 2 是什么 Lyria 2 是谷歌 DeepMind 推出的第三代 AI 音乐生成模型,作为 Vertex AI 平台的核心组件,它首次实现了全模态音乐生成能力,涵盖了从文本...

Concept Lancet – 创新图像编辑的利器

Concept Lancet 是什么 Concept Lancet(简称 CoLan)是宾夕法尼亚大学研究团队推出的一款零样本、即插即用的图像编辑框架。它基于在潜在空间中对图像进行...
1 24 25 26 27 28 50