未分类

SeniorTalk – 智能适老,连接长者与科技的桥梁

SeniorTalk 是智源研究院联合南开大学计算机学院人类语言技术实验室推出的全球首个中文超高龄老年人对话语音数据集。以下是详细介绍: SeniorTalk 的核心...

HiDream-I1 – 开启图像生成新时代的开源模型

HiDream-I1 是由 HiDream.ai 团队打造的国产开源图像生成模型,基于扩散模型技术,拥有 170 亿参数,采用混合专家架构,可依据文本描述生成照片级逼真图像,...

GitHub MCP Server – 开发者提效利器

GitHub MCP Server 是什么 GitHub MCP Server 是 GitHub 官方推出的一款基于模型上下文协议(MCP)的服务器工具,由 GitHub 和 Anthropic 联合开发,并采...

Nova Sonic – 重新定义语音交互体验的 AI 语音模型

一、Nova Sonic 是什么 Nova Sonic 是亚马逊在 2025 年 4 月推出的新一代生成式 AI 语音模型,旨在解决传统语音应用开发中的复杂性和不自然交互问题。它将...

DeepCoder-14B-Preview – 开源代码生成模型的新星

DeepCoder-14B-Preview 是由 Agentica 和 Together AI 联合开源的大型代码生成模型,基于 Deepseek-R1-Distilled-Qwen-14B 微调而成。该模型采用分布式强化学...

Dream-7B – 开启文本生成新纪元的开源扩散推理模型

Dream-7B 是什么 Dream-7B 是由香港大学和华为诺亚方舟实验室联合推出的开源扩散式推理模型,是当前最强大的开源扩散大语言模型之一。与传统自回归模型逐...

Llama Nemotron – 开源推理模型的革新之力

Llama Nemotron 是什么 Llama Nemotron 是英伟达基于开源的 Meta Llama 模型开发的一系列专注于推理任务的 AI 模型,经过英伟达的后训练,为代理式 AI 做...

Miracle F1 – 重新定义 AI 图像创作标准

Miracle F1 是什么 Miracle F1 是美图 WHEE 于 2025 年推出的新一代 AI 图像生成模型,它凭借专业级的图像处理能力,生成的图像在光影效果、材质还原等方...

Lipsync-2 – 革新视频制作的零-shot嘴型同步模型

Lipsync-2 是由人工智能技术公司 Sync Labs 推出的全球首个零-shot 嘴型同步模型,它在视频制作和内容创作领域带来了重大变革,无需针对特定演讲者进行预训练...

EasyControl – 引领图像生成新纪元的高效控制框架

EasyControl是什么 EasyControl 是 Tiamat AI 开源的基于扩散变换器(Diffusion Transformer,DiT)架构的高效灵活控制框架,旨在解决当前 DiT 生态系统中...
1 15 16 17 18 19 50