未分类
Seedream 3.0 – 图像生成新突破,文生图领域的卓越之选
Seedream 3.0 是字节跳动 Seed 团队于 2025 年 4 月发布的新一代文生图主力模型,以下是对它的详细介绍: Seedream 3.0 是什么 Seedream 3.0 是一个原...
Quasar Alpha – 引领长上下文与高效编码的 AI 新锐
Quasar Alpha 是什么 Quasar Alpha 是由 OpenRouter 发布的预训练 AI 模型,作为其下一代长上下文基础模型的预发布版本,该模型采用新一代架构设计突破上...
OmniCam – 重定义视频创作的多模态视频生成框架
OmniCam 是由浙江大学、上海交通大学等高校联合研发的先进多模态视频生成框架,通过摄像机控制实现高质量的视频生成,支持多种输入模态组合,用户可以提供文...
AnimeGamer – 打造你的专属动漫世界
AnimeGamer 是什么 AnimeGamer 是由腾讯 PCG 与香港城市大学联合推出的一款基于多模态大型语言模型(MLLM)的无限动漫生活模拟系统。它能够通过自然语言指...
Awesome MCP Servers – 开源的 AI 模型全能工具箱
Awesome MCP Servers 是什么 Awesome MCP Servers 是一个开源项目,汇集了超过 3000 个基于 Model Context Protocol (MCP) 的服务器实现,覆盖浏览器自动...
ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架
ACTalker 是什么 ACTalker 是由香港科技大学联合腾讯和清华大学研发的端到端视频扩散框架,专门用于生成逼真的说话人头部视频。该框架创新性地采用并行 Ma...
SkyReels-A2 – 开启可控视频生成新时代
SkyReels-A2 是昆仑万维推出的一款开创性的可控视频生成框架,它能够依据文本提示,将各种视觉元素如人物、物体、背景等灵活组合成合成视频,并且可以严格保...
ChildMandarin – 推动儿童语音技术发展的开源数据集
ChildMandarin 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)共同推出的,针对 3-5 岁儿童的普通话语音数据集。 核心功能 语音识...
MagicColor – 重写数字着色规则的 AI 线稿上色工具
MagicColor 是什么 MagicColor 是由香港科技大学推出的多实例线稿图着色框架,支持高效地为线稿图添加色彩。它基于自监督训练策略和实例引导模块,解决了...
Step-R1-V-Mini – 多模态推理新星,引领智能交互未来
一、Step-R1-V-Mini 是什么 Step-R1-V-Mini 是阶跃星辰推出的一款轻量级多模态推理模型,它能够同时处理图文输入,并以文字形式输出推理结果。这款模型在...