未分类

PaperBench – 开源 AI 智能体评测基准

PaperBench 是什么 PaperBench 是 OpenAI 开源的 AI 智能体评测基准,用于评估智能体复现顶级学术论文的能力,要求智能体从理解论文内容到编写代码、执行...

DreamActor-M1 – 重定义数字内容创作

DreamActor-M1 是字节跳动推出的一款先进 AI 图像动画框架,以下是关于它的详细介绍: DreamActor-M1 是什么 DreamActor-M1 是一种新型人体动画生成框...

Mini DALL·E 3 – 开源交互式文生图框架的革新之力

Mini DALL·E 3是什么 Mini DALL·E 3是由北京理工大学、上海 AI Lab、清华大学和香港中文大学联合研发的交互式文本到图像(iT2I)框架,也是首个实现多轮交...

MoCha – 重新定义对话角色视频生成的 AI 黑科技

MoCha 是什么 MoCha 是由 Meta 与滑铁卢大学联合开发的端到端对话角色视频生成模型,能根据文本或语音输入生成带有同步语音和自然动作的完整角色动画,首...

DeepSeek-GRM – 重塑奖励模型的新典范

DeepSeek-GRM是什么 DeepSeek-GRM是DeepSeek和清华大学研究者共同提出的通用奖励模型。它通过点式生成式奖励建模和自我原则点评调优等技术,显著提升了奖...

OlympicArena – 多学科认知推理的权威基准

OlympicArena 是什么 OlympicArena 是由上海交通大学、上海 AI Lab、苏州大学和上海交通大学生成式人工智能实验室(GAIR Lab)联合推出的多学科认知推理基...

AbletonMCP – 音乐创作的智能助手

AbletonMCP 是什么 AbletonMCP 是一个开源项目,通过模型上下文协议(MCP)将音乐制作软件 Ableton Live 与 AI 工具 Claude AI 连接,实现 AI 辅助音乐制...

BabelDOC – 开源智能 PDF 翻译工具,重塑文档翻译体验

BabelDOC 是什么 BabelDOC 是一款专为科学论文及多语言文档设计的开源 PDF 翻译工具,由 funstory-ai 团队精心打造。它能够精准保留 PDF 文档的原始排版,...

Llama 4 – 开放式AI模型的新标杆:探索Meta的多功能语言模型

Llama 4是什么 Llama 4 是由Meta推出的大型语言模型家族,于2025年4月5日发布。其引入了混合专家架构,并具备多模态能力,可处理文本、图像、视频等多种数...

OmniTalker – 全模态 AI 对话新体验

OmniTalker 是什么 :OmniTalker 是一款由阿里云推出的一站式全模态对话产品,于 2025 年 4 月 8 日在 AI Base 正式开放体验。其核心技术源于阿里云最新发布...
1 13 14 15 16 17 50