未分类

Seedream 2.0 – 原生中英双语图像生成的之力革新

Seedream 2.0 是什么 Seedream 2.0 是由字节跳动豆包大模型团队推出的原生中英双语图像生成基础模型 。自 2024 年 12 月初在豆包 APP 和即梦平台上线以来...

PP-DocBee – 深度解析文档图像的多模态大模型

一、PP-DocBee 是什么 PP-DocBee 是百度飞桨团队推出的一款专注于文档图像理解的多模态大模型。它基于 ViT+MLP+LLM 架构,具备强大的中文文档解析能力,能...

BEHAVIOR Robot Suite – 开源框架革新家庭任务自动化

BEHAVIOR Robot Suite(BRS)是由斯坦福大学李飞飞团队开发的开源机器人控制框架,专为学习全身操作以执行日常家务任务而设计。 核心功能 全身操作能...

MM-StoryAgent – 开源多模态、多智能体故事生成系统

MM-StoryAgent 是什么 MM-StoryAgent 是上海交通大学 X-LANCE 实验室和阿里巴巴集团联合推出的开源多模态、多智能体框架,用于生成沉浸式的有声故事绘本视...

Deep Research Web UI – 开源智能研究助手的深度解析

Deep Research Web UI 是一款开源的 AI 研究助手工具,通过 AI 驱动的迭代搜索和多语言支持,帮助用户高效进行深度研究,并以树状结构可视化研究过程,支持导...

Gemma 3 – 开源多模态 AI 模型的新标杆

Gemma 3 是什么 Gemma 3 是谷歌于 2025 年 3 月 12 日推出的一款开源多模态轻量级 AI 模型 。它基于与 Gemini 2.0 模型相同的研究和技术构建,专为开发者...

Reka Flash 3:高效能推理模型引领 AI 应用新潮流

Reka Flash 3 是什么 Reka Flash 3 是由 Reka AI 推出的一款开源通用推理模型,拥有 21 亿参数,从零开始训练,利用合成和公共数据集进行监督微调,并结合...

子曰翻译 2.0 – 网易有道的翻译新突破

子曰翻译 2.0 是网易有道推出的最新翻译大模型,以下将从多个方面为您详细介绍: 子曰翻译 2.0 是什么 :子曰翻译 2.0 是网易有道推出的最新翻译大模型,...

Motion Anything – 多模态运动生成的革新者

Motion Anything 是什么 Motion Anything 是由澳大利亚国立大学、悉尼大学、腾讯、麦吉尔大学、京东等机构推出的多模态运动生成框架。它能够根据文本描述...

AI-Researcher – 开源全自动科研助手,重塑科研流程

AI-Researcher 是香港大学数据科学实验室推出的开源自动化科学研究工具,基于大型语言模型(LLM)代理,可实现从研究想法到论文发表的全流程自动化,显著提升...
1 2 3 50