未分类
Kimi-VL – 轻量级高效多模态视觉语言模型的创新与应用
一、Kimi-VL 是什么 Kimi-VL 是由月之暗面公司(Moonshot AI)推出的一款开源视觉语言模型(VLM),具备原生分辨率图像理解、多模态推理和 128K 长上下文...
FantasyTalking – 革新数字人生成的 AI 框架
FantasyTalking 是什么 FantasyTalking 是由阿里巴巴 AMAP 团队与北京邮电大学联合研发的基于视频扩散变换器的新型数字人生成框架,可从单张静态图像生成...
BrowseComp – AI 代理网络浏览能力的终极试炼
BrowseComp 是什么 BrowseComp 是由 OpenAI 开发的一款用于评估 AI 代理网络浏览能力的基准测试工具,包含 1266 个极具挑战性的问题,覆盖电影、科学与技...
日日新 SenseNova V6 – 多模态融合的 AI 新纪元
日日新 SenseNova V6 是商汤科技于 2025 年 4 月 10 日发布的第六代多模态融合大模型系列,该模型基于 6000 亿参数的多模态 MoE 架构,实现了文本、图像和视...
明岐 – 破解罕见病诊断难题的多模态大模型
明岐是什么 明岐是由上海交通大学计算机学院(网络空间安全学院)LoCCS实验室的王烁教授领导研发的国内首个可精准诊断罕见病的医学影像多模态大模型。其专...
Fourier N1 – 开源人形机器人的创新之光
Fourier N1 是什么 Fourier N1 是通用机器人公司傅利叶于 2025 年 4 月 11 日正式发布的首款开源人形机器人,代号 “Nexus - 01”。它高 1.3 米,重 38 公斤...
ScholarCopilot – 学术写作的智能副驾驶
一、ScholarCopilot 是什么 ScholarCopilot 是一款由 TIGER Lab 推出的开源 AI 辅助学术写作工具,它不仅仅是一个简单的文本生成工具,更是一位能够精准引...
AgentPrune – 革新多智能体通信的高效框架
AgentPrune 是什么 AgentPrune 是由同济大学、香港中文大学等机构联合开发的开源多智能体通信优化框架,旨在解决大型语言模型(LLM)驱动的多智能体系统(...
心影大模型 – 深度融合游戏攻略与角色陪伴的 AI 产品
心影大模型是什么 心影大模型是心影随形顶尖 AI 团队研发的专注于游戏领域的 AI 大模型,正式通过国家生成式人工智能服务备案。其深度融合游戏攻略与角色...
FlexIP – 腾讯的个性化图像生成编辑框架
FlexIP 是什么 FlexIP 是腾讯提出的面向图像合成的灵活主体属性编辑框架,旨在平衡图像生成中的身份保持和个性化编辑。该框架采用双适配器架构,将身份保...