未分类

Amodal3R – 重塑 3D 重建未来:从残缺到完整的跨越

Amodal3R 是什么 Amodal3R 是由南洋理工大学与牛津大学联合研发的条件式 3D 生成模型,专门针对物体遮挡场景设计,能够从部分可见的 2D 图像中推测并重建...

AutoAgent – 零代码 AI 助手的未来

一、AutoAgent 是什么 AutoAgent 是香港大学推出的零代码、自动化 LLM 智能体框架,基于自然语言交互,让用户无需编程即可创建智能助手,适用于智能搜索、...

Text to Bark – 开启人狗交流新纪元的 AI 产品

Text to Bark 是什么 Text to Bark 是由 ElevenLabs 推出的全球首个 AI“狗语”文本转语音模型 。用户输入文字并选择犬种后,该模型能够生成高度逼真的狗吠...

Cua – 重新定义 macOS 生产力的开源 AI 代理框架

Cua 是什么 Cua 是 trycua 团队推出的专为 macOS 用户设计的开源 AI Agent 项目,基于苹果的 Virtualization.Framework,支持在 Apple Silicon 上创建并运...

SWEET-RL – 多轮强化学习的革新者

SWEET-RL 是什么 SWEET-RL 是由 Meta 的 FAIR 团队和加州大学伯克利分校的研究人员共同推出的多轮强化学习框架,专为优化大型语言模型(LLM)代理在多轮交...

OThink-MR1 – 多模态推理优化的革新者

OThink-MR1 是什么 OThink-MR1 是 OPPO 研究院与香港科技大学(广州)联合推出的多模态语言模型优化框架。它专为提升多模态模型在复杂任务中的泛化推理能...

DeepSite – 革新前端开发的 AI 利器

DeepSite 是什么 DeepSite 是一款基于 DeepSeek-V3 模型的 AI 前端开发工具,由开发者 enzostvs 打造并托管于 Hugging Face 平台。用户无需配置环境或安装...

EasyControl Ghibli – 打开吉卜力风格图像生成的新世界

EasyControl Ghibli 是什么 EasyControl Ghibli 是一款基于 EasyControl 框架开发的专项 AI 模型,专注于将普通图像转换为具有宫崎骏动画美学特征的图像。...

Dolphin – 开源多模态文档解析大模型

Dolphin是什么 Dolphin是由字节跳动开源的多模态文档图像解析模型,于 2025 年 5 月 19 日发布,专为处理包含文本、表格、图形和公式等交织元素的复杂文档...

WorldScore – 虚拟世界的评估标尺

WorldScore 是斯坦福大学推出的首个统一评估世界生成模型的基准测试,旨在解决传统评估中“指标不可比”的痛点,为世界生成模型提供全面的评估框架,适用于 3D...
1 12 13 14 15 16 50