未分类
Gemini 2.5 Pro (I/O 版) – 开发者的强大助力
Gemini 2.5 Pro (I/O 版) 是什么 Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升级版多模态 AI 模型,版本号为 Gemini 2.5 Pro Preview 05-...
VPP – 开启智能未来:AI 技术的革新力作
VPP 是什么 VPP 即 Video Prediction Policy,是清华大学和星动纪元推出的首个 AIGC 机器人大模型。它基于预训练的视频扩散模型,学习互联网上的大量视频...
Amazon Nova Premier – 重构企业级 AI 应用的新标杆
Amazon Nova Premier 是什么 Amazon Nova Premier 是亚马逊目前功能最强大的多模态 AI 模型,于 2025 年 5 月 6 日正式在 Amazon Bedrock 中可用。它能处...
ICEdit – 开源指令式图像编辑框架的革新之旅
ICEdit是什么 ICEdit 是浙江大学和哈佛大学联合推出的指令式图像编辑框架,基于大规模扩散变换器的强大生成能力和上下文感知能力,可使用自然语言指令对图...
FlexiAct – 灵活动作控制的未来已来
FlexiAct是由清华大学与腾讯ARC实验室联合开发的先进动作迁移模型,能够在异构场景中将参考视频中的动作精准迁移到目标主体上,即使在空间结构差异显著或跨域...
Klavis AI – 开源 MCP 集成平台,加速 AI 应用部署
一、Klavis AI 是什么 Klavis AI 是 Y Combinator 孵化的一个开源项目,基于多模态通信协议(MCP),旨在为 AI 应用提供快速接入生产级 MCP 服务器和客户...
oli – 开源智能代码助手,赋能开发者高效编程
oli 是什么 oli 是一款开源的智能代码辅助工具,专为开发者打造,基于现代化的混合架构,结合 Rust 语言后端的高性能处理能力和 React/Ink 框架前端的交互...
Open Computer Agent – 开启智能自动化新纪元的云端 AI 工具
Open Computer Agent 是什么 Open Computer Agent 是由 Hugging Face 推出的免费云端 AI Agent 工具。它支持在 Linux 虚拟机中运行,能够基于预装的程序(...
Open Computer Agent – 开启智能自动化新纪元的云端 AI 工具
Open Computer Agent 是什么 Open Computer Agent 是由 Hugging Face 推出的免费云端 AI Agent 工具。它支持在 Linux 虚拟机中运行,能够基于预装的程序(...
Insert Anything – 图像插入的革命性工具
Insert Anything 是什么 : Insert Anything 是由浙江大学、哈佛大学和南洋理工大学的研究人员联合推出的基于上下文编辑的图像插入框架。它能够将参考图像...