未分类
Pixel3DMM – 高精度单图像3D人脸重建的创新突破
Pixel3DMM是什么 Pixel3DMM是由慕尼黑工业大学、伦敦大学学院和Synthesia联合推出的一款单图像3D人脸重建框架。它基于DINO基础模型,通过引入专门的预测头...
AutoBE – AI驱动的后端代码生成引擎
AutoBE是一款由Wrtn Labs开发的AI驱动的后端服务器代码生成工具,旨在通过自然语言描述自动生成高质量的后端代码。它结合了瀑布模型的结构化开发流程和螺旋模...
Gemma 3n – 移动端多模态 AI 的新标杆
Gemma 3n 是谷歌在 2025 年 I/O 开发者大会上发布的端侧多模态 AI 模型,专为低资源设备设计,具备强大的多模态处理能力。它继承了 Gemini Nano 架构,通过创...
BAGEL – 开源多模态AI的全能选手
BAGEL是什么 BAGEL是由字节跳动Seed团队开发的一款开源多模态基础模型,旨在实现文本、图像和视频的统一理解和生成。它拥有14亿总参数和7亿活跃参数,基于...
Graphiti – 构建动态知识图谱的AI利器
Graphiti是什么 Graphiti是一个专为动态环境设计的AI知识图谱生成框架,旨在为AI智能体构建具备查询能力且能够感知时间的知识网络。它能够实时捕获和处理...
MedGemma – 医疗AI领域的创新突破
MedGemma是什么 MedGemma是由谷歌DeepMind开发的一系列先进AI模型,专为医疗文本和图像理解而设计。它基于强大的Gemma 3架构,于2025年5月在谷歌I/O大会上...
Context7 – 智能编程的上下文利器
Context7 是什么? Context7 是由 Upstash 团队开发的一款 AI 编程辅助工具,旨在为大型语言模型(LLMs)和 AI 代码编辑器提供最新、版本特定的文档和代码...
DreamGen – 探索人工智能的无限可能
DreamGen是什么 DreamGen是由英伟达推出的一项创新的机器人学习技术,同时也是一款AI角色扮演与故事生成器。它基于AI视频世界模型生成合成数据,让机器人...
Devstral – 开源智能体时代的软件工程利器
Devstral是什么 Devstral是由Mistral AI与All Hands AI联合推出的一款专为软件工程任务设计的开源编程专用模型。它基于Mistral Small 3.1模型微调而成,专...
MMaDA – 多模态扩散大语言模型:开启 AI 跨模态新时代
MMaDA 是什么 MMaDA(Multimodal Large Diffusion Language Models)是由普林斯顿大学、字节跳动、清华大学及北京大学联合研发的多模态扩散大语言模型。它...