未分类
Chatterbox – 开启智能语音合成的新篇章
Chatterbox是什么 Chatterbox是由Resemble AI开发的一款生产级开源文本到语音(TTS)模型。它基于强大的0.5B参数Llama架构,经过50万小时的高质量音频数据...
SearchAgent-X – 高效推理框架引领AI搜索智能体效率革命
SearchAgent-X是由南开大学与伊利诺伊大学厄巴纳-香槟分校(UIUC)联合研发的高效推理框架,专为提升大语言模型(LLM)驱动的搜索智能体性能而设计。该框架通...
SearchAgent-X – 高效推理框架引领AI搜索智能体效率革命
SearchAgent-X是由南开大学与伊利诺伊大学厄巴纳-香槟分校(UIUC)联合研发的高效推理框架,专为提升大语言模型(LLM)驱动的搜索智能体性能而设计。该框架通...
WebAgent – 开源自主搜索AI智能体,开启智能信息检索新时代
WebAgent是什么 WebAgent是由阿里巴巴开源的一款自主搜索AI智能体,具备端到端的自主信息检索与多步推理能力。它能够像人类一样在网络环境中主动感知、决...
OmniSync – 创新音视频同步技术的突破
OmniSync是什么 OmniSync是由中国人民大学、快手科技和清华大学联合推出的一款通用对口型框架,旨在通过先进的技术实现视频中人物口型与语音的精准同步。...
OmniSync – 创新音视频同步技术的突破
OmniSync是什么 OmniSync是由中国人民大学、快手科技和清华大学联合推出的一款通用对口型框架,旨在通过先进的技术实现视频中人物口型与语音的精准同步。...
OmniSync – 创新音视频同步技术的突破
OmniSync是什么 OmniSync是由中国人民大学、快手科技和清华大学联合推出的一款通用对口型框架,旨在通过先进的技术实现视频中人物口型与语音的精准同步。...
FLUX.1 Kontext – 下一代智能图像生成与编辑的突破
FLUX.1 Kontext是什么 FLUX.1 Kontext是由Black Forest Labs开发的先进图像生成与编辑模型,专注于智能理解图像上下文并执行精确编辑。它通过文本和图像提...
SignGemma – 打破沟通障碍的AI手语翻译模型
SignGemma是什么 SignGemma是由谷歌DeepMind团队于2025年5月27日推出的一款强大的AI手语翻译模型。作为Gemma模型家族的最新成员,SignGemma专注于将美国手...
DGM – 自我进化的AI Agent系统
DGM是什么 DGM(Darwin Gödel Machine)是由Sakana AI与加拿大UBC合作推出的一款自改进型AI Agent系统。它结合了达尔文进化论和哥德尔完备性原理,能够通...