未分类
PhysGen3D – 开启单图生成交互式 3D 场景的新纪元
PhysGen3D 是什么 PhysGen3D 是一款由清华大学等顶尖高校联合推出的创新性 AI 产品,它能够将单张静态图像转换为可交互的动态 3D 场景,并生成具有物理真...
EmotiVoice – 开源多语言情感 TTS 引擎
EmotiVoice 是什么 EmotiVoice 是由网易有道开源的多语言、多声音和提示控制的文本到语音(TTS)系统。它支持英语和中文,提供超过 2000 种声音,用户可通...
Vibe Draw – 开源AI 3D建模工具,让创意无限绽放
Vibe Draw是什么 :Vibe Draw 是一款开源的 AI 3D 建模工具,它能够将用户在 2D 画布上绘制的涂鸦草图转化为精美的 3D 模型,打破了传统的 3D 建模技术门槛,...
OmniSQL – 开源文本到 SQL 转换的利器
OmniSQL 是什么 OmniSQL 是首个基于百万级合成数据训练的开源文本到 SQL 转换模型,由中国人民大学、字节跳动公司以及相关科研机构联合开发。它能够将自然...
MegaTTS 3 – 零样本语音合成的革新之力
MegaTTS 3 是什么 MegaTTS 3 是由字节跳动与浙江大学联合开发的零样本文本到语音合成系统,采用轻量级扩散模型,参数量仅 0.45B,可高效生成高质量语音。...
AutoGLM沉思 – 开启 AI 智能体 “边想边干” 新时代
AutoGLM沉思是什么 AutoGLM 沉思是由智谱 AI 推出的全球首个集深度研究能力和操作能力于一体的 AI Agent,能够模拟人类的思维过程,完成从数据检索、分析...
cpmGO – 面壁智能打造的全球首款纯端侧汽车智能助手
cpmGO 是什么 cpmGO 是面壁智能推出的全球首款专为汽车智能座舱设计的纯端侧智能助手,基于面壁小钢炮 MiniCPM 端侧模型开发,具备视觉、语音、多模态交互...
AReaL-boba – 开源强化学习训练框架的革新之力
AReaL-boba 是什么 AReaL-boba 是蚂蚁技术研究院和清华大学联合推出的开源强化学习训练框架,是 AReaL 的升级版本。它通过工程优化显著降低了强化学习训练...
Qlib – 开源 AI 量化投资平台的全面解析
Qlib 是什么 Qlib 是由微软亚洲研究院开发的开源 AI 量化投资平台,于 2020 年 9 月公开初版源码。它旨在为量化交易研究人员和算法交易员提供一个强大而灵...
OpenDeepSearch – 重新定义智能搜索的开源利器
OpenDeepSearch 是什么 OpenDeepSearch 是一款开源的深度搜索工具,基于开源推理模型和推理代理,专为与 Hugging Face 的 SmolAgents 无缝集成进行优化,...