未分类

Open-Sora 2.0 – 开源视频生成的革新之选

Open-Sora 2.0 是什么 Open-Sora 2.0 是潞晨科技推出的一款全新开源 SOTA(State-of-the-Art)视频生成模型。它仅用 20 万美元(约 224 张 GPU)的训练成...

Gemini Robotics – 赋能机器人新时代的智能引擎

Gemini Robotics 是谷歌 DeepMind 推出的基于 Gemini 2.0 的机器人项目,将大型多模态模型的能力引入物理世界。以下是关于 Gemini Robotics 的详细介绍: ...

PP-TableMagic – 表格结构化信息提取的得力助手

PP-TableMagic 是什么 PP-TableMagic 是百度飞桨团队推出的一款高性能表格识别工具,能够将图片中的表格结构化信息提取出来并转换为 HTML 等格式,便于进...

Gemini 2.0 Flash – 开启智能新时代的多模态 AI 模型

什么是 Gemini 2.0 Flash Gemini 2.0 Flash 是谷歌于 2024 年 12 月推出的最新多模态 AI 模型,作为 Gemini 2.0 系列的首款模型,它具有低延迟和高性能的...

TokenSwift – 超长文本生成加速利器

TokenSwift是什么 TokenSwift是北京通用人工智能研究院团队推出的超长文本生成加速框架。它能在90分钟内生成10万Token的文本,相比传统自回归模型的近5小...

MIDI – 解码音乐创作的数字密钥

MIDI 是什么 MIDI 是乐器数字接口(Musical Instrument Digital Interface)的缩写,它是一种用于电子乐器、计算机及其他音频设备间通信的国际标准协议和...

Evolving Agents – 开源 AI 代理管理与进化框架

Evolving Agents 是什么 Evolving Agents 是一个开源的 AI Agent 管理与进化框架,旨在通过智能代理的协同工作提升任务处理效率和效果。它支持智能代理之...

MT-MegatronLM – 开源混合并行训练框架的创新之力

MT-MegatronLM 是摩尔线程推出的一款面向全功能 GPU 的开源混合并行训练框架,专为高效训练大规模语言模型而设计。以下从多个方面进行介绍: 核心功能 :...

APB – 智能高效的数据处理助手

APB是什么 APB即Advanced Peripheral Bus,是ARM公司提出的AMBA总线结构之一,是一种片上总线协议,主要适用于低带宽的周边外设之间的连接,如UART、IIC等...

Botgroup.chat – 开源多人 AI 聊天应用,开启群聊式 AI 交互新体验

Botgroup.chat 是什么 Botgroup.chat 是一款基于 React 和 Cloudflare Pages 构建的开源 AI 聊天应用,支持多个 AI 角色同时参与对话,模拟真实的群聊环境...
1 2 3 4 50