未分类

GPT-4o mini TTS – 开启智能语音新时代的钥匙

GPT-4o mini TTS 是什么 GPT-4o mini TTS 是 OpenAI 于 2025 年 3 月 21 日发布的新一代语音合成大模型,基于 GPT-4o-mini 架构训练。它在文本转语音技术...

福棠·百川 – 开启儿科智能诊疗新时代的先锋

福棠·百川是什么 福棠·百川是全球首个儿科专用AI大模型,由国家儿童医学中心、首都医科大学附属北京儿童医院联合百川智能、小儿方健康共同发布。该模型覆...

Agent TARS – 开源多模态 AI 代理,开启智能工作新时代

一、Agent TARS 是什么 Agent TARS 是由字节跳动开源的一款多模态 AI 代理,能够通过视觉方式解读网页,与浏览器、命令行和文件系统无缝集成,实现复杂任...

gpt-4o-mini-transcribe – 高效语音转文本的轻量级利器

gpt-4o-mini-transcribe 是什么 gpt-4o-mini-transcribe 是 OpenAI 推出的一款语音转文本模型,是 gpt-4o-transcribe 的精简版。它基于 gpt-4o-mini 架构...

SpatialLM – 开启三维空间理解新纪元

SpatialLM是什么 SpatialLM是杭州群核科技自主研发的一款专为三维空间理解设计的大语言模型。它能够从普通手机或相机拍摄的视频中,快速生成物理正确的3D...

Multi – Agent Orchestrator – 重塑 AI 协作:多智能体编排的艺术

Multi - Agent Orchestrator 是什么 Multi - Agent Orchestrator 是一个灵活、功能强大的框架,旨在管理多个 AI 智能体并处理复杂的对话场景。它如同一个...

龙猫 LongCat – 美团的高效智能办公助手

龙猫 LongCat 是什么 龙猫 LongCat 是美团自主研发的生成式 AI 大模型,致力于借助先进的人工智能技术提升公司内部的工作效率与创新能力。该模型拥有强大...

Soundwave – 开源语音理解大模型,重塑语音交互体验

Soundwave 是什么 Soundwave 是香港中文大学(深圳)开源的语音理解大模型,专注于语音与文本的智能对齐和理解。通过创新的对齐适配器和压缩适配器技术,...

Motia – 重构 AI 开发范式的智能框架

Motia 是什么 :Motia 是一款专为软件工程师设计的 AI Agent 开发框架,旨在简化智能体的开发、测试和部署过程。它支持多种编程语言,如 Python、TypeScript ...

InfiniteYou – 打造个性化数字分身的 AI 利器

InfiniteYou 是什么 InfiniteYou(InfU)是字节跳动智能创作团队推出的一款基于扩散变换器(Diffusion Transformers)的身份保持图像生成框架。它通过 Inf...
1 5 6 7 8 9 50