未分类

Omni Reference – 打造图像生成新境界的全能参考神器

Omni Reference 是什么 Omni Reference 是 Midjourney 推出的一项全能图像参考功能,它支持用户将特定的人物、物体或场景从参考图像中嵌入到生成的图像中...

3DV-TON – 开启视频虚拟试穿新时代

3DV-TON 是什么 3DV-TON 是阿里巴巴达摩院、湖畔实验室和浙江大学联合推出的基于扩散模型的视频虚拟试穿框架。其借助先进的 3D 几何与纹理建模以及视频扩...

ACE-Step – 开源音乐生成基础模型,赋能音乐创作新时代

ACE-Step 是什么 ACE-Step 是由 ACE Studio 和阶跃星辰(StepFun)联合开发的一款开源音乐生成基础模型,于 2025 年 5 月 7 日正式开源。它基于创新的架构...

ReasonIR-8B – 引领推理密集型检索的新引擎

ReasonIR-8B 是什么 ReasonIR-8B 是由 Meta AI 推出的首个专门针对通用推理任务训练的检索器,基于 LLaMA3.1-8B 训练,采用双编码器架构,并结合创新的数...

kimi-thinking-preview – 深度推理先锋:解锁复杂问题新解法

kimi-thinking-preview 是什么 kimi-thinking-preview 是月之暗面公司推出的一款先进的多模态思考模型,专为处理复杂推理任务而设计。它具备强大的深度分...

kimi-thinking-preview – 深度推理先锋:解锁复杂问题新解法

kimi-thinking-preview 是什么 kimi-thinking-preview 是月之暗面公司推出的一款先进的多模态思考模型,专为处理复杂推理任务而设计。它具备强大的深度分...

UniTok – 字节联合高校推出的创新视觉分词器

UniTok 是什么 UniTok 是由字节跳动联合香港大学和华中科技大学共同推出的一款用于视觉生成和理解的统一视觉分词器 ,能够高效地将视觉信息转化为 token,...

D-DiT – 多模态扩散模型的创新之作

D-DiT 是什么 D-DiT(Dual Diffusion Transformer)是由卡内基梅隆大学、耶鲁大学与字节跳动 Seed 实验室联合推出的一种多模态扩散模型,旨在整合图像生成...

NoteLLM – 多模态笔记推荐的创新引擎

NoteLLM 是什么 NoteLLM 是小红书推出的针对笔记推荐的多模态大型语言模型框架。其目的是解决传统推荐系统中对视觉信息关注不足的问题,通过结合文本和图...

Granite 4.0 Tiny Preview – 开源界的高效能语言模型新星

一、Granite 4.0 Tiny Preview 是什么 Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 语言模型家族中最小的模型的预览版本,是一个 70 亿参数、10 ...
1 28 29 30 31 32 50