Reka Flash 3：高效能推理模型引领 AI 应用新潮流

未分类 2025-06-23 10:08

Reka Flash 3 是由 Reka AI 推出的一款开源通用推理模型，拥有 21 亿参数，从零开始训练，利用合成和公共数据集进行监督微调，并结合基于模型和规则的强化学习深度优化。它支持多模态输入，包括文本、图像、视频和音频，可处理最多 32k 个令牌的上下文长度，适用于多种应用场景。

模块化的编码器 - 解码器架构：编码器负责处理多种输入数据类型并转换为高维向量表示，解码器基于编码器的输出生成文本输出。
强化学习训练：采用 REINFORCE Leave One-Out（RLOO）方法进行强化学习，结合公开获取的数据集和合成数据集，使模型在能力与效率之间取得平衡。
预算强制机制：允许用户在模型思考一定步数后强制其输出，即使思考尚未完成，通常仍能产生合理的结果。

Reka Flash 3 以 Llama 兼容格式发布，可与 Hugging Face Transformers 和 vLLM 等常用库无缝集成。

Reka AI 是一家由前谷歌 DeepMind 科学家团队创立的人工智能公司，专注于开发先进的开源模型和平台，如 Reka Flash 3 和 Nexus 平台，旨在为组织提供更高效的 AI 工作流程和强大的分析能力。