未分类

OLMo 2 32B – 开源界的强大新秀

OLMo 2 32B 是什么 OLMo 2 32B 是由 Allen Institute for AI(Ai2)推出的一款先进的开源语言模型,属于 OLMo 2 系列的重大进展。它拥有 320 亿参数,是首...

InternVL – 开源多模态大模型的先锋

InternVL 是什么 InternVL 是由上海人工智能实验室 OpenGVLab 团队推出的一系列开源多模态大模型,旨在打造媲美商业模型的开源替代品。它基于海量的网络级...

Umi-OCR – 免费开源的离线 OCR 文字识别利器

Umi-OCR 是什么 Umi-OCR 是一款免费开源、支持离线使用的光学字符识别(OCR)工具,基于 PaddleOCR 和 Tesseract-OCR 开发,能够高效识别图片中的文字,尤...

Orpheus TTS – 开源语音合成的新标杆

Orpheus TTS 是什么 Orpheus TTS 是由 Canopy Labs 开发的一款基于 Llama-3b 架构的开源文本转语音系统,于 2025 年 3 月 19 日发布。它旨在提供接近人类...

o1-pro – 探索未来智能:AI推理新巅峰

o1-pro是什么 o1-pro是OpenAI于2025年3月正式向开发者开放的o1系列中的顶级版本,目前OpenAI最强大的推理模型。其核心理念是投入更多计算资源用于思考,以...

Crack Coder – 编程面试的隐形 AI 辅助利器

Crack Coder 是什么 Crack Coder 是一款开源的隐形 AI 辅助工具,专为技术面试设计。它支持在后台运行,完全隐形,无法被屏幕录制或监控软件检测到,可为...

Step-Video-TI2V – 开源图生视频生成的重磅利器

Step-Video-TI2V 是什么 Step-Video-TI2V 是由上海追趣智能科技有限公司旗下的阶跃星辰团队推出的一款开源图生视频模型。其基于 30B 参数的 Step-Video-T2...

Step-Video-TI2V – 开源图生视频生成的重磅利器

Step-Video-TI2V 是什么 Step-Video-TI2V 是由上海追趣智能科技有限公司旗下的阶跃星辰团队推出的一款开源图生视频模型。其基于 30B 参数的 Step-Video-T2...

Dify-Plus – 企业级 AI 应用开发的利器

Dify-Plus 是什么 Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,集成了基于 gin-vue-admin 的管理中心,新增了用户额度、密钥额度、Web 公开页登录...

gpt-4o-transcribe – 高性能语音转文本的利器

一、gpt-4o-transcribe 是什么 gpt-4o-transcribe 是由 OpenAI 推出的一款先进的语音转文本模型。它采用最新的语音模型架构,经过海量多样化音频数据训练...
1 4 5 6 7 8 50