未分类

ReasonGraph – 开源可视化与分析 LLMs 推理过程的 AI 工具

ReasonGraph 是什么 ReasonGraph 是一个用于可视化和分析大语言模型(LLMs)推理过程的开源网络平台。它支持超过 50 种主流模型,如 Anthropic、OpenAI、G...

Gemini 2.5 Pro – 谷歌新一代多模态 AI 模型的全面解析

一、什么是 Gemini 2.5 Pro Gemini 2.5 Pro 是谷歌于 2025 年推出的新一代多模态大型语言模型,代表了人工智能领域在复杂推理、多模态处理和超长上下文理...

pdf-craft – 开源 PDF 转 Markdown/EPUB 的高效工具

pdf-craft 是什么 pdf-craft 是一款开源的 PDF 格式转换工具,专注于处理扫描书籍类 PDF 文件。它能智能提取正文内容,自动过滤页眉、页脚、脚注等干扰元...

TaoAvatar – 开启虚拟人新时代的钥匙

TaoAvatar是什么 TaoAvatar 是阿里巴巴达摩院自动驾驶实验室梦飞团队推出的高保真、轻量级的 3D 全身对话虚拟人技术。它基于 3D 高斯溅射(3DGS)技术开发...

Mureka O1 – 音乐创作的革新者

Mureka O1 是什么 Mureka O1 是昆仑万维于 2025 年 3 月 26 日推出的全球首款音乐推理大模型,也是全球首个引入 “思维链”(Chain of Thought,CoT)技术的...

Video-T1 – 视频生成领域的新突破

Video-T1 是什么 Video-T1 是清华大学和腾讯的研究人员共同推出的视频生成技术,基于测试时扩展(Test-Time Scaling,TTS)提升视频生成的质量和一致性。...

Video-T1 – 视频生成领域的新突破

Video-T1 是什么 Video-T1 是清华大学和腾讯的研究人员共同推出的视频生成技术,基于测试时扩展(Test-Time Scaling,TTS)提升视频生成的质量和一致性。...

Fin-R1 – 金融推理利器,赋能金融智能化转型

Fin-R1 是什么 Fin-R1 是一款由上海财经大学统计与数据科学学院张立文教授团队(SUFE-AIFLM-Lab)联合财跃星辰开发的金融领域推理型大语言模型。它以 Qwen...

Oliva – 开源语音 RAG 助手的创新与实践

Oliva 是什么 Oliva 是一款开源的语音 RAG(检索增强生成)助手,由 Deluxer 团队开发。它结合 Langchain 和 Superlinked 技术,基于语音驱动的 RAG 架构...

Qwen2.5-Omni – 多模态 AI 的全新里程碑

Qwen2.5-Omni 是什么 Qwen2.5-Omni 是阿里开源的 Qwen 系列旗舰级多模态模型,拥有 70 亿参数规模,是一个端到端的全能感知模型,能够同时处理文本、图像...
1 7 8 9 10 11 50