未分类
Slidev – 专为开发者打造的交互式演示工具
Slidev(发音为“/slaɪdɪv/”)是一个基于 Web 的幻灯片制作和演示工具,专为开发者设计。它通过结合 Markdown 语法和 Vue.js 技术,让用户能够以编写代码的方...
Company Research Agent – 智能化商业情报分析的利器
什么是 Company Research Agent? Company Research Agent 是一款基于多智能体框架的 AI 公司研究工具,旨在通过自动化方式快速生成全面、结构化的公司调...
Direct3D-S2 – 高分辨率3D生成的创新突破
Direct3D-S2 是由南京大学、复旦大学、牛津大学以及 DreamTech 等机构联合推出的一款高分辨率 3D 生成框架。该框架旨在解决传统 3D 生成方法在高分辨率场景下...
QwenLong-L1-32B – 阿里巴巴的长文本推理新突破
QwenLong-L1-32B 是阿里巴巴 Qwen-Doc 团队开源的首个长文本推理大模型,专为处理复杂的长文本任务而设计。该模型基于强化学习框架,通过渐进式上下文扩展和...
LMEval – 重塑 AI 模型评估新标准的开源框架
LMEval 是由谷歌于 2025 年 5 月推出的一款开源框架,旨在为大型语言模型(LLMs)和多模态模型提供标准化的评估工具。它通过简化跨平台模型性能比较,支持文...
LLaDA-V – 纯扩散架构的多模态大语言模型
LLaDA-V是什么 LLaDA-V是由中国人民大学高瓴人工智能学院与蚂蚁集团联合推出的多模态大语言模型(MLLM),基于纯扩散模型架构,专注于视觉指令微调。该模...
PC Agent-E – 高效智能体训练框架,开启计算机操作智能化新纪元
PC Agent-E是什么 PC Agent-E是由上海交通大学与SII联合开发的智能体训练框架,专为提升计算机操作的智能化水平而设计。它通过创新的数据增强方法,利用少...
CAR – 字节跳动与复旦联合推出的自适应推理框架
CAR(Certainty-based Adaptive Reasoning)是由字节跳动联合复旦大学推出的自适应推理框架,旨在提升大型语言模型(LLM)和多模态大型语言模型(MLLM)在不...
WonderPlay – 动态3D场景生成的创新力量
WonderPlay是由斯坦福大学与犹他大学联合推出的一项突破性技术框架,旨在通过单张图片和用户定义的动作生成动态三维场景。它将物理模拟与视频生成技术相结合...
HunyuanVideo-Avatar – 开启智能视频创作新时代
HunyuanVideo-Avatar 是什么 HunyuanVideo-Avatar 是腾讯混元团队开源的语音数字人模型,由腾讯混元视频大模型(HunyuanVideo)及腾讯音乐天琴实验室 Muse...