AutoGLM沉思 – 开启 AI 智能体 “边想边干” 新时代

未分类 2025-06-23 0:26

AutoGLM 沉思是由智谱 AI 推出的全球首个集深度研究能力和操作能力于一体的 AI Agent，能够模拟人类的思维过程，完成从数据检索、分析到生成报告的全过程，实现 “边想边干”，标志着 AI 技术迈入了新阶段，推动 AI Agent 从单纯的思考者进化为能交付结果的智能执行者。

深度研究与推理 ：支持处理复杂的开放式问题，基于多步骤推理生成详细报告，可模拟人类面对复杂任务时的思考过程，分解问题并逐步解决，如深入研究新技术对各领域的影响。
自主调用工具操作 ：能自主调用浏览器等工具，像人类一样操作网页，完成搜索、点击、筛选、输入等任务，还可突破 API 限制，访问小红书、公众号、京东等平台，获取和处理网页上的信息。
多模态交互能力 ：结合自然语言处理和计算机视觉技术，不仅能够读取和理解文字信息，还能识别和提取图片中的文字信息。
自主任务规划与执行 ：根据用户指令进行问题拆解和任务规划，明确任务目标和执行路径，实现从信息获取到执行的闭环，例如自行规划并完成旅行攻略的制定。
报告生成与引用 ：将收集到的信息进行分析、提炼和总结，输出结构化的长文报告，并标注引用来源，保证内容的准确性和可追溯性。

基座模型与推理模型 ：基于智谱全栈自研的 GLM 大模型体系，包括拥有 320 亿参数的 GLM-4-Air-0414 基座模型，以及在此基础上优化推理和复杂问题求解能力的 GLM-Z1-Air 推理模型。
沉思模型 ：GLM-Z1-Rumination 沉思模型是核心，通过强化学习，让模型学会自我批评、反思、甚至沉思，实现长程推理和任务执行，能够对每一步决策进行 “自我批评”，优化任务执行路径。
智能体框架 ：AutoGLM 智能体框架结合浏览器操作能力，实现任务的自动化执行，使得整个系统能够高效地完成各种复杂任务。
实时联网搜索与多路径决策 ：动态获取最新信息，突破训练数据的时效限制，并生成多种分析框架，避免单一思维偏差，确保结果的全面性和准确性。
逻辑验证 ：通过多源信息交叉核验，确保结果的可信度，提高信息的可靠性和准确性。

AutoGLM 沉思支持网页端、PC 客户端及手机 App，用户可以通过智谱清言的多端口免费体验其功能，且不限使用量。

智谱 AI 是 AutoGLM 沉思的开发团队，其一直致力于推动人工智能技术的发展和应用，在大模型领域有着深厚的技术积累和创新能力，智谱 AI 的研发团队成员在人工智能领域拥有丰富的经验和专业知识，能够不断探索和创新，推出具有前瞻性和实用价值的 AI 产品。

源码：AutoGLM 沉思的核心链路技术已于 2025 年 4 月 14 日开源，相关源码可在智谱 AI 的官方开源平台获取。