PC Agent-E – 高效智能体训练框架，开启计算机操作智能化新纪元

未分类 2025-06-22 13:51

PC Agent-E是由上海交通大学与SII联合开发的智能体训练框架，专为提升计算机操作的智能化水平而设计。它通过创新的数据增强方法，利用少量高质量的人类演示数据，生成丰富的训练样本，从而显著提升智能体在实际操作中的表现。

PC Agent-E采用模块化的技术架构，具体包括以下几个关键环节：

轨迹收集（Trajectory Collection）：利用PC Tracker工具精确记录人类操作行为的完整轨迹，涵盖任务描述、屏幕截图和键盘/鼠标操作等多维度信息。
思维链补全（Thought Completion）：基于Claude 3.7 Sonnet模型对每个动作步骤进行逻辑推理补充，生成符合人类思维方式的推理过程。
轨迹增强（Trajectory Boost）：针对每一步操作生成多个可能的决策路径，全面捕捉任务执行中的各种可能性。
代理训练（Agent Training）：基于开源模型Qwen2.5-VL-72B进行深度学习训练，采用端到端的高效训练框架。

PC Agent-E在Windows和Linux系统上均表现出良好的适应性，具备跨平台的泛化能力。

PC Agent-E由上海交通大学与SII联合开发，研发团队在人工智能领域拥有深厚的技术积累和丰富的研究经验。团队成员在多个国际学术会议和期刊上发表了相关研究成果，并获得了广泛的关注和认可。