ChatGPT Agent 正式上线:AI 从对话走向行动的新纪元
来源:Poixe AI
2025 年 7 月,OpenAI 正式推出了 ChatGPT Agent 模式,标志着人工智能从对话助手向“行动体(Agent)”跃迁的重要节点。
这项新功能打破了传统 AI 工具“只能聊天、不能动手”的限制,赋予 ChatGPT 执行任务、访问网页、处理文件等全新能力。

—
什么是 ChatGPT Agent?
ChatGPT Agent 是 OpenAI 在原有 GPT 模型基础上构建的智能体系统,它不仅能回答问题,还能 代替用户完成一系列具体操作任务:
- 访问第三方网站并提取信息
- 登录系统执行表单填写、内容搜索、资源采集
- 自动生成 PPT、报表、电子表格等文档
- 根据日历/邮件整理会议摘要或任务清单
它整合了之前的 Deep Research(深度调研模式) 与 Operator(浏览器控制能力),是一次更具执行力的升级。
—
核心能力概览
功能模块 | 说明 |
网页访问 | 能主动访问网页、模拟用户操作,并提取或汇总页面数据 |
文档处理 | 生成并编辑 PDF、PPT、Excel 等办公文档 |
任务自动化 | 执行指定任务链条,如“预订酒店 + 写邮件 + 生成报告” |
系统交互 | 调用 API、脚本执行、本地模拟操作(企业用户) |
—
评估表现一览
在官方评估中,ChatGPT Agent 展现出多项行业顶尖表现:
- Humanity’s Last Exam(HLE):得分 41.6%,并行运行策略最高达 44.4%,刷新多学科专家级推理记录。
- FrontierMath:数学推理准确率达 27.4%,显著领先旧版本模型。

- DSBench:在真实数据分析与建模任务中表现超越人类平均水平。

- SpreadsheetBench:电子表格处理得分 45.5%,远超 Excel Copilot 的 20%。

- 财务建模任务:在为财富 500 强企业构建模型时超越 Deep Research 与 o3 智能体。

- BrowseComp:复杂信息检索得分 68.9%,远超旧版本 Deep Research。

- WebArena:真实网页交互任务中得分 65.4%,接近人类水平(约 78.2%)。

✅ 这些评估涵盖推理、数学、数据分析、表格处理、财经建模与网页浏览等多个维度,ChatGPT Agent 已具备高度实用性和系统执行能力。
—
谁适合使用 ChatGPT Agent?
目前 ChatGPT Agent 向 Plus、Pro、Team 订阅用户开放,适合以下人群:
- 开发者:原型搭建、数据链路调试、流程仿真
- AI 工具研究者:探索任务自动化与多步执行能力
- 职场办公者:日常汇报文档生成、信息摘要归类
- 产品经理 & 自动化设计师:验证人机协作与流程优化模型
—
如何启用 Agent 模式?
只需进入 ChatGPT 页面左下角菜单,点击 “Tools / 工具”,启用 Agent 模式 即可(需为付费用户)。
企业与教育版本将于未来数周内逐步开放。
—
安全与权限机制
为了确保 Agent 的稳定与可控性,OpenAI 设置了多重安全措施:
- 操作需用户授权:关键任务执行需用户明确确认
- 沙盒执行环境:限制对操作系统或外部接口的访问权限
- 全流程可回溯:每项 Agent 操作均具备日志与监控机制
—
未来趋势与发展方向
ChatGPT Agent 并非简单的功能迭代,而是一次 AI 从理解走向行动的结构性飞跃。
未来它将催生以下新趋势:
- 每个人都将拥有属于自己的虚拟助手
- 无需代码的 AI 工作流自动化将加速普及
- 企业架构将融入智能体 API,构建高度协同系统
—
结语
ChatGPT Agent 是 OpenAI 在“可执行任务的 AI 智能体”方向上的重要战略部署,它开启了真正意义上的「行动型 AI」新时代。
官方文档:https://openai.com/zh-Hans-CN/index/introducing-chatgpt-agent/