OpenAl 发布 Agent 工具包
今日凌晨,OpenAI 发布了一系列专为构建 AI Agents 设计的新工具和 API,帮助开发者更容易创建能自动完成任务的 AI Agents(智能体)。具体包含了以下内容:
• Responses API:结合 Chat Completions API 简洁性与 Assistants API 工具使用能力的新型 API 接口;
• Web 搜索工具(Web Search Tool):让模型访问互联网获取最新信息的工具;
• 文件搜索工具(File Search Tool):从大量文档中检索相关信息的增强工具;
• 计算机使用工具(Computer Use Tool):由 Computer-Using Agent (CUA) 模型提供支持的计算机操作自动化工具,让
AI 能像人一样操作电脑界面;
• Agents SDK:基于 Swarm 框架升级,简化多 Agent 工作流程编排的开源框架。
具体来说,在 Responses API 结的加持下,开发者只需调用一次 API ,即可利用多种工具和多轮模型交互解决复杂任务。
而在内置工具方面,Web 搜索工具支持 GPT-4o 和 GPT-4o-mini 模型获取网络最新信息并提供清晰的引用,在 SimpleQA 基准测试中,这两款模型的搜索预览版分别拿下了 90% 和 88% 的亮眼准确率;升级后的文件搜索工具更是给力,支持多种文件格式,还能优化查询、过滤元数据、自定义排序。
计算机使用工具则由与 Operator 相同的 Computer-Using Agent (CUA)模型提供支持,可捕获模型生成的鼠标和键盘操作,在 OSWorld、WebArena 和 WebVoyager 基准测试中分别取得 38.1%、58.1% 和 87% 的成绩。
而 Agents SDK 提供易于配置的 LLM 与内置工具集成、Agent 间智能交接控制、可配置安全检查以及可视化追踪等功能,适用于客户支持自动化、多步研究、内容生成等多种应用场景。
对于现有 API 的安排,OpenAI 表示会继续全力支持 Chat Completions API,为不需要内置工具的开发者提供新模型和功能。而基于 Assistants API 测试版的反馈,他们已经把关键改进整合到 Responses API 中,计划在功能对齐后,于 2026 年中期正式停用 Assistants API,同时会提供详细的迁移指南。
价格方面,Web 搜索每千次查询分别为 GPT-4o 搜索 30 美元和 GPT-4o-mini 搜索 25 美元;文件搜索每千次查询 2.5 美元,文件存储 0.1 美元 / GB / 天(首 GB 免费);计算机使用工具则按每输入百万 token/3 美元和每输出百万 token/12 美元计费。
文章来源:爱范儿
页:
[1]