OpenAI将Operator模型升级为具推理能力的o3

2025-05-27

图片来源:

OpenAI

OpenAI本周宣布将Operator代理人使用的模型，由GPT-4o升级为具推理思维能力的o3。

Operator为ChatGPT的电脑使用代理人（Computer-Using Agent，CUA），为ChatGPT赋予看/读、写/打字、点击或操作滑鼠的能力，使其能代用户执行多种任务，包括上网搜寻、操作应用程式、甚至订餐厅、订外送或下单。Operator今年1月先提供给美国，之后又陆续推向巴西、日、韩及新加坡等国，且持续扩大到全球。

目前Operator维持为研究预览（research preview）版，还是仅限月付200美元的Pro方案用户使用。

OpenAI在官方X帐号说明，Operator升级使用o3模型后，它和浏览器互动时将会更持续、更准确，以提高任务的成功率。回应内容上也会更清楚、全面、更有条理。

根据OpenAI说明，新版使用o3的Operator在OSWord和WebArena测试结果，都较原有（4o）的Operator表现更好，成为新的SOTA，而在不论标竿测试和人类偏好评估上，也都超越使用o4的Operator。

其他AI业者也正在开发类似Operator的代理人，包括Hugging Face的Open Computer Agent能查询Google Maps或使用图片生成模型，Google可理解影片、共享萤幕的Project Astra现在则整合到Google Live。图片来源／OpenAI