OpenAI将Operator模型升级为具推理能力的o3

图片来源: 

OpenAI

OpenAI本周宣布将Operator代理人使用的模型,由GPT-4o升级为具推理思维能力的o3。

Operator为ChatGPT的电脑使用代理人(Computer-Using Agent,CUA),为ChatGPT赋予看/读、写/打字、点击或操作滑鼠的能力,使其能代用户执行多种任务,包括上网搜寻、操作应用程式、甚至订餐厅、订外送或下单。Operator今年1月先提供给美国,之后又陆续推向巴西、日、韩及新加坡等国,且持续扩大到全球。

目前Operator维持为研究预览(research preview)版,还是仅限月付200美元的Pro方案用户使用。

OpenAI在官方X帐号说明,Operator升级使用o3模型后,它和浏览器互动时将会更持续、更准确,以提高任务的成功率。回应内容上也会更清楚、全面、更有条理。

根据OpenAI说明,新版使用o3的Operator在OSWord和WebArena测试结果,都较原有(4o)的Operator表现更好,成为新的SOTA,而在不论标竿测试和人类偏好评估上,也都超越使用o4的Operator。

其他AI业者也正在开发类似Operator的代理人,包括Hugging Face的Open Computer Agent能查询Google Maps或使用图片生成模型,Google可理解影片、共享萤幕的Project Astra现在则整合到Google Live。图片来源/OpenAI