OpenAI十二天发表会下半场聚焦团队开发需求,加强第三方整合布局

OpenAI打造ChatGPT的「专案」功能,对软体开发任务特别有用,让ChatGPT更像是一个开发专案管理平台。(图片来源/OpenAI)

在去年底的OpenAI十二天马拉松线上发表会中,前面六场揭露了他们打造通用人工智慧(Artificial General Intelligence,简称AGI)的种种布局,像是影片生成模型Sora服务正式上线,新一代推理模型o1也正式推出,同时增加了图片输入的能力,跨入多模态输入的阶段,ChatGPT现在可以控制iPhone 16的相机功能,来取得画面和声音,取得更多真实世界的资料。

从第七场开始,开发者是下半场的主角,尤其新一代推理模型o1终于释出了API,也预告了2025年将会释出更强大的o3推理模型,甚至可以超越真人软体开发者的程式码撰写能力。

OpenAI从2024年开始积极打造各种产品,不只是聚焦在模型技术的研发,OpenAI执行长Sam Altman更强调,两年来,OpenAI从一家研究机构,更以ChatGPT这项技术为核心重新组织,彻底变成了一家产品公司。ChatGPT使用人数达到3亿人规模,开发者帐号的规模也高达了200万人。

在OpenAI十二天所发表的多项产品,可说是这两年来,OpenAI从研究机构转型产品公司的成果发表,甚至有多项服务,几乎都是在2024年下半年,或是最后几个月才完成使用者介面的设计,例如Sora服务就其中一个例子。产品公司的转型,让OpenAI的触角,跨入了更多领域,尤其是与第三方软体公司,科技公司的整合上,与2024年之前,有很大的变化。我们接著来看下半场第七到十二天的发表。 

第7天,ChatGPT专案功能登场,从对话机器人变成创造力专案平台

OpenAI去年底第四季,花了3个月,打造出了这项有高度需求的功能,也就是ChatGPT的「专案」功能,可以让使用者发起一个专案,上传档案到这个专案中,也能针对专案范围下达客制化的提示指令,使用者可以在专案中保留完整对话,透过站内搜寻,可以将既有的对话,加入一个新专案中,等于可以用专案来整理不少旧的对话纪录,就像是一个对话管理目录一样。专案功能也可以支援Canvas模式,开启一个专案档案共用的文件来编辑。

使用者可以上传一批文件,要求ChatGPT只针对专案文件的内容来回答问题,例如在十二天发表会上,OpenAI工程师上传了多份家中设备的维护说明文件,询问最近要更新哪一项设备,ChatGPT分析这些上传文件就能回答该更换滤网。

专案功能对软体开发任务特别有用,让ChatGPT更像是一个开发专案管理平台。在OpenAI工程师的展示中,上传旧版网页内容,和想要套用的新版范本网页,再加上几个个人推荐信,就可以要求ChatGPT,参考新版范本档的HTML程式码,把旧版网站程式码,改成符合公版范本的版本,同时更新推荐信资料。

(图片来源/OpenAI)

还可以直接开启Canvas模式来编辑这份新生成的网页,工程师只需检视一遍,修改了部分错误的介绍描述就完成了新版网站,不用自己动手一一参考新版范本来更新自己的网站。

这个用Canvas模式结合专案功能的作法,可以方便地分析和统整同一个专案下的多份文件资料,来生成一份可编辑的新文件,也能要求ChatGPT 依照特定专案内文件的资料,来调整新文件的内容。同样做法都可以套用到Canvas的程式码开发模式。

上传多个与开发专案相关的文件、范本或参考资料,让ChatGPT自动更新、套用或修改出想要的程式码内容,再复制到开发IDE中。这项新的Project功能目前开放给所有用户和Team订阅户,ChatGPT企业版帐号则得等到今年稍晚才会支援。

第8天,网路搜寻功能上线,正面对决搜寻引擎龙头

第八天的发表会由OpenAI产品负责人Kevin Wheel亲自宣布,去年10 月先开放付费用户使用的网路搜寻功能,现在开放给3亿用户免费使用,人人都能用来搜寻即时、最新的网路资料。而且也强化不少搜寻功能,像是提高搜寻速度,优化了行动的介面,提供了与苹果地图的整合呈现。这项搜寻功能甚至可以和ChatGPT进阶语音功能整合,让使用者用讲话,来指示ChatGPT搜寻网路。

(图片来源/OpenAI)

使用者若是在ChatGPT网页版发问,系统会依据时效性,自动判断是否要查询网路资料,也可以强制点选搜寻按钮,让每一个问题,都能够查询网路最新资讯。

Kevin Wheel表示,和搜寻网站最大不同是,ChatGPT的网路搜寻是对话式的搜寻,得到第一次的结果后,还可以继续透过对话,讨论搜寻到的结果,例如找到附近电影院后,可以进一步问ChatGPT,适合全家看的电影是哪一部,秀出预告片等要求。ChatGPT中也能在搜寻结果中直接嵌入预告影片,不用切换浏览器就能直接播放。甚至,这项网路搜寻功能,还可以设定成浏览器的预设搜寻引擎,这就和搜寻引擎龙头打对台,竞争使用者的眼球。

(图片来源/OpenAI)

在行动版网路搜寻介面也有不少改善,像是搜寻住家附近的餐厅时,可以将餐厅列表放到苹果原生地图上显示,方便参考移动的路线。这项网路搜寻,也整合到ChatGPT的进阶语音模式,变成了一个语音搜寻引擎,使用者用讲话,就能搜寻最新的资讯,例如查询某一天某地的天气,ChatGPT也会同样用语音来回答找到的结果,像讲话一样的回答。(后续报导内容请见:OpenAI开发者系列功能大剖析)