继日前发表全新的多模态大型语言模型Gemini之后,Google周三(12/13)针对开发者与企业推出了Gemini Pro,前者可透过Google AI Studio中的Gemini API使用,后者则可借由Google Cloud的Vertex AI平台存取。
定位于多模态LLM的Gemini支援文字、图像及声音的输入,Google将其分为3种版本,分别是最强大的Gemini Ultra,最通用的Gemini Pro,以及可于行动装置上运作的Gemini Nano。目前Google已将Gemini Nano应用于Google Pixel 8上,也于Google Bard聊天机器人中整合了Gemini Pro,现在则进一步开放开发者及企业使用Gemini Pro。
此版Gemini Pro支援32K的文字脉络长度,具备函式呼叫、嵌入、语义检索、客制化知识基础及聊天功能,提供各种SDK,也支援Python、Android(Kotlin)、Node.js、Swift及JavaScript等程式语言。基本的Gemini Pro仅接受文字输入与输出,另有一个Gemini Pro Vision多模态终端则可接受文字及图像输入,但仅会输出文字。
Google AI Studio为一免费的网页开发者工具,可用来开发提示,进而取得可用于程式开发的API金钥。
Gemini Pro现已可于全球逾180个国家使用,支援38种语言,开发者以Google帐户登入Google AI Studio即可免费试用,其免费额度为每分钟输入60个请求,当需要托管环境时,也可轻易将成果迁移至Vertex AI,预计于明年初推出付费服务,届时每输入1,000个字元的费用是0.00025美元,每输入一个图像的费用则是0.0025美元,每1,000个字元的输出费用则是0.0005美元。企业用户亦可透过已整合了Gemini Pro的Vertex AI平台来试用该服务。
值得注意的是,当开发者使用Gemini Pro的免费额度时,其API与Google AI Studio的输入与输出可能会被审核人员存取,目的是为了改善服务品质,但相关资料会移除可用来辨识身分的资讯。