Google開放開發者及企業測試Gemini Pro

图片来源:

Google

继日前发表全新的多模态大型语言模型Gemini之后，Google周三（12/13）针对开发者与企业推出了Gemini Pro，前者可透过Google AI Studio中的Gemini API使用，后者则可借由Google Cloud的Vertex AI平台存取。

定位于多模态LLM的Gemini支援文字、图像及声音的输入，Google将其分为3种版本，分别是最强大的Gemini Ultra，最通用的Gemini Pro，以及可于行动装置上运作的Gemini Nano。目前Google已将Gemini Nano应用于Google Pixel 8上，也于Google Bard聊天机器人中整合了Gemini Pro，现在则进一步开放开发者及企业使用Gemini Pro。

此版Gemini Pro支援32K的文字脉络长度，具备函式呼叫、嵌入、语义检索、客制化知识基础及聊天功能，提供各种SDK，也支援Python、Android（Kotlin）、Node.js、Swift及JavaScript等程式语言。基本的Gemini Pro仅接受文字输入与输出，另有一个Gemini Pro Vision多模态终端则可接受文字及图像输入，但仅会输出文字。

Google AI Studio为一免费的网页开发者工具，可用来开发提示，进而取得可用于程式开发的API金钥。

Gemini Pro现已可于全球逾180个国家使用，支援38种语言，开发者以Google帐户登入Google AI Studio即可免费试用，其免费额度为每分钟输入60个请求，当需要托管环境时，也可轻易将成果迁移至Vertex AI，预计于明年初推出付费服务，届时每输入1,000个字元的费用是0.00025美元，每输入一个图像的费用则是0.0025美元，每1,000个字元的输出费用则是0.0005美元。企业用户亦可透过已整合了Gemini Pro的Vertex AI平台来试用该服务。

值得注意的是，当开发者使用Gemini Pro的免费额度时，其API与Google AI Studio的输入与输出可能会被审核人员存取，目的是为了改善服务品质，但相关资料会移除可用来辨识身分的资讯。

Google开放开发者及企业测试Gemini Pro