Google开放Android开发者试用Gemini Nano,该款模型可以在装置上执行高效语言任务,且同时具备资料隐私、离线运作和成本效益等优势。开发者可以透过Google提供的开发工具AI Edge SDK,简单地在应用程式中整合模型,并自订推理参数应用于多种场景。
随著人工智慧技术的发展,行动装置上的智慧功能变得越来越重要,而Google借由开放Gemini Nano模型,让开发者在Android应用上也能提供类似Apple Intelligence的智慧化体验。Gemini Nano早已经被用于多款Google应用程式,诸如Pixel截图、Talkback和Recorder等,现在开放开发者实验性存取。
Gemini Nano是Google Gemini模型家族的成员之一,专门针对装置端任务设计,可提供灵活且高效的智慧功能。Gemini Nano会在装置端进行推理,也就是所有运算都会在装置本地完成,不需要连接云端伺服器,其优点在于敏感资料可以留存在装置,增强了资料隐私性,其次是Gemini Nano无需网路连线也能提供完整功能,而这提升了使用体验,此外,每次推理也不会产生额外的费用。
由于装置端生成式人工智慧模型,在较云端伺服器运算能力低的装置上运作,加上模型本身较云端版本更小更具针对性,因此Gemini Nano模型适合执行更为明确任务,而非像是聊天机器人等开放式用例。
Gemini Nano适用多种应用场景,包括智慧回复、文本改写、校对抑或是文件摘要。开发者可以透过AI Edge SDK进行整合,并控制诸如输出随机性、Top K和回应最大长度等推理参数,以满足不同应用需求。
目前开放给开发者测试的是Gemini Nano 2模型,相较前一代,Nano 2在品质上有明显提升,虽然规模接近前一代的两倍,但是Google指出,Nano 2在基准测试和实际应用表现都更为出色,能力甚至可媲美更大型的模型。
Google开发了一个称为AICore的Android系统服务,让开发者可以简单在装置端执行模型,借由AI Edge SDK与AICore的整合,开发者不需要自己发布执行环境、模型和其他元件,就可以直接执行生成式人工智慧。不过目前Gemini Nano仅支援Pixel 9系列装置,未来还会扩展至更多设备。