Google揭新一代TPU、推跨平台AI代理协定A2A和多种代理开发部署工具

Google云端揭露一项AI代理新协定A2A,专门用于跨平台、跨服务的AI代理沟通协作。

Google云端年度大会Next 25在4月9日正式登场,Google云端执行长Thomas Kurian揭露一系列重磅更新,范围涵盖AI超级电脑架构(AI Hypercomputer)、Vertex AI平台、办公生产力工具和安全等领域,除了有专为推理模型设计的新一代TPU处理器Ironwood,还聚焦AI代理,祭出可支援AI代理跨平台协作的Agent-to-Agent协定、多代理开发工具包ADK、流程自动化工具Google Workspace Flows,以及AI威胁侦测工具Google Unified Security等。

AI基础设施亮点:专为大模型设计的Ironwood处理器

首先登场的是这对使用者来说,可以选择不同厂商的AI代理、组合使用,系统可以兼容这些不同来源的代理。对企业来说,他们能在不同平台或不同云端服务间,统一管理各个代理,减少技术负担。这个A2A协定,目前已获50多家业者支援。(如下图)

不只如此,Google还在自家AI开发平台Vertex AI中,新添不少AI代理工具,其一是,包括企业使用者可直接从Chrome搜寻框来使用Agentspace的搜寻、分析和资讯整合功能,也能透过Agent Gallery(代理库)来快速导入各种代理,或是部署Google自家的代理。这些Agentspace新功能,目前只开放白名单用户使用。为顾及企业资料隐私需求,Google也计划推出Google Distributed Cloud(GDC)平台,来支援企业本地段部署Gemini系列模型和Agentspace代理应用,预计今年第三季开始提供GDC。

此外,Google还打造AI Agent Marketplace市集,收录第三方各种AI代理,来让使用者随插即用。甚至,他们还推出一项实用的,包含这次新纳入的文字转音乐模型Lyria,整体就涵盖了影片、图像、语音和音乐。等于使用者配合既有的图像、语音和影片生成能力,可以从一段简单的文字开始,逐步生成图像、影片,并自动加入音乐与旁白,实现完整的生成式内容制作。

就既有模型来说,Google也进行优化和更新。比如,他们替文字转影片模型Veo 2增添新功能,如镜头控制、影片编辑工具,使用者能更细致地调整影片内容、快速重制和优化。Google也为文字转语音模型Chirp 3新添客制化功能,使用者只需提供10秒音讯,就能生成专属声音模型。此外,Chirp 3 还支援AI配音叠加至既有录音,并提供辨识说话者的语音转录功能。

同时,Google也优化了文字转图片模型Imagen 3的品质,让图像中缺失或不自然的处理更细腻自然,尤其在物件移除和修图场景中,能更自然呈现。

不只是多模态模型支援,Thomas Kurian也揭露,