商用软体AI化的竞赛开跑

今年五月,科技巨头微软和Google都在同一周举办了年度产品大会,不约而同地瞄准了代理AI浪潮,发表了多项生成式AI产品和技术,我们也一连用两期封面故事,各自来介绍这两大公云、同时也是AI技术领导厂商的最新产品布局。

上周,我们先介绍了Google IO大会,尤其聚焦生成式AI如何全面加速开发的角度。软体开发是生成式AI已知最成熟的应用领域,也是企业需求明确的第一个场景,成了传统开发工具厂商的新竞争焦点。Google当然也不例外,Google揭露了一系列用GenAI模型加速企业开发的工具,这些工具来自Google内部实作经验,再进一步发展成对外的产品和服务,尤其瞄准了4大场景,像是快速生成互动式UI的工具、原有AI开发工具开始支援快速生成Web App,也推出了程式开发代理Jules公测版,要让大规模开发工作更加自动化,最后则是要将AI代理融入开发环境,来强化AI代理App的开发工具链。

Google原有的开发技术也瞄准代理AI而有不少强化,像是Android机器学习开发套件ML Kits,增加了更多GenAI API,让Android应用程式,更容易能在装置本地端执行Gemini Nano模型。而行动开发工具Android Studio也增加新的开发AI代理能力,辅助写测试和执行测试的Journeys代理,以及可协助更新套件相依性和SDK的版本升级AI代理,这都是原本开发日常中繁琐但非做不可的例行工作,现在可以有AI 代理来帮忙。

当然不只Google开始改造、升级原有的软体技术和工具来瞄准新一波的AI代理需求,微软在今年开发者大会Build上,更提出了新的AI代理发展愿景「Open Agentic Web」,作为旗下技术和产品的新发展方向,这正是本周的封面故事主题

微软想像的未来网际网路,将充满了各式各样不同能力的AI代理,来执行企业与个人交代的工作。这些AI代理可以处理复杂的任务、存取不同类型的资料来源,甚至与其他AI代理协同合作。

微软想要善用开源的框架与开源工具来促成这个愿景,除了扩大支援热门的模型通讯协定MCP和跨代理协作框架A2A之外,微软还发表了两个新的开源专案TypeAgent和NLWeb。前者的目标是要强化AI代理记忆能力做法,后者则是为了简化AI代理存取网站内容的门槛。

还在发展初期的TypeAgent专案,提出了一个新的结构式RAG(Structured RAG)做法,来强化AI代理的记忆能力和回想完整度,并且进一步降低生成式AI产生幻觉的机率。

NLWeb专案瞄准了全球2亿个网站的内容,结合既有网页标准如RSS,加上搜寻技术和LLM技术,提供了一套可以支援网站资料索引、自然语言查询处理、LLM呼叫、向量资料库呼叫,及站内搜寻处理等作业的技术框架,可以让网站主很快的打造出站内的自然语言搜寻机制,也可以让AI代理更容易读取第三方的网站内容。这是一个瞄准真人查询需求和AI代理检索网站内容的通用框架。

微软也将迈向Open Agentic Web的相关技术和策略,开始导入到自家产品、工具和平台的发展上。

不只这两大科技巨头,开始将LLM技术和AI代理战略,整合到既有软体产品和工具,SAP(请见:SAP大揭各产品线AI发展蓝图)、SAS、红帽今年的产品大会,也都有不少原有产品拥抱AI代理或用生成式AI技术来强化的新功能。

随著众人看好企业大规模生成式AI、AI代理的落地部署需求,科技大厂纷纷动起来,今年开始加速企业级产品的AI化,也掀起了新的商用软体AI化竞赛。