商用軟體AI化的競賽開跑

今年五月，科技巨头微软和Google都在同一周举办了年度产品大会，不约而同地瞄准了代理AI浪潮，发表了多项生成式AI产品和技术，我们也一连用两期封面故事，各自来介绍这两大公云、同时也是AI技术领导厂商的最新产品布局。

上周，我们先介绍了Google IO大会，尤其聚焦生成式AI如何全面加速开发的角度。软体开发是生成式AI已知最成熟的应用领域，也是企业需求明确的第一个场景，成了传统开发工具厂商的新竞争焦点。Google当然也不例外，Google揭露了一系列用GenAI模型加速企业开发的工具，这些工具来自Google内部实作经验，再进一步发展成对外的产品和服务，尤其瞄准了4大场景，像是快速生成互动式UI的工具、原有AI开发工具开始支援快速生成Web App，也推出了程式开发代理Jules公测版，要让大规模开发工作更加自动化，最后则是要将AI代理融入开发环境，来强化AI代理App的开发工具链。

Google原有的开发技术也瞄准代理AI而有不少强化，像是Android机器学习开发套件ML Kits，增加了更多GenAI API，让Android应用程式，更容易能在装置本地端执行Gemini Nano模型。而行动开发工具Android Studio也增加新的开发AI代理能力，辅助写测试和执行测试的Journeys代理，以及可协助更新套件相依性和SDK的版本升级AI代理，这都是原本开发日常中繁琐但非做不可的例行工作，现在可以有AI 代理来帮忙。

当然不只Google开始改造、升级原有的软体技术和工具来瞄准新一波的AI代理需求，微软在今年开发者大会Build上，更提出了新的AI代理发展愿景「Open Agentic Web」，作为旗下技术和产品的新发展方向，这正是本周的封面故事主题。

微软想像的未来网际网路，将充满了各式各样不同能力的AI代理，来执行企业与个人交代的工作。这些AI代理可以处理复杂的任务、存取不同类型的资料来源，甚至与其他AI代理协同合作。

微软想要善用开源的框架与开源工具来促成这个愿景，除了扩大支援热门的模型通讯协定MCP和跨代理协作框架A2A之外，微软还发表了两个新的开源专案TypeAgent和NLWeb。前者的目标是要强化AI代理记忆能力做法，后者则是为了简化AI代理存取网站内容的门槛。

还在发展初期的TypeAgent专案，提出了一个新的结构式RAG（Structured RAG）做法，来强化AI代理的记忆能力和回想完整度，并且进一步降低生成式AI产生幻觉的机率。

NLWeb专案瞄准了全球2亿个网站的内容，结合既有网页标准如RSS，加上搜寻技术和LLM技术，提供了一套可以支援网站资料索引、自然语言查询处理、LLM呼叫、向量资料库呼叫，及站内搜寻处理等作业的技术框架，可以让网站主很快的打造出站内的自然语言搜寻机制，也可以让AI代理更容易读取第三方的网站内容。这是一个瞄准真人查询需求和AI代理检索网站内容的通用框架。

微软也将迈向Open Agentic Web的相关技术和策略，开始导入到自家产品、工具和平台的发展上。

不只这两大科技巨头，开始将LLM技术和AI代理战略，整合到既有软体产品和工具，SAP（请见：SAP大揭各产品线AI发展蓝图）、SAS、红帽今年的产品大会，也都有不少原有产品拥抱AI代理或用生成式AI技术来强化的新功能。

随著众人看好企业大规模生成式AI、AI代理的落地部署需求，科技大厂纷纷动起来，今年开始加速企业级产品的AI化，也掀起了新的商用软体AI化竞赛。

商用软体AI化的竞赛开跑