Google推Vertex AI RAG Engine提升生成式AI应用精确性与可靠性

Google推出了全新的Vertex AI RAG Engine,可用于建置可靠且精确的生成式人工智慧应用。该服务目的是解决生成式人工智慧常见的两大挑战,第一是模型可能产生幻觉,生成错误或无意义的资讯,第二则是无法即时获取最新资料的限制。

检索增强生成(Retrieval Augmented Generation,RAG)是Vertex AI RAG Engine的核心技术,能结合大型语言模型与外部资料来源,让人工智慧回应更具事实基础并符合时事变化,同时简化开发过程。

Vertex AI RAG Engine是针对资料检索与语言模型整合的托管式服务,能从多种资料来源检索相关资讯,并将结果提交给大型语言模型,提升模型回应的准确性与专业性。相较于仅依赖模型预训练知识的方法,RAG技术允许模型即时接触到最新或特定领域的资讯,特别适合需要高准确性和即时性的应用。

Google提供开发者灵活采用选项,支援连接多种向量资料库如Pinecone和Weaviate,或是使用Google自家的Vertex AI Vector Search,并允许开发者自定义处理流程以满足特殊需求。

该技术应用范围广泛,可用于金融、医疗和法律等需要处理大量资料的领域,像是在金融服务中,RAG Engine可以协助分析客户档案和市场资料,使财务顾问能提供个人化的投资建议,而在医疗领域,研究人员从临床试验和基因资料快速撷取重要资讯,加速药物开发或制定个人化治疗计划。在法律专业领域,RAG Engine则可以协助审查合约条款,快速找出法律风险,减少人工检索的时间与错误。