AI趋势周报第275期:CRM大厂推出新版AI代理服务,强化部署观测性

图片来源: 

Salesforce

重点新闻(0620~0626)

 AI代理     可观测性     Salesforce  

CRM大厂推出新版AI代理服务Agentforce 3,强化部署观测性

最近,CRM大厂Salesforce发布新版的AI代理平台Agentforce 3,主打更高可观测性、跨平台互通和即时控管能力。进一步来说,Agentforce是Salesforce在去年10月推出的服务,他们引用即将发布的Slack调查,在过去半年内,全球AI代理使用量暴增了233%,且已有8,000多家企业注册导入Agentforce。

这次新版本加入了Command Center观测中心,企业可即时追踪AI代理健康状况、错误率和任务执行成果,并透过即时警示快速介入调整。Agentforce 3还支援MCP,可与AWS、Google Cloud、Stripe、Notion等30多个工具整合,可将AI代理用于客服自动化、行销流程、库存查询、帐务处理等多种情境。

举例来说,一家会计财务公司1-800Accountant就在今年报税旺季,让AI自动处理70%的行政对话,Grupo Globo则用来提高22%用户留存率。Salesforce也指出,Agentforce 3内建超过100种操作和低程式码设计,可让企业快速上线客制化AI流程,落地AI人机协作。

  微软     Mu     Copilot+ PC  

微软公开小型语言模型Mu,强化Copilot+ PC端AI代理功能

微软最近发布一套专为Copilot+ PC设计的小型语言模型Mu,主打可在装置端本地执行,还应用于Windows系统中的「设定代理人」,使用者以自然语言就能快速调整数百项系统设定,如开启飞航模式、调整萤幕亮度等。但目前只有Dev频道中,使用Copilot+ PC的Windows Insiders测试者能使用。

Mu以Phi模型为基础、重新设计而成,采用Transformer架构,以数千亿个教育语料预训练,再用Phi模型进行知识蒸馏,最后以LoRA强化特定任务表现。Mu专为NPU装置最佳化,在装置端可达每秒200 token的推理速度,为降低资源占用,Mu采用了参数重新分配、权重共享和后训练量化(PTQ)技术,使模型体积仅为Phi-3.5-mini的十分之一,但仍不牺牲效能。

  Imagen 4     图片生成     Google  

Google公测Imagen 4图片生成系列模型

Google揭露最新图片生成系列模型Imagen 4,并透过Gemini API和Google AI Studio开始公测。Imagen 4系列模型可分为2个版本,包括Imagen 4 Standard和4 Ultra,它们在文字渲染和生成的图像品质,都比前一代Imagen 3要好很多。比起标准版,Imagen 4 Ultra具有更高的指令遵从能力,能精确根据用户文字提示,生成更高品质的图片。

这两款模型皆在AI Studio以预览版提供付费公测。其中,Imagen 4 Standard每帧图0.04美元,Ultra版则为0.06美元。开发者也可透过Gemini API测试Imagen 4。,结合在地化的多模态模型,支援离线执行能力和MCP协定,可让企业打造专属AI代理应用,来自动化完成内外部工作流程。

FedGPT AgentTeam平台后的模型,皆由开源LLM如Llama等微调而成,比如有以1,000亿Token训练出的通用模型、150亿Token优化的医疗专业模型及10亿Token训练的金融模型。

这款平台具备三大功能,首先是AgentTeam RAG,支援企业多来源、多模态知识的资讯检索,来提供更准确的回答。再来是AgentTeam Tuning,可用企业内部多模态资料,如文字、图片、语音等来对模型微调,提高诸如语音辨识、语意理解的准确度。第三是AgentTeam Flow,提供低/无程式码介面,来让使用者自行建立公关发文、查帐等AI工作流程,还支援MCP可串接Slack、Gmail等第三方工具。未来,平台也将支援 A2A(Agent-to-Agent)协定,进一步提升多代理AI间的协作能力。  模型评比     Yupp     LLM  

Yupp推出AI模型评比平台

AI新创Yupp近日推出人类评估系统,开放使用者比较500多款大型语言模型(LLM),包括ChatGPT、Claude、Gemini、Grok、Llama等,并依使用者回馈建立Yupp AI VIBE排行榜,涵盖最受欢迎、最快、性价比最佳等类别。

使用者提问后,系统随机选出模型给出回应,并邀请用户勾选优劣原因、提供意见回馈,即可获得积分,这些积分可用于继续使用模型或兑换奖励。新注册的使用者可获得5,000积分,若只提问不参与评比,可能会被限制使用。Yupp由Twitter前主管Pankaj Gupta和Gilad Mishne在2024年创立,曾获a16z领投的3,300万美元种子资金。团队强调,他们的目标是汇整大量用户回馈、协助模型优化,让AI更贴近人类需求。资料来源:iThome整理,2025年6月