AI趋势周报第276期:Google释出经典编码器-解码器T5Gemma系列模型

图片来源: 

Google

重点新闻(0704~0710)

 编码器-解码器     T5Gemma     Google  

Google重拾经典编码器-解码器架构,释出T5Gemma系列模型

Google最近发布T5Gemma系列大型语言模型(LLM),重拾经典的编码器-解码器(encoder-decoder)架构,不论是产出结果还是推论效率,都比现有主流的解码器模型(decoder-only)要好。

T5Gemma以Gemma 2框架为基础,透过适应性转换技术,将预训练的解码器模型调配为编码器-解码器架构,不仅保留原有能力,还降低重新训练的运算成本。T5Gemma包含小型、基础、大型和XL级别的模型,另也有2B、9B参数版本,以及9B编码器+2B解码器等这类不对称的组合,这种组合能用来调整输入或输出的效率,比如提高输入理解力、保持简单的输出。

在SuperGLUE和GSM8K测试中,T5Gemma精准度和延迟表现皆媲美甚至超越同级模型,特别是2B-2B模型经指令微调后,MMLU分数比Gemma 2 2B模型高出12分,GSM8K准确率也从58%冲上70.7%。T5Gemma现已在Hugging Face、Kaggle、Vertex AI平台上开放使用。

  Line     Yahoo!     AI代理  

Line合并日本Yahoo!今年要转型成AI公司

Line日本与Yahoo! Japan合并为LY Corporation,日前在技术年会上宣布转型为AI公司,提出两大行动方针,包括全面导入AI Agent、提高内部生产力。LYC CTO朴懿彬进一步说明两大策略进展,他们已在服务中导入44个GenAI应用,且已有35个专案用AI来提高内部营运效率。比如,Yahoo! Japan App用GenAI强化抽象语言搜寻功能,Line则在通讯功能中用GenAI支援基本问答、翻译、PDF文件摘要、照片编辑和文字识别等能力。甚至在生产力部分,已应用GenAI客服来处理Yahoo购物、拍卖、Email、旅游等服务,可以自动回复处理92%的客服案件。

LYC还导入RAG工具Seek AI,作为内部知识管理工具,员工可注册工作空间或应用程式,让Seek AI学习内容、回答营运相关问题并整理所需资讯。目前他们已注册490个应用程式给Seek AI学习。LYC还用自家程式码,训练出内部GenAI软体开发助手Ark Developer,可支援程式码建议、技术文件生成、自动程式码测试、QA和程式码审查等。在初期测试中,程式码建议正确率高达96%、文件生成与审查时间减少62%、测试时间减少95%,一天能支援超过5,000次程式码审查,预计7月正式上线。

为达成两大AI转型目标,LYC还要强化AI代理记忆(Agentic Memory),来强化AI代理执行复杂任务能力;也要结合数据治理及MCP技术应用,让AI代理能在更安全的环境中执行任务。同时也会发展LLMOps,妥善管理LLM用例及数据传输机制的效能和品质;另要强化RAG平台,让AI应用更好地使用内部数据,以及强化整体数据处理和数据治理做法,来支援AI发展。  Veo 3     影片生成     Google  

Veo 3影片生成功能在台推出了

前几周,Google在I/O大会上亮相最新AI影片生成模型Veo 3,日前则正式将Veo 3导入所有支援Gemini应用程式的国家和地区,包括台湾在内。只要订阅Google AI Pro,用户就能用Veo 3生成短影片。

Veo 3结合Gemini模型,能根据相片、提示词自动生成影片,无论是重现历史、创意实验,还是捕捉「大脚怪」出没的虚构场景,都能轻松搞定。Google重视Veo 3的安全性,影片会自动加入可见浮水印,以及隐形的SynthID数位浮水印,防止被误用。Google也透过大规模红队演练来确保内容安全,并透过「喜欢/不喜欢」功能来让用户反应、持续改进。

 

  思觉失调     台北荣总     脑影像  

台北荣总打造AI脑影像平台,辅助思觉失调诊断

台北荣总精神医学部杨智杰教授团队开发出智慧脑影像平台,结合核磁共振和AI深度学习,来辅助评估思觉失调症,诊断准确率高达91.7%。这项做法突破传统靠临床观察的限制,提供客观的生物指标,改善精神疾病诊断与个人化治疗。

思觉失调症影响全球约1%人口,常见幻听、妄想等症状。北荣智慧脑影像平台以1,500名本土受试者数据打造,能三维视觉化大脑异常、精准定位病灶,协助医师与患者家属沟通;该平台也具备脑磁振影像导引功能,可进一步研发精准的经颅磁刺激等非侵入性神经调控,作为临床治疗辅助工具。

这套智慧脑影像平台已获美国爱迪生奖、医策会等奖项肯定,并取得台美及PCT等专利。台北荣总也启用新建的身心智慧创新治疗区,透过该平台来与病人及家属深入讨论大脑变化、提高患者病识感,推动精神疾病诊断迈向AI精准医学。  微软     医学诊断     MAI-DxO  

微软MAI-DxO系统诊断准确率高达85%

微软发表最新研究,展示 AI 在临床诊断的突破性进展。其开发的MAI-DxO系统,针对《新英格兰医学期刊》(NEJM)收录的304个高难度病例进行测试,诊断正确率高达85%,远胜21位美英专科医师仅20%的表现。

MAI-DxO结合了GPT、Llama、Claude、Gemini等模型协作,模拟虚拟医师小组逐步问诊、安排检查并调整推论,更贴近真实临床情境。除了准确率提升,系统也能在虚拟成本限制下,合理规画检查,避免过度使用医疗资源。微软强调,MAI-DxO能根据不同场景调整诊断策略,强化可靠性与可追溯性。不过,AI诊断大规模落地仍需通过更多实证、法规和治理挑战。

 

图片来源/Google、曼彻斯特大学、LYC、台北荣总、Midjourney、微软

  AI近期新闻 

1.