AI趨勢周報第238期：突破LLM擴展法則？MosaicML揭新研究成果

MosaicML团队修改了热门的DeepMind Chinchilla优化方法，来根据理想的模型品质和运算成本需求，计算出最佳的LLM参数量与训练资料集大小，并实际用Chinchilla模型来实验。

图片来源:

MosaicML

重点新闻(1229～0104)

LLM Chinchilla 扩展法则

突破LLM扩展法则？MosaicML揭新研究成果

一般来说，LLM扩展法则都是以模型参数量和训练资料量，来估算模型品质的变化，就连热门的DeepMind Chinchilla（龙猫）优化方法也是。换句话说，这个法则是指，模型的训练Token数和参数越多，模型表现理应越好。

摩根大通发表懂图文的轻量级多模态模型DocLLM

日前，摩根大通发JPMorgan表自行研发的多模态轻量级语言模型DocLLM，可用来分析企业文件，如发票、收据、合约、表格和报告等。进一步来说，DocLLM使用OCR得到的边界框，来添加空间位置资讯，因此不必使用复杂的视觉编码器，减少处理时间。这么做，几乎不增加模型大小，也保留了因果解码器的架构。

苹果公布多模态AI模型Ferret

自2023年12月开始，苹果陆续公布AI研发成果，日前又发布了多模态大型语言模型（MLLM）Ferret和相关基准测试工具与资料集。多模态是指模型可处理多种类型的资料，以Ferret来说，它可接收文字、声音、影像和数据的输入值。

这款Ferret采用新式混合区域表征技术，整合了个别方位和连续性的特征，来表示图片中的某一区域。为提取出区域中的连续特征，苹果还提出一种空间感知的视觉采样器，来处理不同形状多种稀疏性。如此一来，Ferret就可接收多样化区域输入，像是点、边界框或自由形式的形状。

靠AI和卫星图像，画出全球首张海上船只足迹地图

《自然》期刊最近刊出一篇研究报告，全球渔业观察（Global Fishing Watch）组织主导一项研究，用机器学习和卫星图像，绘制出全球首张海上基础设施和船只足迹地图，揭露75%的工业渔船一直在暗中活动。

AI近期新闻

1. 微软全面推出Copilot App

2. 英特尔成立生成式AI公司Articul8 AI

3. 高通推出混合实境晶片Snapdragon XR2+

4. 高品质声音复制模型OpenVoice开源了

资料来源：iThome整理，2024年1月

AI趋势周报第238期： 突破LLM扩展法则？MosaicML揭新研究成果