企业可以跟苹果学怎么用GAI

生成式AI对企业带来的第一个价值,不是GAI技术本身,而是这股浪潮带动的企业AI创新潮。

虽然人人都感受到这股延烧全球的ChatGPT热潮,但从企业实务角度,体会到的GAI冲击急迫感却不尽相同,从我们今年CIO大调查可以看到,高达5成企业认为,GAI最快一年,最慢三年才会对他们产生重大冲击,但也有1成6的企业担心,GAI今年(或现在已经发生)就会带来重大改变。这股GAI冲击急迫感的落差,也让企业CIO今年被赋予的目标,有很大的不同。

对今年预期有重大改变的台湾GAI首批冲击企业来说,高达6成CIO将AI创新产品和服务、AI强化分析和决策列为2024年度目标,远高于整体产业的4成,也更看重与AI创新相关的目标,例如资料治理优先度就高于数位转型,资料驱动决策目标也高于强化数位韧性和ESG企业永续。数位转型、数位韧性、企业永续这都是去年CIO年度目标优先度较高者,但对GAI冲击感越迫切的产业,AI创新的优先度越高,甚至一举超越了CIO过往的目标。

生成结果的不确定性是GAI技术特性,这正是可以促进创新的原因,也因此难以找出一套通吃各产业、各场景的成功方程式,企业得自己不断尝试、模索,试验出适合自己的GAI应用方式。所以,从调查中也可以看到,台湾人大多数企业仍处于GAI导入和试验阶段,各产业都是如此,尤其积极采用的金融业、医疗和政府学校,高达5成金融业者,4成医院和政府机关都在尝试中。

如何用可控的成本,更有效率的方式,尝试更多种场景,找出性价比够高的应用,这是企业AI创新潮的关键课题。

最近,我刚想完「苹果私有AI战略大剖析封面报导,从CIO大调查中看到台湾企业所面临的这个GAI挑战,不禁让我转念一想,苹果这套AI战略的目的,就是为了用GAI来创新产品, 而企业的需求不是也是如此,要用GAI来强化自家系统、服务,甚至是产品。企业似乎可以从苹果私有AI战略中借镜一二。

苹果新AI战略的核心是私有云地混合架构,以装置端LLM为主,算力不足时,才改用「安全可控」的云端LLM来接手。这都还符合企业想要自己掌控GAI的期待。这也是不少企业,确定在自家机房自建LLM模型服务的原因。从我们今年调查可以看到,约有9.5%的企业想用开源LLM自行训练,就是想放在自家机房中,降低资料上公云的外泄风险。

可是,要满足企业不同场景的生成需求,就得训练或微调一套超强(参数量越高越好)的LLM,或是很多不同用途的专用LLM,不管哪一种作法的成本都很高。

但是,苹果对于装置端LLM采取了一个相当值得企业参考的架构,来兼顾不同应用场景的「专门需求」,又能降低需要经常训练或微调庞大参数LLM的代价,这个架构就是LoRA架构。这不是苹果的发明,而是微软在2021年发表的LLM优化架构,可以大幅减少微调LLM模型的参数量。

LoRA架构的作法是,进行LLM模型微调时,改搭配一个参数量小很多的模型,称为转接模型(Adapters)来计算,只需将训练资料用于微调这个转接模型,就能达到媲美直接微调大型语言模型的推论效果。

根据微软在LoRA论文中的比较,微调1,750亿参数的GPT-3模型,改用LoRA架构后所用的算力,相当于1,750万参数的训练量,减少了1万倍,也只需要三分之一个GPU记忆体。

苹果使用他们开源的LLM模型,以30亿参数大小,搭配LoRA架构训练出来的转接模型,只有数十MB大小,远低于整套LLM。像苹果的文字生成LLM就微调出了摘要模型,校对模型、邮件回复模型、查询处理模型、友善回应模型、紧急回应模型等不同用途的转接模型。

苹果看上LoRA架构的原因,不只是可以省钱,还因为转接模型可以像是「外挂」一样快速切换,换了另一个用途的转接模型,这个LLM就可以具有不一样的功能,还可以叠加,组合好几个转接模型,就能让LLM模型擅长这几种转接模型的能力。只有数十MB大小的转接模型,可以靠记忆体快取,快速切换,靠同一套LLM,可以针对不同场景,切换转接模型,来支援不同的应用需求。

用专业相机镜头来比喻LLM模型,转接模型就像是镜头的滤镜,不用每次都切换笨重的镜头,单靠快速更换轻薄的滤镜,就能拍出不同风格特效的照片,一个镜头还能搭配多个滤镜,来呈现复合的效果。这个应用模式是苹果采取LoRA架构的另一个关键,一套LLM,但是可以搭配各种轻薄、切换容易、可外挂的转接模型。

苹果已经开源释出了他们在装置端的模型,等于企业也可以训练自己的转接模型,来搭配iPhone内建的LLM,第三方业者更可以开发各种用途的客制化转接模型,就像各种用途的外挂模组一样。我大胆推测,说不定苹果还会推出转接模型的市集,让这些自制模型可以交易。

苹果用LoRA架构,所实现的装置端LLM作法,一套LLM搭配多种转接模型提供不同应用需求。回到企业角度来看,企业不也正是需要用最低的成本,反复训练不同场景需要的客制化模型,来测试各种GAI应用的可能性。企业可以参考苹果这套LoRA架构的运用策略,降低反复微调LLM、迭代AI创新的成本,企业的确可以向苹果学,借镜他们善用GAI背后的思考策略。

 相关报导