AI趋势周报第243期:群创光电开源70亿参数的繁中语言模型白龙

图片来源: 

群创光电

重点新闻(0209~0215)

  群创光电     LLM     白龙  

群创光电开源繁中LLM和基准测试资料集

2月初,群创光电智能推进处Text&AIGC研发团队  影片生成     Meta     V-JEPA  

Meta公开新影片生成模型V-JEPA

科技巨头Meta人工智慧研究团队,最近揭露用于影片预测的非生成式AI模型V-JEPA,透过预测影片中缺失或被遮蔽的部分,来提高AI对这个世界的理解。V-JEPA的灵感来源,是来自Meta AI首席科学家Yann LeCun在2022年提出的JEPA架构,Meta曾在去年以JEPA架构开发电脑视觉模型I-JEPA,能预测画面缺失的资讯,来生成图像。

现在,Meta进一步扩展JEPA,发展出能处理影片的V-JEPA。就训练方法来说,团队让模型观看一系列影片,并将这些影片遮蔽处理,来要求预测器在只有一小部分影片内容的上下文中,填充缺失的内容。这么做的好处是,让模型专注于影片的高层次概念,而非钻牛角尖于对下游任务不重要的细节。V-JEPA采自监督学习方法,使用未标记的资料进行预训练,只在要模型适应特定任务时,才会使用标签。V-JEPA还能丢弃不可预测的资讯,提高训练和采样效率达1.5到6倍。

V-JEPA特点之一是冻结评估(Frozen Evaluations),也就是模型在预训练后,核心部分不会再改变,只需添加小型专门层即可适应新任务,免除传统模型对新任务需要全面微调的麻烦。目前,Meta以CC BY-NC授权释出V-JEPA模型。  .NET     微软     云原生  

.NET 9预览版来了!聚焦云原生和AI支援

微软才发布.NET 8不久,.NET 9预览版已经来了!.NET 9的重点仍是效能提升、云端原生与AI开发支援。首先,微软在第9版改善了Visual Studio和VS Code,加入.NET Aspire技术框架新的开发和部署功能,如元件配置、除错支援、全面整合开发者仪表板,来让开发者更轻松管理和监控应用程式。开发者也可从Visual Studio、VS Code,结合使用Azure Developer CLI,将应用程式快速部署到Azure容器,让应用程式更快上云。

此外,.NET 9还持续改进Native AOT(Ahead-of-Time Compilation),来提高应用程式的启动速度和执行效率,减少资源消耗。至于.NET 9对AI开发的支援,则是要让开发者更容易使用新AI技术和OpenAI服务,亦即提供更多函式库和文件,协助开发者使用OpenAI服务和其他开源模型,包括本地端和云端模型的支援。微软也会持续投资跨平台机器学习框架ML.NET,强化向量资料库和AI工作负载的支援,让开发者更容易将AI功能整合到应用程式中。目前,微软已开放.NET 9预览版供开发者下载测试。  图像生成     Stability AI     Stable Cascade  

Stability AI发表新一代图像生成模型,比前一代更省16倍成本

Stability AI日前发表新一代文字转图像模型Stable Cascade,可简单地在消费级硬体上训练和微调。就流程来说,Stable Cascade有3步骤将文字转换为图像,包括潜在解码阶段的步骤A与步骤B,以及潜在生成阶段的步骤C。

其中,步骤C是将用户的指令,转换成一张小型且简化的图像草稿,只包含重要资讯,再将草稿输入至步骤A和步骤B,同时加入更多细节并放大,形成一张详细且高解析度的图片。由于步骤C与步骤A、B分离,因此可单独对步骤C额外训练和微调,包括ControlNet和LoRA的训练。这种设计,让新模型与训练一个类似大小的Stable Diffusion模型相比,节省了16倍成本。

经测试,Stable Cascade不只效能更好,产生的结果也比前一代模型SDXL更好。目前,Stability AI开源步骤C和步骤B各两种模型,步骤C有10亿参数和36亿参数版本,步骤B则有7亿和15亿参数版本。不只如此,团队也同时开源用于训练、微调、ControlNet和LoRA的所有程式码,但这些开源资料只限非商业使用。  浏览器     ONNX Runtime     模型训练  

开发者可在浏览器训练模型!ONNX Runtime 1.17还支援联合学习

微软更新AI推论与训练加速引擎ONNX Runtime(ORT),加入网页训练功能,让开发者在浏览器中启用模型训练功能,如此装置上的资料就能透过浏览器,进行联合学习和个人化应用。

从1.8版本开始,ORT Web提供浏览器内推论功能,让开发者可部署跨平台、可移植的AI模型,并支援模型在CPU和GPU推论。在最新的ONNX Runtime 1.17中,进一步支援在浏览器训练机器学习模型,该功能主要由2部分组成,分别是WebAssembly二进位档案和JavaScript套件。由于要让开发者可以在浏览器用CPU来训练模型,ONNX Runtime提供训练功能应用程式介面C API,但浏览器不能直接执行C语言程式码,所以需要使用低阶语言WebAssembly协助。2. Nvidia推出资料来源:iThome整理,2024年2月