Mistral AI推出轻量程式撰写辅助模型

图片来源: 

Hugging Face

法国AI新创公司Mistral AI周三加入生成式AI模型竞赛行列,公布轻量程式撰写辅助模型Codestral,能完成程式码撰写,也能撰写测试,加速开发人员软体专案速度。

Codestral也是Mistral AI今年4月发表Mixtral 8x22B大语言模型后,释出的第一个辅助开发程式专用的模型。这家法国新创公司备受瞩目,二月前才分别获得微软40亿及Amazon 12亿欧元的资金挹注。

Codestral是以80多种程式开发语言的资料集训练,涵括Python、Java、C、C++和Bash等,它也可使用Swift和Fortran开发。它的模型参数达220亿,它可作为指令语言模型(instructed version),可回答开发问题或执行开发任务,例如解释程式码片段、撰写文件、因子分析,或产生开发人员需要的程式码。它也支援fill-in-the-middle(FIM)功能,能预测前缀、后缀字串预测中间元素,完成任何部份程式码,对VS Code之类的软体开发相当有帮助。Mistral AI相信其涵盖广度可扩大其专案适用性,结合此一模型可提升开发人员开发品质,减低错误及臭虫的风险。

Codestral现在已在MNLP-0.1授权下,在Hugging Face平台开源

Mistral AI团队公布了新模型和竞争者在Python、SQL专案的效能测试数据,显示在三项和Python开发相关的项目中,优于Meta的Llama 3-70B与已开源的CodeLlama -70B以及DeepSeek Coder,而在SQL开发专案标竿测试中,仅落在Llama 3之后,平均分数则击败其他模型。

新模型可和主要开源工具整合使用,包括应用框架LlamaIndex、LangChain,整合开发环境(IDE)如VSCode与JetBrains。Mistral AI也提供了一些范例参考

图片来源/Mistral AI

连同本模型,该团队同时以beta版提供新的API端点,为期8周,供开发人员在其自有IDE透过API端点存取。不过为确保网路频宽,Mistral AI限定使用人数,开发人员必须加入等候清单。此外,Codestral也可经由Mistral AI的开发测试平台La Plateforme以主要API端点开放存取,开发人员试用前须先建立帐号。

Mistral AI即日已先将Codestral指令版上线,现在已经可经由le Chat AI聊天机器人存取。