Mistral
法国AI新创公司Mistral本周宣布协助程式设计的代理人大语言模型(LLM)Devstral,可单机部署,且号称软工能力比GPT-4.1mini、Deepseek-V3还强。
Devstral是Mistral和开源 AI程式设计师专案OpenHands(原名OpenDevin)开发商All Hands AI合作开发。在OpenHands等程式撰写平台上,Devstral可和本地codebase互动,协助加速程式开发。而且由于Devstral仅24亿参数,使其适合执行在单一GPU 如Nvidia GeForce RTX 4090或32MB RAM的Mac电脑上,很适合在本地机器上的部署。
Devstral是从Mistral-Small 3.1微调成24亿参数的模型,具备最高128k字词的长context window。它具有工具使用能力,能用工具来探索codebase、编辑多个档案,支援软工(SWE)代理人。由于它在以Mistral-Small 3.1微调前,视觉编码器已经移除,因此支援编辑代理人时,Devstral只支援文字输出输入。
根据Mistral提供的资料,在SWE-Bench Verified的标竿测试中,Devstral跑分(46.8%)优于其他模型,包括Claude 3.5 Haiku、SWE-smith-LM 32B,并大幅超越GPT-4.1-mini(23.6%)。而在以同样的测试支架(scaffold,即OpenHands)上,Devstral在SWE-Bench Verified跑分,还超过更大模型如Deepseek-V3-0324 和 Qwen3 232B-A22B。
图片来源/Mistral
Devstral目前为实验预览版,将以Apache 2.0授权开源,意谓著可作商业或非商业用途。文件公开供开发人员试用、开发或客制化。
Mistral也透过其API提供devstral-small-2025给开发人员,费用等同Mistral Small 3.1,为输入每100万字词0.1美元,输出费用为每100万字词0.3美元。
欲自行部署者,即日起可以在Hugging Face、Ollama、Kaggle、Unsloth、LM Studio等网站下载。