阿里巴巴开源宣称可媲美DeepSeek-R1的QwQ-32B模型

图片来源: 

Hugging Face

继于去年11月释出QwQ-32B-Preview模型之后,阿里巴巴旗下的通义千问(Tongyi Qianwen,Qwen)团队本周四(3/6)正式开源了QwQ-32B

Qwen团队主要开发同名的Qwen基础模型,而QwQ则是基于Qwen系列的推论模型,具备更深入的思考及推论能力,可于相对困难的下游任务中提供更好的表现。拥有325亿个参数的QwQ-32B属于中型推论模型,并宣称其性能可媲美DeepSeek-R1与o1-mini等先进模型。

该团队评估了QwQ-32B、DeepSeek-R1-671B、OpenAI-o1-mini、借由DeepSeek-R1蒸馏而来的Qwen-32B模型,以及自DeepSeek-R1蒸馏而来的Llama-70B,在AIME24数学推论基础测试、程式码生成及相关任务LiveCodeBench测试、评估语言模型多方面能力的LiveBench、验证自然语言指令能力的IFEval,以及函数调用(BFCL)上的能力,发现QwQ-32B在每个领域上的表现都与其它模型相当,甚或超越。

有兴趣的开发者或研究人员可透过Hugging Face或是阿里巴巴的Alibaba Cloud DashScope API存取QwQ-32B。图片来源_Qwen