阿里巴巴開源宣稱可媲美DeepSeek-R1的QwQ-32B模型

图片来源:

Hugging Face

继于去年11月释出QwQ-32B-Preview模型之后，阿里巴巴旗下的通义千问（Tongyi Qianwen，Qwen）团队本周四（3/6）正式开源了QwQ-32B。

Qwen团队主要开发同名的Qwen基础模型，而QwQ则是基于Qwen系列的推论模型，具备更深入的思考及推论能力，可于相对困难的下游任务中提供更好的表现。拥有325亿个参数的QwQ-32B属于中型推论模型，并宣称其性能可媲美DeepSeek-R1与o1-mini等先进模型。

该团队评估了QwQ-32B、DeepSeek-R1-671B、OpenAI-o1-mini、借由DeepSeek-R1蒸馏而来的Qwen-32B模型，以及自DeepSeek-R1蒸馏而来的Llama-70B，在AIME24数学推论基础测试、程式码生成及相关任务LiveCodeBench测试、评估语言模型多方面能力的LiveBench、验证自然语言指令能力的IFEval，以及函数调用（BFCL）上的能力，发现QwQ-32B在每个领域上的表现都与其它模型相当，甚或超越。

有兴趣的开发者或研究人员可透过Hugging Face或是阿里巴巴的Alibaba Cloud DashScope API存取QwQ-32B。图片来源_Qwen

阿里巴巴开源宣称可媲美DeepSeek-R1的QwQ-32B模型