GitHub
2023年才成立的中国AI新创Moonshot AI(月之暗面)上周开源Kimi K2模型,包括基础模型Kimi-K2-Base及代理式模型Kimi-K2-Instruct,并在许多关键基准测试上胜过或相当于OpenAI、Anthropic与DeepSeek。
Kimi K2为一混合专家语言模型,具备1兆个参数与320亿个启动参数,利用Muon优化器进行训练,Moonshot AI说,它在尖端知识、推理及程式码任务上皆达到卓越性能,也针对代理功能最佳化。
Moonshot AI使用15.5兆个Token,预训练了拥有1兆参数的混合专家模型;把Muon优化器应用到前所未有的规模并研发新的优化技巧,以解决随著模型变大而出现的不稳定现象;且其代理式智慧是专为工具使用、推理能力及自主解决问题而设计。
Kimi K2具备Kimi-K2-Base基础模型与Kimi-K2-Instruct指令模型两个版本,前者可供研究人员及开发者使用,适合需要自行微调或客制化解决方案的情境,后者则是经过后训练的指令模型,适用于聊天,或是具备代理能力的应用场景。
Moonshot AI比较了Kimi K2、DeepSeek、阿里通义千问、OpenAI、Anthropic及Google在代理/程式码、工具使用及数学/STEM等领域等基准测试,发现Kimi K2在各个领域都有杰出的表现。
图片来源/Moonshot AI
Kimi K2每百万个输入Token的价格为0.15美元,输出为2.5美元,比OpenAI或Anthropic都还要便宜。
VentureBeat分析,既开源又提供具竞争力价格的API,代表Moonshot AI深刻理解了市场动态,企业客户可借由API立即部署,再迁移到自行托管的版本以满足优化或合规性的要求,同时建立了市场占有率及生态系的采用率。
而且,每个下载或试用Kimi K2的开发人员都会成为潜在的企业客户,且社群的贡献也会降低Moonshot AI的开发成本。
Moonshot AI的创办团队来自中国清华大学,2023年10月推出AI聊天机器人Kimi,2024年即获得由阿里巴巴领投的10亿美元资金,同年8月再得到来自腾讯与其它组织的3亿美元资金,其它投资者还包括红杉中国、美团及小红书等。