Hugging Face逆向工程DeepSeek-R1,将打造开放推理模型Open-R1

中国人工智慧公司所开发的DeepSeek-R1模型发布以来,相对低廉的硬体与训练成本就能展现高水准推理能力,在市场引发极大震荡。Hugging Face现正根据DeepSeek所公布的研究内容进行逆向工程,试图推出名为运算资源,该丛集有96个节点,每个节点有8张显示卡,共768颗Nvidia H100可用于密集训练,Hugging Face预计在数周内推出第一个可公开测试的原型版本。