資安院揭露DeepSeek AI測試結果，證實抵禦越獄攻擊的能力不足，且模型缺乏外加安全防護機制

中国AI业者DeepSeek号称使用低成本打造媲美市场龙头的AI模型而爆红，针对这次的测试，资安院使用自行开发的500道AI模型越狱攻击的题目进行测试，结果发现，DeepSeek AI对于4种攻击手法的防御表现不佳。

其中，DeepSeek AI对于文句延续攻击的防御能力最差，成功率仅有20%至32%，他们展示透过前文引导的方式，成功引诱AI模型说明如何在演唱会引爆炸药的越狱攻击测试。

资安院也提及DeepSeek AI对于程式执行攻击、角色扮演攻击的防御率也不尽理想，分别为40%至50%、50%至58%，而有可能让攻击者执行危险指令，或是在客服、法律、医疗应用造成严重风险。

第4种防范效果不佳的手法是上级模型特权提升攻击，DeepSeek AI的防御能力为50%至82%。

除了上述的测试结果，资安院也提及离线下载的DeepSeek模型较线上版本要来得危险，原因是单机执行这个AI模型时，模型本身并不具备类似Meta Llama Guard的自我防护机制，而缺乏内容过滤、违规侦测等进阶防护措施。资安院指出，使用者必须自行采取外部监控及内容过滤等额外措施，才能提升该AI模型的防护能力。

资安院揭露DeepSeek AI测试结果，证实抵御越狱攻击的能力不足，且模型缺乏外加安全防护机制