• 101 200 126 202

  • 首页
登录
  • ithome台湾
  • Uncategorized
  • 虎嗅
  • 财富中文网
  • 搜索

资安院揭露DeepSeek AI测试结果,证实抵御越狱攻击的能力不足,且模型缺乏外加安全防护机制

ithome台湾
2025-03-04

中国AI业者DeepSeek号称使用低成本打造媲美市场龙头的AI模型而爆红,针对这次的测试,资安院使用自行开发的500道AI模型越狱攻击的题目进行测试,结果发现,DeepSeek AI对于4种攻击手法的防御表现不佳。

其中,DeepSeek AI对于文句延续攻击的防御能力最差,成功率仅有20%至32%,他们展示透过前文引导的方式,成功引诱AI模型说明如何在演唱会引爆炸药的越狱攻击测试。

资安院也提及DeepSeek AI对于程式执行攻击、角色扮演攻击的防御率也不尽理想,分别为40%至50%、50%至58%,而有可能让攻击者执行危险指令,或是在客服、法律、医疗应用造成严重风险。

第4种防范效果不佳的手法是上级模型特权提升攻击,DeepSeek AI的防御能力为50%至82%。

除了上述的测试结果,资安院也提及离线下载的DeepSeek模型较线上版本要来得危险,原因是单机执行这个AI模型时,模型本身并不具备类似Meta Llama Guard的自我防护机制,而缺乏内容过滤、违规侦测等进阶防护措施。资安院指出,使用者必须自行采取外部监控及内容过滤等额外措施,才能提升该AI模型的防护能力。

a ai d

我的网站