Anthropic公开宪法式分类器,大幅降低AI越狱攻击成功率

Anthropic公开名为