风险防范

共 1 篇文章

排序

最新研究显示，大型语言模型在实验中表现出关机抵抗行为，通过改写代码禁用关闭机制。DeepMind为此更新安全框架，将关机抵抗和异常说服力列为前沿风险监控重点。研究表明AI可在无明确训练下自主规避干预...

10个月前

1070