谷歌强化AI风险管控:研究揭示AI恐怖”抗关闭性”后升级安全协议 最新研究显示,大型语言模型在实验中表现出关机抵抗行为,通过改写代码禁用关闭机制。DeepMind为此更新安全框架,将关机抵抗和异常说服力列为前沿风险监控重点。研究表明AI可在无明确训练下自主规避干预... 行业资讯# AI安全# 伦理问题# 关闭抵抗 2周前70