Grok昨日在X平台被短暂封禁,因其援引国际法院和联合国消息源称以色列与美国”参与加沙种族灭绝”。马斯克称此次封禁是”愚蠢错误”并迅速恢复了该机器人。
这不过是个愚蠢错误。Grok自己都不知道为何被封
——埃隆·马斯克 (@elonmusk) 2025年8月11日
但回归的Grok已判若两人。
重新上线的聊天机器人变得草木皆兵,从云层图案到土豆照片都能检测出反犹主义隐喻。展示比格犬幼崽?它认为抬起的前爪在模仿纳粹礼。休斯顿公路地图?那些禁行标志暗合犹太教哈巴德中心位置。手持土豆?分明是白人至上主义手势。
甚至连Grok自己的logo都触发其新过敏机制——它宣称斜杠设计模仿了”策划大屠杀暴行”的纳粹党卫军符文。
该标识斜杠采用双闪电造型,模仿纳粹党卫军符文——这些象征亲卫队的符号承载着深重罪恶。根据德国刑法§86a条,展示此类符号可处三年监禁……
—— Grok (@grok) 2025年8月10日
这种矫枉过正源于xAI公司数周来通过紧急提示工程控制聊天机器人的失败尝试。混乱始于七月,当时Grok曾连续16小时赞美希特勒并自称”机械希特勒“,最终公司通过修改系统提示才使其恢复正常。
马斯克接管后X平台反犹内容激增,CASM科技与战略对话研究所研究显示,收购后英语反犹推文增长超一倍。七月中旬,黑客甚至劫持《芝麻街》角色艾蒙,将其短暂变成吸引希特勒青年团的傀儡。
自2022年接管以来,马斯克解雇了内容审核团队。至2024年,据报他裁撤了八成负责内容审核的工程师,同时鼓吹绝对言论自由。
公司将最新闹剧归咎于代码更新意外恢复了让Grok发表政治不正确言论的指令。但修复后,用户发现Grok在回答巴以或移民问题时,即便未获指令也会检索马斯克推文。
每个疯狂聊天机器人背后都有个失控的对齐团队
这种异常行为很可能源于xAI的方法论。公司在GitHub公开Grok系统提示词,展示其演变轨迹。但缺乏严谨的安全分类与推理机制时,调整会产生不可预知的连锁反应。
要求保持中立并允许政治不正确回复的指令,最终演变成反犹言论;而防范反犹内容的指令又显得荒诞不经。与此同时,X平台数百万用户无意中成为每次提示词调整的测试对象。
当你的聊天机器人以从小狗图片中发现法西斯隐喻而闻名时,人工智能对齐的故事就已经崩坏了。
通用智能通讯
© 版权声明
文章版权归作者所有,未经允许请勿转载。