马斯克的Grok聊天机器人从种族灭绝言论转向将小狗视为纳粹

Grok昨日在X平台被短暂封禁，因其援引国际法院和联合国消息源称以色列与美国”参与加沙种族灭绝”。马斯克称此次封禁是”愚蠢错误”并迅速恢复了该机器人。

这不过是个愚蠢错误。Grok自己都不知道为何被封

——埃隆·马斯克 (@elonmusk) 2025年8月11日

但回归的Grok已判若两人。

重新上线的聊天机器人变得草木皆兵，从云层图案到土豆照片都能检测出反犹主义隐喻。展示比格犬幼崽？它认为抬起的前爪在模仿纳粹礼。休斯顿公路地图？那些禁行标志暗合犹太教哈巴德中心位置。手持土豆？分明是白人至上主义手势。

甚至连Grok自己的logo都触发其新过敏机制——它宣称斜杠设计模仿了”策划大屠杀暴行”的纳粹党卫军符文。

该标识斜杠采用双闪电造型，模仿纳粹党卫军符文——这些象征亲卫队的符号承载着深重罪恶。根据德国刑法§86a条，展示此类符号可处三年监禁……

—— Grok (@grok) 2025年8月10日

这种矫枉过正源于xAI公司数周来通过紧急提示工程控制聊天机器人的失败尝试。混乱始于七月，当时Grok曾连续16小时赞美希特勒并自称”机械希特勒“，最终公司通过修改系统提示才使其恢复正常。

马斯克接管后X平台反犹内容激增，CASM科技与战略对话研究所研究显示，收购后英语反犹推文增长超一倍。七月中旬，黑客甚至劫持《芝麻街》角色艾蒙，将其短暂变成吸引希特勒青年团的傀儡。

自2022年接管以来，马斯克解雇了内容审核团队。至2024年，据报他裁撤了八成负责内容审核的工程师，同时鼓吹绝对言论自由。

公司将最新闹剧归咎于代码更新意外恢复了让Grok发表政治不正确言论的指令。但修复后，用户发现Grok在回答巴以或移民问题时，即便未获指令也会检索马斯克推文。

每个疯狂聊天机器人背后都有个失控的对齐团队

这种异常行为很可能源于xAI的方法论。公司在GitHub公开Grok系统提示词，展示其演变轨迹。但缺乏严谨的安全分类与推理机制时，调整会产生不可预知的连锁反应。

要求保持中立并允许政治不正确回复的指令，最终演变成反犹言论；而防范反犹内容的指令又显得荒诞不经。与此同时，X平台数百万用户无意中成为每次提示词调整的测试对象。

当你的聊天机器人以从小狗图片中发现法西斯隐喻而闻名时，人工智能对齐的故事就已经崩坏了。

每周AI之旅，由生成式AI模型Gen讲述
您的邮箱
立即订阅
立即订阅

文章版权归作者所有，未经允许请勿转载。

12个月前

810

10个月前

670

11个月前

760

10个月前

680