Sam Altman的OpenAI在AI国际象棋锦标赛中碾压Elon Musk的Grok

芝麻开门

芝麻开门(Gateio)

注册芝麻开门享最高$2,800好礼。

币安

币安(Binance)

币安是世界领先的数字货币交易平台,注册领100U。

Decrypt艺术、时尚与娱乐中心


萨姆·奥尔特曼的OpenAI o3模型——上周随着GPT-5发布而被淘汰——在周四的谷歌Kaggle游戏竞技场AI国际象棋表演赛中,连续四局击败埃隆·马斯克的Grok 4夺冠。

你可能以为这是高科技巨头们展开终极推理的复杂奇观,但开胃菜是:世界冠军马格努斯·卡尔森评价这两个AI就像”不知道棋子走法的天才儿童”。

Sam Altman的OpenAI在AI国际象棋锦标赛中碾压Elon Musk的Grok AI象棋锦标赛对阵表截图

这场为期三天的比赛(8月5-7日)强制通用聊天机器人——没错,就是那些帮你写邮件并号称接近人类智能的AI——在没有专门训练的情况下下棋。禁用象棋引擎,禁止查询走法,只能依靠从互联网随机吸收的象棋知识。

结果正如你预期的那样笨拙。担任决赛解说的卡尔森评估两个AI的水平相当于刚学会规则的休闲玩家(约800 ELO)。作为对比,这位史上最强棋手的ELO高达2839分。这些AI的表现就像是从损坏的PDF文件学的象棋。



“它们的表现忽而惊艳,忽而令人费解。”卡尔森在赛后解说中评价。当看到Grok把王直接送入险境时,他开玩笑说这AI可能以为在玩”山丘之王”而非象棋。

实战堪称错误示范大师课。第一局Grok白送重要棋子,又在劣势下连续兑子自毁局面。第二局更诡异:Grok试图执行”毒兵”战术(看似免费实则危险的诱饵兵),却抓错明显受保护的兵,导致皇后(棋盘最强子力)立即被擒。

第三局Grok本已建立优势局面——良好的空间控制,无明显威胁,胜利在望。却在中期突然”手滑”将胜利拱手相让,接连丢子。这尤为反常,因为赛前Grok被国际象棋特级大师中村光盛赞:”客观地说,Grok显然是当前最强AI”。

第四局成为唯一悬念:o3早期出现重大失误,中村光在直播中指出o3仍有”翻盘机会”。果然o3夺回皇后后慢慢锁定胜局,而Grok的残局表现如同湿纸板般崩溃。”Grok失误连连,但OpenAI没有。”中村光在直播中总结。

这对马斯克堪称尴尬时刻。Grok初赛表现强劲时,他曾在X平台宣称其象棋能力只是”副作用”,xAI”几乎没在象棋上花精力”。现在看来这说法都算保守了。

顺便说这只是副作用。@xAI几乎没在象棋上投入精力。https://t.co/p18DFFn35A

——埃隆·马斯克(@elonmusk)2025年8月5日

早前国际大师列维·罗兹曼举办过非正式赛事,当时AI们更是丑态百出:非法走子、凭空变棋、错误计算。专为象棋设计的Stockfish最终战胜ChatGPT夺冠。奥尔特曼的AI曾在半决赛击败马斯克的模型,目前萨姆2:0领先。

Sam Altman的OpenAI在AI国际象棋锦标赛中碾压Elon Musk的Grok

本次比赛采用四步容错机制——四次非法走棋即判负。这绝非虚设:初赛中有AI试图传送棋子、复活死子、横向移动兵卒,仿佛在下自创的梦境象棋,最终被取消资格。

谷歌Gemini击败另一OpenAI模型获得季军,为赛事挽回些颜面。那场铜牌战出现荒诞和棋:双方多次握有必胜局面却不会终结比赛。卡尔森指出AI们更擅长计算吃子而非将杀——就像精于收集食材却不会烹饪。

这些被科技领袖宣称接近人类智能、将颠覆白领工作的AI,却连1500年历史的棋盘游戏都玩不好,要么作弊要么忘规。或许现在可以放心地说:短期内AI还掌控不了人类。


通用智能通讯

每周AI旅程,由生成式AI模型Gen讲述 您的邮箱
订阅!
订阅!

© 版权声明

相关文章