国际象棋与人工智能:克拉姆尼克的深度访谈

作者:塞巴斯蒂安2025年08月14日
国际象棋与人工智能:克拉姆尼克的深度访谈

– 今天的嘉宾是我的播客节目的嘉宾——弗拉基米尔·克拉姆尼克,国际象棋第14任世界冠军,也是我们这个时代最受尊敬的棋手之一。我们将讨论许多不同的主题,包括计算机国际象棋的出现和发展,基于神经网络原理构建的谷歌AlphaZero项目,计算机对高水平运动员训练的影响,当然还有弗拉基米尔关于心理学和比赛训练的建议。我认为,他的许多建议不仅对国际象棋棋手有用,对扑克牌手也很有用。

弗拉基米尔,感谢您接受邀请!这对我是莫大的荣幸。

– 谢谢您的邀请。

– 让我们从人工智能在国际象棋中的历史开始。现代国际象棋棋手在准备过程中积极利用计算机的帮助。扑克正在追随国际象棋的脚步,落后几年。我希望您能分享您在这方面的经验。

– 是的,当然。的确,我是在计算机时代之前学会下棋的,但在我的职业生涯中,我亲眼目睹了计算机如何逐渐在国际象棋棋手的生活中占据越来越重要的地位。起初,程序非常弱,人们只是嘲笑它们。后来它们达到了大师级水平,我在2002年和2006年与当时最强大的程序进行了两场重要的比赛。不久之后,与它们抗衡变得不可能了。最后,最近出现了“阿尔法零”——一个基于神经网络的全新概念程序。

1993年,当我作为世界排名前十的棋手参加我的第一场比赛时,我甚至没有电脑。但很快,就像其他人一样,我不得不适应新的现实。所以,我有很多话要说。

– 人们不喜欢改变。我相信,当许多人意识到计算机对比赛准备的影响有多大时,他们并不高兴。

– 是的,当然,许多人都不满意,尤其是老一辈的棋手。然而,高水平的棋手别无选择。如果你想保持竞争力,你就无权拒绝使用计算机——这优势太大了。计算机已经成为准备工作中不可或缺的一部分。

正如我所说,在我职业生涯的早期,我没有使用过计算机。然后有一段时间,我们把它用作数据库,储存已下的棋局。直到后来才出现了国际象棋引擎。

当然,早在80年代,就有人尝试编写用于国际象棋的计算机程序,但那些程序非常弱——它们的水平相当于业余爱好者。它们逐渐增强到大师级水平,但这不足以给顶级棋手带来好处。这种情况一直持续到90年代中期左右,直到那时,使用引擎才变得有意义。它们仍然不适合用于严肃的训练比赛,但带来了一些好处。1995年,我在加里·卡斯帕罗夫与维斯瓦纳坦·阿南德的世界冠军赛中担任他的助手。加里当时已经开始在开局中使用计算机。机器经常显示出完全的胡说八道,尽管如此,它还是有一些用处。我想,这是在最高水平上使用计算机进行准备的第一个案例。

在90年代的后半期,国际象棋计算机的发展迅速加速。在本世纪初,它们已经被广泛使用。如今,我们更像是操作员。95%的准备工作纯粹是计算机分析,只有偶尔,我们会尝试自己为它们指明方向:哦,我有一个想法,这步棋不在最强的棋步之列,但看起来很有趣——把它输入计算机,让它告诉我为什么我错了。通常——几乎总是——计算机会反驳这些想法,但很少很少,才能以此找到真正有价值的东西。

然而,在准备过程中,我们仍然必须依靠我们自己对比赛的看法。毕竟,在棋盘上你必须自己下棋。如果计算机喜欢这个局面,但你感觉不到它,不明白如何解读它——你不应该下它。你必须理解这种高评价的原因。

当今所有最强的棋手都试图拥有尽可能强大的计算机。他们与工程师合作,工程师专门为棋手面前的任务组装计算机,甚至重新设计现有的引擎,以使它们在组装的机器上更有效地工作。这是一场真正的军备竞赛。在最高水平上,一方在计算机设备上的优势可能会起到决定性作用。特别是在世界冠军赛中。

计算机的计算能力还不是全部。引擎之间也存在竞争。新颖有趣引擎的创造者通常会主动与顶级棋手取得联系。只有“阿尔法零”的创造者没有这样做——显然是目前最强的程序。它是在一个科学项目的框架内创建的,不适用于棋手。据我所知,没有人可以访问“阿尔法零”。我认为这是正确的,否则某人将获得太大的优势。我与“阿尔法零”的创造者合作,帮助他们工作,因此我时不时会有这样的访问权限,但不能用于开局工作,而且我已经不再从事开局工作了,因为我结束了职业生涯。

– 我看到了与扑克的明显相似之处。看起来,我们在使用人工智能方面比国际象棋落后几步,但差距正在迅速缩小。我对关于使用计算机进行准备的讲述很感兴趣。国际象棋棋手不仅要记住计算机提出的棋步——还需要理解它的含义,以便在比赛中正确应用它。扑克对我们的要求完全相同。记住求解器的所有决策是不可能的——信息量太大了。为了从求解器中获益,你需要在他们的决策中找到逻辑。或者——另一种不错的方法——提出你自己的决策,并问问我哪里做错了。

同样,一开始计算机的使用仅限于数据库,后来它被用于相当狭窄和专业化的条件下,只有后来它才开始被广泛使用。我想更多地了解这种演变是如何进行的,在这种演变中,计算机逐渐融入日常工作。

– 众所周知,历史上第一个国际象棋程序是由一位在第二次世界大战期间破解“恩尼格玛”的英国密码破译员编写的。顺便说一下,这个团队中包括大师亚历山大,一位非常强大的棋手,英国冠军。这个程序当然非常简单...

数学家和控制论者经常喜欢国际象棋,自然,他们中的许多人试图编写国际象棋程序。出于大致相同的原因,“阿尔法零”也出现了——Deep Mind的老板德米斯·哈萨比斯年轻时是一位优秀的国际象棋棋手,15岁以下的全国冠军,青年世界锦标赛的参赛者。1992年,我们甚至在同一场比赛中比赛,但没有在棋盘上相遇。后来,与我不同的是,他很明智地改变了专业方向,开始从事数学。在他所从事的领域,他现在是世界上最好的之一。总而言之,数学家对国际象棋的热爱是国际象棋很早就受到程序员关注的主要原因之一。另一个原因是,国际象棋可能适合计算机建模:它规则简单,但游戏本身非常复杂。

在80年代,出现了国际象棋计算机,看起来像带有电子元件的棋盘。我记得我曾给它们同时对弈。这些程序非常弱,它们没有任何抵抗力,但它们可以与业余爱好者对抗。

卡斯帕罗夫在80年代中期给计算机同时对弈

然后出现了ChessBase——可能是第一家专门从事国际象棋技术的公司。他们收集了自15世纪以来所有已知的比赛,并将它们纳入数据库,然后出售给棋手。这是一个真正的突破。在ChessBase之前,棋手不得不携带开局百科全书和分析笔记本参加比赛——这是沉重的负担。随着计算机数据库的出现,只需携带一台笔记本电脑就足够了。数据库定期更新,一切都非常方便。

然后出现了分析引擎。在“阿尔法零”之前,程序中输入了程序员对国际象棋的所有了解——游戏规则、已知的比赛和评估参数,这些参数考虑了棋子的价值和位置思路。这种程序的开发非常缓慢,因为国际象棋中有很多这样的元素,而且很难找到它们之间正确的平衡,如果可能的话。尽管如此,程序还是逐渐增强了,考虑到计算机的计算能力成倍增加,它们很快就变得非常强大。然而,它们仍然的弱点在于对位置的不准确评估。可以计算出一种结尾你赢得一个棋子的变化是一回事,但是当没有强制性胜利时,如何选择方向呢?

程序计算得非常好,也很深入,但对位置的评估很差。人们计算得更差,但他们的直觉评估更准确。即使在现在,我认为当今世界上最强的棋手在位置理解方面仍然比计算机强。然而,对变化的深入计算有助于计算机正确评估位置。一个人会因为普通的考虑而拒绝一个削弱重要区域的走法,仅仅是因为它肯定会在未来产生影响。而计算机则必须深入挖掘并发现一个具体的变体,在这个变体中,这个区域的弱点将发挥作用。然而,现代程序在强大的计算机上看得非常远。“斯托克鱼”在一台好的计算机上可以计算50步之前——考虑所有可能的变化。这太多了——整场比赛!因此,与它们对抗是如此困难。但我仍然不会称之为理解国际象棋——这只是非常深入的计算。

1997年,卡斯帕罗夫和深蓝之间有一场非常著名的比赛,我认为。卡斯帕罗夫当然比深蓝强得多,这一点毫无疑问,问任何一位职业选手。是的,他输了,但失败是偶然的。比赛很短,只有六局。与96年被卡斯帕罗夫击败的早期版本相比,计算机的水平有了很大的提高。我想,卡斯帕罗夫没有预料到这一点,也没有认真准备新的比赛,当他面对强大的抵抗时,即使它并非不可逾越,他也开始紧张了。加里是一个情绪化的人,失去了内心的平衡,在最后一场比赛中犯了一个相当愚蠢的错误,输了。

我想,深蓝的水平相当于前30名,也许是前20名。一个强大的对手,不是一次轻松的散步。但公关人员把它描绘成好像计算机已经比世界冠军更强了。

2002年,我与一台更强大的计算机进行了一场比赛,打成了4-4平,我对平局不满意,因为我觉得我下得稍强一些,大概是55比45。我以3-1领先,但不幸的是,后来输了两局。

四年后,也就是2006年,我参加了下一场比赛,差异已经很明显了。2002年与我比赛的机器可以计算20步前的所有变化。2006年,计算已经深入到25-26步。计算速度从每秒300万步增加到1000万步。现代“斯托克鱼”每秒计算8800万步左右。

我2006年的比赛是人类与机器的最后一场大型官方比赛。下了六局,我几乎设法把比赛打成平局,但在比赛过程中,我感觉这项任务几乎是不可能完成的。我因为一个非常严重的漏招输掉了一个和棋局面,但在其他方面我下得非常好,发挥了我最好的水平,仍然以2-4输了。后来出现了更强大的程序,到2010年,国际象棋历史上的这一章就彻底结束了。

2017年,Deep Mind公司提出了一种全新的国际象棋程序概念,基于机器学习。从某种意义上说,他们的工作成为人工智能概念的第一个证明。这个想法本身是在50年前提出的,但验证它的可能性直到最近才出现。机器学习的最初有趣的结果在2010年之后开始出现,但Deep Mind的国际象棋程序可能是最明显的证明。在其他一些领域,结果是可以讨论的——计算机可能出错,没有明确的标准...在国际象棋中,一切都很简单:程序立即变得最强,令人信服地击败所有人——这意味着该概念是有效的。

“阿尔法零”名称中的零表示除了游戏的形式规则之外没有任何知识。将死——胜利,僵局——平局,棋子前进等等——但只有规则。程序甚至不知道皇后比棋子强。当然,需要非常有才华的程序员进行大量工作才能构建神经网络的架构,但本质很简单——程序自己与自己下棋并进行自我学习。

当我在伦敦的公司办公室时,他们向我展示了“阿尔法零”是如何发展的。他们移除了“阿尔法零”学习到的所有内容,然后从头开始启动了这个过程。比赛在大型显示器上快速闪现。起初,它们看起来就像一个只被告知规则的孩子在下棋。没有任何理解,它在一招内将死,交出皇后和所有棋子等等。看起来很好笑。

我们出去喝了咖啡,一个小时后回来了。“阿尔法零”已经达到了一个强大的业余爱好者的水平。它没有漏招,没有放错棋子。它犯了很多位置错误,有时在战术上犯了错误,但总的来说,水平明显提高了。

到了晚上,它已经达到了一个强大的大师的水平,而当我第二天早上来的时候——这已经是宇宙了。不可能与它对抗。评级为3400左右——难以想象。而比赛本身,比赛风格——这才是上帝的水平。比任何其他程序都强大得多。从零到宇宙水平,它花了12或20个小时——而且完全是通过自学实现的,而这一点还没有人做到。

德米斯·哈萨比斯,DeepMind

Deep Mind是从事人工智能工作的领先公司之一,它属于谷歌。在围棋和国际象棋上磨练的概念将被用于其他领域——例如,医学。然而,他们尚未完全停止国际象棋项目。他们现在感兴趣的是他们是否可以继续提高。任务是找到天花板,一个无法再提高的水平。它非常接近,“阿尔法零”几乎从不输。

2017年,它与“斯托克鱼”进行了一场由一百场比赛组成的比赛,结果赢了,我不记得确切的数字,大约是65-35。

– 我认为,是72-28。

– 是的,没错。无论如何,这是一场一边倒的比赛,一场惨败。而“阿尔法零”的当前版本当然变得更强大了。现在,它是国际象棋程序发展的巅峰——但它不向公众开放。

– 当我观看“阿尔法零”的比赛时,它们似乎完全可以理解,因为它们有逻辑性和美学。它的行动更容易用人话解释。当你观看“斯托克鱼”的比赛时,你没有这种感觉。你同意吗?

– 是的,确实如此。当我观看“斯托克鱼”、“斯托克鱼”和其他比人类更强大的程序比赛时,我总是有一种奇怪的感觉。它们都非常喜欢拿取棋子并出色地进行防守。在分析中,我有时会发现与牺牲和获得长期补偿相关的有趣想法,但无法证明它们对引擎的有效性——它们总是对局面进行评估。在某个时刻,每个人都开始认为,也许我们对国际象棋的理解是有缺陷的,我们从根本上误解了动态。然而,“阿尔法零”的比赛成了一个非常惊喜。它下得非常人性化,乐于为主动权而牺牲,冒险,攻击。这正是它与上一代最强大的引擎的区别所在。“阿尔法零”对局面的评估更接近于人类。对我来说,这证实了几百年来国际象棋发展道路是正确的。当然,如果出现一种以不同风格比赛的更强大的程序,这种感觉可能会消失。尽管想象起来很困难。

你甚至可以说,“阿尔法零”有直觉。有一次,我们做了一个实验——关闭了程序计算变化的能力。我向你保证,大多数程序在没有计算的情况下会下得非常糟糕。“阿尔法零”有时也会出现简单的两步打击,但它提出的走法看起来完全合理——我也会考虑它们。即使关闭了计算能力,它也下得有逻辑性、有条理,把棋子放在正确的方格里,执行正确的计划。显然,“阿尔法零”对国际象棋的理解已经达到了概念层面。这非常有趣。真想知道它到底明白了什么!不幸的是,对于人工智能来说,这是一个问题——我们只得到结论,但不知道它们是如何得出的。如果我们有一天能够破译人工智能得出结论的路径,这将是朝着未来迈出的巨大一步。

待续