GTO 与扑克:关于扑克世界发展和未来之路的思考

作者:赖安2025年07月14日
GTO 与扑克:关于扑克世界发展和未来之路的思考

这篇文章最初发表在 2+2 论坛 (https://forumserver.twoplustwo.com/29/news-views-gossip/opinion-decade-long-gto-mania-has-done-more-harm-than-good-poker-world-1761753/#post55796322)

我是一名电子工程师(博士),专攻数据分析和计算机模拟,并且一生都喜欢玩桌面游戏和纸牌游戏。自 80 年代末以来,我一直密切关注博弈论和计算机程序的发展。 GTO 是一个好模型。然而,我非常清楚它的所有缺点。一个好模型可能遇到的最糟糕的事情是,人们会将其视为最终的真理,而忽视其适用性的局限性。不幸的是,这正是扑克中 GTO 发生的事情。

这篇文章不是关于 GTO 的,而是关于扑克世界如何因为这个模型而误入歧途,以及 GTO 周围的炒作如何阻碍扑克的发展。我试图让所有读者都能理解它,包括那些不擅长数学的人。

让我们从导致 GTO 爆炸式传播的神话开始。

玩 GTO,不可能输

事实上,你可能会输。根据定义,纳什均衡适用于非合作博弈。显然,扑克不属于这一类——更确切地说,可能属于,但并非总是如此。有时,桌上会有骗子互相帮助。有时,对手会感到你无法解释的仇恨,并开始尽一切可能让你的生活变得复杂,从而使桌上的所有玩家受益,除了你。此外,关于无损性的梦想被那些 GTO 游戏不符的玩家所破坏,由于座位安排的特殊性,这会将你的理想策略变成负面的。因此,在扑克中,对于三个或更多玩家,即使在理论上也不存在有保证的无损策略。

通过 GTO 游戏,无损性将仅限于一对一,且不收取抽成。你上次处于这种情况下是什么时候?大概是在你小时候,和你的兄弟玩火柴头比赛。但是,为了获胜,你可能不需要求解器。

了解 GTO,我们将能够适应偏离该模型的对手

实际上,我们不知道真正的 GTO 解决方案是什么样的。我们只有在很大程度上简化的指令。既然我们不知道真相,我们怎么知道谁以及如何偏离它呢?

GTO 到底是什么?如果我们在搜索引擎中搜索这个术语,我们会得到许多不同的口头解释,但没有任何精确的数学公式。有些人说这是纳什均衡的同义词,对其他人来说,这是零和博弈的纳什均衡,对第三个人来说,这是扑克的纳什均衡,对第四个人来说,这是德州扑克的纳什均衡,等等。通常,GTO 只是通过其几乎神秘的力量来解释的。

有趣的是,GTO 这个术语是如何征服扑克世界的?为什么我们不谈论由奠定博弈论基础的最杰出人物之一创造的纳什均衡?显然,这一切都与“最优”这个神奇的词有关。对于大多数人来说,它等同于“最好”或“最有利可图”这个词。但在数学中并非如此。

如果使用 GTO 一词来吸引扑克玩家学习博弈论,那就没那么糟糕了。随着时间的推移,这将帮助他们摆脱对 GTO 的错误解释。哎,这并没有发生。 GTO 模型已成为扑克时尚的唯一和绝对的立法者。这对于整个行业来说并不是很好。

GTO 妨碍扑克的发展

如果这仅仅涉及到对游戏模型的错误解释,我会保持沉默。我担心这种时尚对扑克未来的影响。

玩 GTO 的求解器的力量被过度夸大了。你到处都能听到关于求解器和教授 GTO 风格的教练。似乎,如果你不使用这样的软件,并且没有从专家那里获得课程,你就会过时,没有人会听你说话。而且,无论这些求解器和教练都无法给你足够准确的画面,这并不重要。他们只是接近 GTO。水星是离太阳最近的行星,但它不是太阳!求解器可以用于某些简化的情况。在这些情况之外,也就是几乎总是,它们很快就会变得无用。

这并不是程序员的错。求解器对资源的要求非常高,并且算法必须削减许多角度才能产生任何结果。

GTO 不是扑克的未来

毫无疑问,玩 GTO 的计算机很快就会击败人类,但这并不意味着在那之后,人们将不得不玩 GTO。

深蓝在 1997 年击败了世界顶尖的象棋选手,但 23 年后,人们仍然在玩“人类”象棋。谷歌开发的 AlphaGo 程序在 2016 年震撼了围棋爱好者,以 4-1 的比分击败了职业选手,然后在与世界顶尖玩家在线比赛时,赢得了 60 场比赛,没有输掉。一年前,人们认为开发人员还需要十年才能接近最强的人。然而,人们无法像计算机一样玩游戏,因此继续像人一样玩游戏。此外,即使是 AlphaGo 的开发人员也无法说出“像计算机一样玩”是什么意思,因为这是一个神经网络,实际上是一个“黑盒子”。

在国际象棋和围棋中,不可能学会像计算机一样玩,但出于某种原因,每个人都相信他们在扑克中会成功。但是国际象棋和围棋更容易:这些游戏中有一个明确的目标(胜利)、一个简单的搜索树和完全的信息访问。扑克难得多。因此,没有也不会有人玩 GTO——至少在有人在他们的脑海中植入处理器之前。

总的来说,不能说玩 GTO 是扑克的唯一和不可避免的发展方向。

通过求解器进行的培训会培养出平庸的玩家

由于求解器具有局限性,使用它们进行学习的人必须自己决定哪些结论可以信任,哪些不能信任。然而,他们中的大多数人对该理论的了解不足,无法做出正确的结论。当他们停止进步时,他们只怪自己不够努力。但他们对此没有任何过错——他们只是发现自己处于瓶颈状态,只有最有天赋的人才能通过,而其他人注定要保持平庸。

GTO 的统治扼杀了游戏的乐趣

那些通过求解器努力游戏的玩家的傲慢扼杀了游戏的乐趣。我见过多少次,评论员们,玩着 1 美元/2 美元,确信地批评了高额玩家的决定,因为他们没有听从求解器的建议。有趣的是,恰恰是高额玩家启动了这个对 GTO 的普遍痴迷的过程。当这些批评者出现在现金游戏桌上并开始讨论其他人的决定时,这令人难以置信地恼人。

关于 GTO 的谈话吓跑了业余爱好者

我一次又一次地听到玩家,甚至是经验丰富的玩家说:“可惜我一点数学能力都没有”。他们准备放弃,停止努力工作,离开扑克。我总是告诉他们:玩扑克不需要太多的数学。观察力、逻辑和心理稳定性比数学能力更重要。 GTO 的宣传让人们相信,没有数学能力的人注定会失败,尽管这完全是胡说八道,但多年来基于赞美具有严重有机缺陷的伪算法的洗脑正在发挥作用。

岳其竹在 2019 年 WSOP 比赛中与阿纳托利·兹林争夺手链


然而,我们不要妖魔化 GTO。这种时尚也有积极的方面。首先,GTO 揭示了平衡的概念,这可能是扑克中最重要的概念,在“超级系统”和扑克大师戴维·斯克兰斯基和迈克·卡罗的早期文章中就已经写过。不仅如此,柏拉图在 2400 年前就谈到了平衡。

其次,GTO 迫使玩家提高计算机素养。除了求解器,还有许多不同的应用程序可以用来改进你的游戏。

第三,在某些情况下,使用求解器进行游戏确实有效。首先,这是超级高额玩家的比赛——来自非常有天赋、强大且水平接近的玩家的比赛,他们会立即注意到对手的错误。他们之间的大部分牌局都是单挑的,而且筹码很短。考虑到这些条件和过高的买入费,超级高额玩家确实应该使用求解器。然而,即使在超级高额玩家的水平上,也不应高估求解器的作用。玩家们凭借天赋和坚持不懈的自我努力,进入了令人难以置信的限制。可悲的现实是,扑克仍然对自然天赋提出了特殊要求。而它的一个方面就是能够在求解器产生的丰富的空矿石中找到真理的碎片。当您自己使用该软件时,而不是通过中间人(讲师)时,该软件才有用。

我为什么要写这一切

我希望扑克界能更仔细地观察 GTO。十多年来,这个术语主要被用作营销工具,并且对扑克的发展产生了负面影响。现在是时候从 GTO 上摘下皇冠,承认它实际上是什么——一个有严重局限性的好模型。

如果你仍然像相信上帝一样相信 GTO,那么在建议新手之前,请三思而后行。我没有任何反对现代教学方法,而且我绝对不希望 GTO 这个术语从人类的记忆中抹去。然而,扑克是为你的大脑而不是软件设计的游戏。需要软件来训练大脑,而不是取代它。

让扑克仍然是人类的爱好。让我们让人们重新享受游戏的乐趣。

推特讨论