Quantcast
Channel: 電腦王
Viewing all articles
Browse latest Browse all 5900

「賭神的武器」!一個螢幕打網路撲克,一個螢幕看AI給的下注建議

$
0
0
對於德州撲克的職業選手來說,能成為賭神應該是自己的夢想了吧?但是怎麼才能成為賭神呢?對這個問題感興趣並且找到解決方案的,卻是數學家與程式設計師。E0ab87f88299c416cf27604f5b8a285c

美妙感覺

去年 11 月,拉斯維加斯的里約(Rio)賭場,在巨大的亞馬遜房(Amazon Room)裡有二十幾個男人,他們主要穿著運動衫戴著棒球帽,一起圍坐在三張破舊的撲克桌旁玩德州撲克。偶爾會有幾個路人駐足下來觀看比賽,但除此以外,就剩下玩家們默不作聲地反覆翻弄手中的籌碼。除了在牌局中保持著緊繃的、電擊般的靜止外,既沒有任何外在跡象表明這幫人是全世界最偉大的撲克玩家,他們也沒有像玩牌的老話所說的那樣,是「為了房子而玩」,或者至少是為了高額房子的頭期款而玩。這是為期三天的錦標賽的第一天,其官方名稱是世界撲克超級豪客系列賽(World Series of Poker Super High Roller),不過參賽者在每人交了 250,000 美元後,就乾脆把它叫做 「250K」了。 

在一張牌桌上,職業玩家 Seth Davies 偷偷地掀開手上紙牌的一角,開始思索著自己剛剛拿到的這手牌:方塊六跟方塊七。經過幾個小時的比賽之後,Davies 已經設法將自己的籌碼從 150 萬增加到 200 萬以上,並且把其中一部分推出來作為加注。曾經是大學棒球運動員的 Davies 現年 33 歲,留著修剪整齊的淺棕色鬍鬚的他身子直挺挺地坐著,一邊密切地關注著別人的叫注。在 Dan Smith 之前已經有 2 人跟注,這位圓臉、長著小鬍子、戴著一頂古怪的牛仔帽的職業選手選擇了加注,而且是大額的加注。這次只有 Davies 跟了。 

莊家開出了一張 K,一張四和一張五,都是梅花,給了 Davies 一手順子聽牌。Smith 選擇pass不下注。Davies 下注。Smith 跟注。轉牌是方塊二,Davies 的順子沒成。Smith 再次選擇pass。Davies 還是下注。Smith 再次跟注。最後一張牌是梅花二,這是 Davies 提高自己這手牌實力的最後希望。截止到目前,在那褪色的綠色毛氈覆蓋的桌子中央,底池已經增加到超過一百萬的籌碼。最後一個二使得牌面出現了四張梅花,這意味著如果 Smith 手上只有一張梅花,他就能得到同花。 

一直在下注的 Davies 需要一張八或者一張三才能將自己的這手牌變成順子,但現在,這兩樣牌他都沒拿到。Smith 第三次選擇pass,Davies 思考了將近一分鐘,然後宣佈自己all in,把剩下的 170 萬籌碼都推了出去。如果 Smith 跟注的話,Davies 將會被淘汰出局,他的那 25 萬美元的報名費,則會在一次不合時宜的虛張聲勢中化為烏有。 

Smith 從牛仔帽的簷下打量著 Davies,因為對 Davies,或者,也許是對運氣本身的惱羞成怒,面孔已經扭曲到變形。最後,Smith 的表情定在了怒眉睜目,無奈棄牌,莊家把五顏六色的一堆籌碼推向 Davies 的方向。按照 Davies 的說法,打完這手牌時,他的感受與其說是勝利了,不如說是解脫了。 

他後來說:「玩的這個底池其實價值是 50 萬美元。壓力實在是太大了。」 

最終的確認其實要等到那天的淩晨 2:30 左右,在第一天比賽結束之後,Davies 從里約賭場酒店驅車,用了 15 分鐘的時間回到自己位於拉斯維加斯郊外的家中。在他家車庫附近的一間辦公室裡,他打開了一個電腦程式,這款名為 PioSOLVER 的程式是少數人工智慧型撲克輔助工具之一,在過去幾年的時間裡,這些工具也已經從根本上改變了玩撲克遊戲的方式,尤其是頂級撲克的遊戲方式。Davies 將這手牌的所有細節輸入進去,然後開始讓程式跑起來。這個求解程式一下子就產生出一個最優策略。程式給出結論說,Davies 大多數情況下都做對了。在轉牌圈發了方塊二時,他的下注應該是底池的 80% 而不是 50%,但河牌圈詐唬的 170 萬籌碼是正確的玩法。 

Davies 說:「那種感覺真妙。甚至比贏下一個大底池還要妙。真正令人滿足的地方是當你贏下像這樣一場比賽的時候。」 在確信自己這手牌下出了近乎完美的水準之後,Davies 那晚睡得很安穩。 

完美撲克

對完美撲克的追求至少可以追溯到 1944 年。那一年數學家約翰‧馮紐曼以及經濟學家奧斯卡·莫根施特恩(Oskar Morgenstern)發表了《博弈論與經濟行為》。這兩個人想要糾正一個東西,他們認為,在經濟學領域根本上存在著不精確性。他們寫道: 「我們希望能找到具備數學嚴謹性的原則,去為社會經濟參與者定義『理性行為』,並從中推導出該行為的一般特徵。」他們認為,經濟生活應該被視為一系列的最大化問題,在這些問題中,個體參與者會競相從每日的辛勞中獲取盡可能多的效用。如果馮諾依曼和莫根施特恩能夠對做出正確決策的方式進行量化的話,那麼他們就能夠在堅實的基礎上建立起一門經濟學科學。 

正是這種要為經濟決策建模的渴望,導致了他們要玩玩遊戲。馮紐曼拒絕了大多數不適合這項任務的遊戲,尤其是像跳棋或西洋棋這樣的遊戲。這種遊戲玩家雙方都可以看到棋盤上的所有棋子,並共用相同的資訊。他向同為數學家的雅各布·布羅諾斯基(Jacob Bronowski)解釋道:「現實生活不是這樣的。現實生活會有虛張聲勢、還會有欺騙的小花招、會自問別人會認為自己打算做什麼。這才是我的理論裡面想要的遊戲。」馮紐曼認為,現實生活就像打撲克。 

馮紐曼使用的撲克遊戲是簡化版。在這種遊戲裡面,會給其中的兩名玩家隨機「發放」對方看不見的數位,然後要求雙方按照預定大小下注,賭誰的數位更大。馮諾依曼推導出了最佳策略的基礎。玩家既應該在拿到最好的牌的時候下重注,也應該在拿到最糟糕的牌的時候,按照一定的次數比例下重注,作為詐唬。(這個比例的變化取決於下注的大小相對于底池的大小。)馮紐曼證明,通過以數學上精確的頻率去詐唬和跟注,從長遠來看,玩家的表現不會低於收支平衡,而且就算他們把自己的策略一五一十告訴對手也不會虧。更好的是,如果他們的對手不採用馮紐曼描述的完美策略,那麼只要樣本足夠大,這些對手採取其他任何策略肯定都會輸。 

「博弈論」指明了通往未來之路。在這個未來裡,各種競爭性的互動都可以用數學的方式建模:比方說拍賣、潛艇戰,甚至是物種將基因傳遞給後代的競爭方式都可用這種方式建模。但在策略方面,撲克本身在回應馮紐曼的證明方面幾乎沒有進步,直到 50 多年後,亞伯達大學(University of Alberta)電腦科學系的人才接過了這項任務。該系遊戲研究的早期明星是一位叫做 Jonathan Schaeffer 的教授,經過 18 年的攻關,他終於發現了跳棋的解決方案。亞伯達大學的師生在圍棋、黑白棋、《星際爭霸》以及加拿大人的消遣運動冰壺等多種遊戲方面也取得了重大進展。不過,撲克仍然屬於特別棘手的問題,這正是馮紐曼當初被它吸引的原因:這種遊戲裡面的隱藏資訊阻礙了好決策的制定。 

像西洋棋或雙陸棋這樣的遊戲,在棋盤上雙方玩家的動作都清晰可辨,但撲克不同,儘管電腦永遠都沒法確定對方拿的是什麼牌,但仍必須解讀對手的下注。 Neil Burch 是一名電腦科學家,在加入人工智慧公司 DeepMind 之前,他曾在亞伯達大學以研究生和研究員的身份研究了 20 年撲克,但他認為自己的團隊早期的嘗試非常不成功。他說:「我們發現,如果你找個見過世面的撲克玩家來跟電腦比賽」,程式就會「被碾壓,徹底被擊敗」。 

從某種程度來說,這只是建模難度的函數而已。所謂的建模,是指對玩撲克時牽涉到的所有決定進行建模。博弈論學者使用分枝樹狀圖來表示遊戲不同的玩法。如果是像剪刀石頭布這種簡單的遊戲,這張分枝樹狀圖就很小:就三個分支,分別表示出石頭、剪刀以及布,然後每個分支的又可以引出三個分支,分別對應對手可以出的石頭、剪刀以及布。遊戲越複雜,這棵樹就越龐大。即便是簡化版的德州撲克,玩「單挑」(即只有兩個玩家玩)而且賭注固定在預定大小,一棵完整的遊戲樹也會包含有 316,000,000,000,000,000 個分支。如果是玩下注金額不限的無限德州(no-limit hold ’em)的話,樹的規模甚至更加龐大。Burch 說: 「確實會變得非常龐大,大到什麼程度?比宇宙中的原子數量還要多。」 

一開始,亞伯達大學研究小組的做法是嘗試把遊戲規模縮小到更易於管理的範圍——簡單粗暴地將多多少少有點相似的牌歸到一起,比方說,把一對九跟一對十看作是相同的。但是,隨著人工智慧這個領域發展得更加強大,並且隨著團隊的演算法能更好地適應了撲克的複雜性,它的程式也開始得到改進。這一發展的關鍵是一種叫做虛擬遺憾最小化(counterfactual regret minimization)的演算法。電腦科學家為機器設定任務,讓它們辨識出撲克的最佳策略,方法是讓程式跟自己對戰數十億次,並記錄遊戲樹裡面哪些決策的利潤最低(那些就屬於「遺憾」,人工智慧就能透過做出其他更好的選擇,進而學會在未來的反覆運算中將遺憾最小化)。 2015 年,Alberta 團隊在《科學》雜誌上發表了一篇文章,標題叫做 「雙人限注德州撲克已被攻克」(Heads-Up Limit Hold'em Poker Is Solved),宣佈 AI 取得成功。 

對於某些玩家,尤其是那些靠玩線上撲克為生的玩家來說,亞伯達大學研究小組的勝利對他們的生計構成了嚴重威脅。曾經是職業玩家的 Terrence Chan 說: 「我記得當我們讀到這篇文章時,大家的感覺就好像,『噢,這下子比賽精彩了,這一次一定會很有趣。』」 

情況很快就很清楚了,對電腦能發現最佳策略的能力感興趣的不僅僅是學者。亞伯達大學團隊的一位前成員,因為跟目前雇用他的軟體公司簽有保密協定,所以要求本文不要透露他的姓名,但他告訴我,自己已經拿到了數十萬美元的報酬,條件是幫助撲克玩家開發能夠辨識完美玩法的軟體,以及為開發能夠在線上遊戲中擊敗人類的機器人的程式設計師提供諮詢。付不起那麼多錢的玩家不需要等待很長的時間就可以獲得更實惠的,由 AI 提供的策略。

《科學》雜誌發表攻克雙人限注德州撲克文章的同一年,一位叫做 Piotrek 的波蘭電腦程式設計師與前線上撲克玩家 Lopusiewicz 一起,開始售賣他的應用 PioSOLVER 的第一個版本。只需 249 美元,玩家就可以下載一個近似於更複雜的無限制版德州撲克遊戲的解決方案。到了 2015 年,任何擁有足夠強大的個人電腦的人,都可以用得起馮紐曼數學證明的實際實現了。

「賭神的武器」!一個螢幕打網路撲克,一個螢幕看AI給的下注建議

AI 工具

Jason Koon 是 Seth Davies 的朋友,也是他玩撲克的導師,此人還是所謂的「博弈論最優」撲克最早和最忠實的採用者人之一。在為期三天的超級豪客錦標賽的第二天,我拜訪了 Koon 價值數百萬美元的豪宅。房子位於一個封閉社區內,而這個社區則位於一個更大的封閉社區內,毗鄰傑克‧尼克勞斯(Jack Nicklaus)設計的高爾夫球場。錦標賽的第 1 天,Koon 付了 250000 美元入場,四個小時後,他被淘汰了,但馬上又支付了 250000 美元再度入局,結果他再次輸掉了所有籌碼。他後來發簡訊給我:「歡迎來到孤注一擲的錦標賽世界。只需要發揮出你的最好水準——最終還是可以扯平的。」 

對 Koon 來說,扯平的形式是贏得的線下錦標賽獎金的總額超過了 3000 萬美元(他說,至少跟來自拉斯維加斯與澳門的高額現金遊戲一樣多)。 Koon 開始認真玩牌的時間是 2006 年,當時身為田徑隊短跑運動員的他正在西維吉尼亞衛斯理學院(West Virginia Wesleyan College)康復。玩牌讓他過上了不錯的生活,但很難在賭注最高的比賽中一直取勝。他說:「在 slover(特定問題求解器,此處特指德州撲克)出現之前,其實我是個相當平庸的玩家,但第二個 solver 出來後,我一頭撲進了這個玩意兒,然後我的水準開始提高,提高得很快,很快很快。」 

在放滿了贏得的各種撲克錦標賽獎盃的家庭辦公室裡,Koon 轉向他的電腦,在 PioSOLVER 上抽出來一手牌。在指定了玩家的籌碼大小以及所坐位置可玩的手牌範圍之後,他輸入了所有玩家都能看到的三張隨機的翻牌。一個 13×13 的網格上顯示了其中一名玩家可能拿到的所有手牌。 Koon 把滑鼠懸停在方格上,尋找不同花色的 A 與 Q。slover 告訴 Koon 這次 39% 的時間都應該pass;在 51% 的情況下,下注的額度應該相當於底池大小的 30%;其餘時間下注的額度應該是底池的 70%。這種馮‧諾伊曼式的混合策略技能讓他的利潤最大化,也能掩飾他的牌力。 

多虧了 PioSOLVER 之類的工具,Koon 重新制定了遊戲玩法,瞭解在不同情況下怎麼下注才最有效。有時下點小注,比方說底池的五分之一甚至十分之一才比較理想;而在其他一些時候,下到底池的兩到三倍大小這種重注才是正確的。而且,雖然優秀的撲克玩家一直都知道打牌需要虛實結合,但 slover 卻為 Koon 提供了採用虛實結合更精確的頻率,並且根據他手上拿著什麼牌,它能確定出什麼是採取詐唬策略最好和最差的一手牌。 

Erik Seidel 是這項運動的職業選手,他從 1980 年代就開始學習撲克了,他告訴我,如果像 Koon 這樣的玩家用今天的知識回到 15 年前的話,可以碾壓那個時代最優秀的玩家。Seidel 說:「我還認為,玩牌的所有人都會認為他們是大魚,」這是用撲克的暗語來形容水準很差的玩家,「現在這幫傢伙弄出了很多非常奇怪但確實很有效的玩法,但是如果那時候玩牌的人看見他們的話,我想肯定天天晚上都會邀請他們這樣的人去參加比賽的。」(編者注:容易上鉤的大魚) 

在遇到比較弱的玩家時,Koon 有時候會故意不按理論上的完美撲克出牌,而是變本加厲地詐唬,或者當 AI 建議下注應該小點時下重注,好利用對手的錯誤。但在與最優秀的專業人士比賽時,他大多只會盡最大努力複製 slover 的決策——前提是記住人工智慧首選的下注規模以及採用不同策略的頻率。因為他知道,他自己的人類偏見會不知不覺地影響自己的決策,所以對於特定的一手牌,Koon 經常會隨機選擇 solver 的策略。他會低頭瞥一眼手錶上的秒針,或者看一看眼前的撲克籌碼,把賭場標誌的方向看成是鐘面,好讓他估算出從 1 到 100 之間的百分比。百分比越高,他採取的行動越激進。 「我會說:好吧,現在是 9 點鐘的方向。所以應該是 75%。那就是相當激進的數字了。」在這種情況下,Koon 可能會為自己這手牌選擇 solver 認可的下注的最大規模,而如果秒針指向 3 點鐘方向,也就是 25% 的話,他可能就會選擇pass。 

當然,採用最優策略並不能保證 Koon 不管拿什麼樣的牌都能贏。不過,根據數學的理論,如果玩的次數足夠多的話,最終的結果應該不會虧——而且實際上他會做得比不虧要好得多,這要取決於他對手的策略與理論上的完美玩法相差多遠。 Koon 說,如果你跟 slover 玩成千上萬手牌的話,「我敢保證,最終贏的一定是它。」 

不過 Koon 很快就接著指出,就算有了 solver 的完美策略,撲克要想玩好仍然非常困難。底池很大的情況下輸贏帶來的情緒波動,以及 12 小時的車輪戰所帶來的疲勞,這些挑戰仍然一如既往,但現在,頂級玩家必須在牌桌以外投入大量工作才能取得成功。就像大多數的頂級職業選手一樣,Koon 每週都會把大部分的時間都花在研究可能出現的不同情況上,試圖理解這個程式選擇背後的邏輯。他說:「solver 沒法告訴你為什麼自己要做所做的事情——它就是這麼做了。所以現在得由撲克玩家來找出原因。」 

最優秀的玩家能夠對 AI 的策略進行逆向工程,並建立適用於跟他們正在研究的手牌與情況相似的啟發法。即便如此,他們要處理的訊息量依然很大。當我把自己的想法告訴 Koon,說這就像翻來覆去地看一本 10000 頁的書,好盡可能多地記住它時,他馬上就糾正了我:「是100000 頁的書。這種遊戲太難了。」 

事實上,Koon 要利用的資料規模甚至比這還要大。他租用了近 200 TB 的雲端儲存空間來儲存資料,也就是那些自開始跟 solver 合作以來他開發出來的遊戲樹資料。雖然跟人面對面玩牌的時候沒法獲取牌桌上的所有資訊,但這種限制未必適用於線上玩的撲克。自動化的機器人,尤其是在賭注較低的撲克遊戲中的自動機器人,在 solver 興起之前就一直是網路撲克的一個問題,但現在線上上玩牌的人可以用另一個螢幕去尋找 AI 策略來規避規則,去下出最優策略。 Koon 說:「任何時候,只要有賭注夠高,可以贏很多錢,而且有可能可以用來行善的設備的話,人們就有辦法把它變成作弊工具。」 

Koon 倒不是特別擔心自己在網路上跟人比賽撲克的時候對方作弊,但其他的玩家就不那麼確定了。職業牌手 Ryan Laplante 表示: 「這就是我再也不參加網路比賽的主要原因,我是說真正的撲克比賽。」最近,作為世界撲克系列賽的一部分,在一場入場費為 7000 美元的網路錦標賽裡, Laplante 說,在 100 位左右的參賽者當中,他就至少認出了 4 個名字屬於傳聞被其他網站禁賽的玩家,因為他們使用了所謂的「即時助手」。Laplante 認為最大型的線上網站裡面,有一些在比賽監管方面做得還是很好的,但他擔心隨著 solver 變得越來越普遍,權力的天平將繼續轉向那些靠作弊獲得優勢的人。 

Laplante 說:「我唯一肯定的只有一件事,那就是情況很快會變得更糟。」

「賭神的武器」!一個螢幕打網路撲克,一個螢幕看AI給的下注建議

運氣為王

超級豪客賽的第二天,剛過午夜,德國的職業選手 Christoph Vogelsang 把手上的籌碼全部押出去跟注了,他手上拿了一張 K 和一張 9 ,另一位玩家手上拿的是 A 和 J。事實上,按照 solver 的說法,跟注是正確的玩法——但儘管如此, Vogelsang 還是輸掉了這手牌,以第六名的成績被淘汰出局。如果是一般的撲克比賽,玩家隨時可以離開牌桌,兌現自己的籌碼,但撲克錦標賽不同,這種比賽要求玩家得不斷比下去,直到輸掉所有籌碼或贏得所有籌碼。獎金就從參賽選手交的入場費裡面出,大小要看玩家待在遊戲裡的時間有多久。以拿到所有籌碼告終的人將拿到第一名獎金(本次錦標賽的為 320 萬美元),堅持到倒數第二的倖存者獲得第二名(200 萬美元),依此類推,直到最後一名進入錢圈的人(in-the-money finisher),這次的是排名第五的人(可拿到 63 萬美元)。Vogelsang,以及所有在他之前被淘汰的選手,一分錢都沒拿到。 

鑒於玩家在三天內才能看到幾百手的牌,樣本量很小,如果光憑一次撲克錦標賽就想找出這個領域的最強玩家的話,那一定是很不準確的。就算是最優秀的玩家,也得靠運氣來決定大部分的結果——如果把參加錦標賽的 26 名人類玩家通通用 26 個經過完美程式設計的撲克機器人來取代的話,也會有機器人被第一個淘汰,最後勝出的也只有一個機器人,儘管它們都採用了相同的最優策略。 

撲克玩家往往會放眼長遠,把錦標賽的買入看作是投資,隨著時間的推移,自己能拿到的平均回報多多少少會是可預測的。職業玩家 Ike Haxton 說:「如果比賽相對艱難,場上玩得最差的玩家損失的買入費可能會高達 30% 或 40%。」他說,實力強一點的業餘選手的平均損失預計應該會達到所投入的資金的 15%,而從長遠來看,最好的職業選手將可拿到投入約 5% 到 10% 的回報。 

為了抑制短期內出現的巨大財富波動,很多職業選手都同意在錦標賽開始前就相互交換的獎金百分比達成一致——比如說,我同意把我贏得的獎金的 5% 給你,如果你同意把你贏的錢的 5% 給我的話——或者把他們未來贏得的賭注賣給外部的贊助者,就像過去捕鯨船出去捕鯨的風險收益一樣。 Seth Davies 不願透露自己相關部署的具體細節,但他承認,這次比賽他交的入場費裡面來自他本人的錢不到一半。即便如此,在第一天被淘汰後,他又交了 250000 美元再度入場,所以他自己出的錢已經「達到了大六位數」。 

超級豪客賽進入第三天,也就是最後一天時,剩下的五名玩家從亞馬遜房比較破舊的週邊賭桌轉移到了有電視轉播的內場。上方耀眼的舞檯燈讓牌桌的綠色毛氈也泛起了點點微光, 為了拿得到最佳的拍攝角度,45 英尺的攝像機吊臂不時地左右擺動。一路走到這一步的所有五名玩家這一次賺錢是沒問題的了,但究竟能賺多少錢要取決於在派彩階梯上他們還能爬多高。隨著比賽的開始,籌碼最多的人,27 歲的西班牙職業選手 Adrián Mateos,用一連串穩定的巨額賭注對其他玩家保持著高壓態勢,他一次又一次地詢問對手是不是想孤注一擲,或者要不寧願棄牌,等待另外一兩個玩家被淘汰掉,這樣就可以拿到第四名或第三名而不是第五名,進而多拿 30 萬美元或 70 萬美元的獎金。 

類似這樣的情況會以奇怪的方式扭曲玩家剩餘籌碼的價值,具體怎麼扭曲要取決於他們處在什麼位置。如果在你棄牌之後另一位玩家被淘汰出局,那麼就算你只剩下一個籌碼也可能價值連城。也有 solver 可以類比這些情況,但是隨著籌碼相對於盲注越來越小,而且要求玩家在每手牌開始前都要投入底池,光靠完美玩法已不足以真正保證你能獲勝了,遊戲往往基本上變成拋硬幣猜正反面。 Davies 說:「歸根結底,你最終要比的還是拋硬幣,價值百萬美元的拋硬幣遊戲,然後你希望自己能獲勝。」 

在一位競爭對手被淘汰後,大衛斯發現自己的籌碼最小。在他身後只剩下一個人的情況下,他決定拿手上的梅花 A 與7 賭一把,籌碼全押,正如 solver 的建議那樣,考慮到他手上的籌碼量,他應該這麼做。剩下的玩家,留一頭馬尾辮的英國人 Ben Heath,很快跟注,並翻出了一對 J ,讓他成為有 67% 的概率贏得這手牌的熱門人選。莊家擺出的五張牌都沒能改善 Davies 的贏面,所以 Heath 贏下了底池,Davies 被淘汰,拿到第四名。他從賭桌旁站了起來,收拾好背包,戴上 N95 口罩,離開了賽場。他告訴我說:「那算是一場豪賭了。」但當 Davies 知道自己過去三天的比賽玩法跟家裡電腦產生的最優策略是如何的接近時,至少這一點他是滿意的。(另一個安慰是他拿到了第四名的獎金 930791 美元。) 

把兌現券放在口袋裡之後,Davies 又走到附近一場已經開始的錦標賽,花了50000 美元入場。他本來打算在買入之前先吃點晚飯休息一下,但在看到來這裡比賽的都是什麼人(很多人看起來很有可能不會採取最優策略比賽)之後,他改變了主意。Davies 說:「這 5 萬塊錢看起來不可思議。我完全沒法接受自己不入場試試。」 

AI 的介入讓撲克比賽的格局發生了改變。對於這種改變,跟我交談過的玩家不是個個都感到高興。一方面,儘管對於當今大多數賭注較小的比賽來說,所採用的策略看起來跟 slover 出現之前採用的策略非常相似,但賭注較高的競爭已經變得更加激烈。隨著最優策略被更多的人瞭解,頂級玩家曾經相對於相當優秀玩家在技術上的優勢已經大大縮小。但在 Doug Polk(在贏了數千萬美元後,他已經在 2017 年已經基本上退出了撲克這個行當)看來,slover 所做出的改變事關撲克存亡。Polk 說: 「我覺得這在一定程度上扼殺了這種遊戲的靈魂,」把玩牌的人「從最有創造力的問題解決者,變成了能夠記住最多東西並能應用起來的人。」

PioSOLVER 背後的開發者 Piotrek Lopusiewicz 反駁說,新一代的人工智慧工具只是撲克技術更漫長的創新模式的延續。在 solver 出現之前,像 Polk 這樣的頂級網路玩家就使用了軟體來收集有關對手歷史比賽的資料,並分析對方的潛在弱點。Lopusiewicz 說:「所以現在的情況是有人在一場軍備競賽裡面帶來了火力更強的武器,突然之間,那幫賺不了錢的傢伙的態度就變成:『呃,好吧,但我們其實不想要那種軍備競賽。我們只想要我們的工具,而不是更好的工具。』」 

此外,在 Lopusiewicz 看來,slover 其實並沒有改變了撲克,而是揭示了它的本質。不管撲克玩家自己有沒有意識到,或者想不想知道,這種遊戲的核心始終都是約翰‧馮紐曼所揭示的最大化問題。Lopusiewicz 說:「時至今日,但凡到了一定水準的人都得尊重撲克的數學那一面,他們再也不能視而不見了。」

加入電腦王Facebook粉絲團

Viewing all articles
Browse latest Browse all 5900

Trending Articles