AI風(fēng)暴再次來襲。6日開始,卡內(nèi)基梅隆大學(xué)知名撲克機(jī)器人Libratus將化身“冷撲大師”,與中國“龍之隊(duì)”在海南展開為期5天、長達(dá)45小時(shí)的撲克人機(jī)大戰(zhàn)。主辦方在5日的賽前發(fā)布會(huì)上宣布,獲勝一方將獲得200萬元表演賽獎(jiǎng)勵(lì)。
“冷撲大師”是卡內(nèi)基梅隆大學(xué)開發(fā)的無限德州撲克人工智能系統(tǒng)。今年1月,它擊敗了人類頂尖玩家。在這次比賽中,每當(dāng)這些玩家發(fā)出一個(gè)動(dòng)作,它就會(huì)被傳送到卡內(nèi)基梅隆大學(xué)的計(jì)算機(jī)服務(wù)器上。
中國“龍之隊(duì)”華人頂尖牌手由2016年世界撲克大賽金手鏈冠軍得主杜悅領(lǐng)軍。杜悅估計(jì),雖然“冷撲大師”是目前撲克界最強(qiáng)的人工智能,但人類頂尖牌手仍有10%的勝率。
創(chuàng)新工場CEO暨人工智能工程院院長李開復(fù)之所以發(fā)起這場撲克人機(jī)對戰(zhàn),和他1988年在母校卡內(nèi)基梅隆大學(xué)開發(fā)“奧賽羅”的經(jīng)歷息息相關(guān),后者成為第一個(gè)擊敗黑白棋世界冠軍的人機(jī)對弈系統(tǒng)。
“德州撲克是創(chuàng)投圈人士愛玩的一項(xiàng)活動(dòng),AI更是創(chuàng)投圈近年來關(guān)注的重點(diǎn),這次活動(dòng)對AI的宣傳和推動(dòng)將起到重要作用。”賽事協(xié)辦方春光里運(yùn)營總監(jiān)董冬則告訴科技日報(bào)記者。“我當(dāng)然希望人類能贏,但‘冷撲大師’畢竟曾打敗過美國頂尖的德?lián)溥x手。”董冬說。
人工智能專家一直將這些游戲作為開發(fā)和測試的工具,在此之前,計(jì)算機(jī)已經(jīng)在國際象棋、西洋雙陸棋中擊敗了人類,去年的AlphaGo更是名聲大噪。“撲克則有些不同,因?yàn)槟悴恢滥愕膶κ帜玫氖鞘裁磁啤!弊鳛榈轮輷淇藧酆谜撸治觥?/p>
談到與圍棋比賽、AlphaGo的不同,李開復(fù)表示,德州撲克更接近人性,因?yàn)樾畔⑹怯须[藏的,牌手可以誠實(shí)或欺騙地表達(dá)。這些種種的推敲,更像是人與人之間的商業(yè)、外交博弈,“冷撲大師”的技術(shù)都與這些因素相關(guān)。
通過對手的動(dòng)作表情判斷對手牌的強(qiáng)弱,是德州撲克相當(dāng)重要的一種游戲技巧,而“冷撲大師”作為一個(gè)冷冰冰的人工智能系統(tǒng),如何應(yīng)對人類棋手復(fù)雜的心理戰(zhàn)呢?
對此,李開復(fù)表示,對于“冷撲大師”來說,心理戰(zhàn)其實(shí)是基于一個(gè)優(yōu)化結(jié)果最大化的一個(gè)計(jì)算,它計(jì)算該怎樣去做才能得到最多的積分牌。他說,撲克機(jī)器人的研發(fā)基于博弈論,并且結(jié)合了大量的數(shù)學(xué)和概率理論,撲克程序在賽前不曾研擬歷史牌譜,直接在比賽同時(shí)動(dòng)態(tài)優(yōu)化勝率最高的數(shù)學(xué)模型,利用戰(zhàn)略推理揭露玩家底牌的隱藏信息,從而建構(gòu)出智能化的AI談判策略套路。在技術(shù)研發(fā)的背后,其實(shí)電腦并不對人類玩家的心理戰(zhàn)術(shù)進(jìn)行任何模擬或分析,反倒以博弈論加上大量數(shù)學(xué)打敗了頂尖牌手。
卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)學(xué)院院長安得烈·穆爾教授則認(rèn)為,“冷撲大師”表面呈現(xiàn)的是撲克,背后實(shí)際是一個(gè)大型的談判算法。撲克AI并沒有用到神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)這兩種技術(shù),而是用了比較古典的線性規(guī)劃。
李開復(fù)認(rèn)為,現(xiàn)今這套人工智能撲克程序背后的模型,將適用于需要用到戰(zhàn)略推理和多方談判的場景。從企業(yè)談判、商務(wù)談判、外交談判、甚至到生活方面的房屋買賣談判,10年內(nèi)都將會(huì)部分或全面被人工智能所取代。
(責(zé)任編輯 :韓璐)
[an error occurred while processing this directive]