科技改變生活 · 科技引領(lǐng)未來(lái)
問(wèn)耕發(fā)自凹非寺量子位出品|公眾號(hào)QbitAI這是圍棋人機(jī)大戰(zhàn)中的又一個(gè)第一次。頂級(jí)職業(yè)圍棋手,在讓子棋中負(fù)于A(yíng)I。更明確一點(diǎn)說(shuō),騰訊圍棋AI絕藝,讓二子戰(zhàn)勝了當(dāng)今圍棋第一人柯潔。而且整個(gè)戰(zhàn)局只進(jìn)行了77手,可以說(shuō)柯潔落敗的相當(dāng)快。10天前,
問(wèn)耕 發(fā)自 凹非寺
量子位 出品 | 公眾號(hào) QbitAI
這是圍棋人機(jī)大戰(zhàn)中的又一個(gè)第一次。
頂級(jí)職業(yè)圍棋手,在讓子棋中負(fù)于A(yíng)I。
更明確一點(diǎn)說(shuō),騰訊圍棋AI絕藝,讓二子戰(zhàn)勝了當(dāng)今圍棋第一人柯潔。而且整個(gè)戰(zhàn)局只進(jìn)行了77手,可以說(shuō)柯潔落敗的相當(dāng)快。
10天前,絕藝開(kāi)始讓二子(黑貼6目半)對(duì)決職業(yè)棋手。與柯潔這樣的頂級(jí)高手對(duì)決前,已取得27勝4負(fù)的成績(jī)。
可能未來(lái)人機(jī)大戰(zhàn)的懸念會(huì)變成,到底讓幾子人類(lèi)才能穩(wěn)贏(yíng)。
這次戰(zhàn)勝柯潔的絕藝,參考了2017年10月公開(kāi)的AlphaGo Zero論文,并在實(shí)踐中做出了改進(jìn)。這個(gè)版本使用了40 block dual-resnet模型,以老版本的絕藝為基礎(chǔ)進(jìn)行強(qiáng)化學(xué)習(xí),自對(duì)弈了數(shù)百萬(wàn)棋局。
據(jù)介紹,騰訊在有限的資源和時(shí)間內(nèi),通過(guò)把強(qiáng)化學(xué)習(xí)和監(jiān)督學(xué)習(xí)相結(jié)合來(lái)加速訓(xùn)練,快速提升了棋力。
圍棋AI戰(zhàn)勝人類(lèi)已經(jīng)不是新鮮事了,但讓子棋情況有些不同。
量子位從騰訊AI Lab獲得了一份詳細(xì)的解答。
包括AlphaGo在內(nèi)的圍棋AI都存在贏(yíng)棋退讓的問(wèn)題,原因是AI以贏(yíng)棋為目標(biāo),勝率過(guò)高時(shí)下哪里都贏(yíng),不一定會(huì)選擇贏(yíng)最多的下法。
而讓子棋就是另外一種勝率過(guò)低的極端情況,以絕藝海南挑戰(zhàn)賽版本為例,這是一個(gè)分先版本的AI,如果要求其以讓2子開(kāi)始對(duì)局,則初始勝率為7%(讓3子則初始勝率1%,讓4子則初始勝率0.1%)。
并且實(shí)力越強(qiáng)的版本,下讓子棋時(shí)的初始勝率就越低(因?yàn)锳I下棋時(shí)會(huì)假設(shè)對(duì)手跟自己一樣)。
初始勝率過(guò)低將導(dǎo)致AI不能發(fā)揮出真正的實(shí)力,這也是現(xiàn)在絕藝讓2子還不能全勝的原因。我們最近在嘗試優(yōu)化算法,來(lái)解決勝率過(guò)低帶來(lái)的負(fù)面影響,爭(zhēng)取以后在讓子棋里有更好的表現(xiàn)。
從上面的講述可以看出,讓子棋并不簡(jiǎn)單。
馬化騰曾經(jīng)公開(kāi)說(shuō)過(guò),絕藝代表著騰訊AI工程化的能力。不過(guò)這個(gè)方向,連DeepMind未來(lái)也不會(huì)再投入核心精力研發(fā)了,騰訊還會(huì)繼續(xù)么?
騰訊AI Lab回復(fù)量子位說(shuō):還會(huì)。原因有幾方面,例如:這項(xiàng)研究體現(xiàn)出了價(jià)值、在騰訊業(yè)務(wù)中有應(yīng)用場(chǎng)景、還有一定的社會(huì)責(zé)任意義。
至于未來(lái)絕藝會(huì)不會(huì)推出圍棋教學(xué)工具,目前還很難回答。不過(guò)騰訊絕藝已經(jīng)在職業(yè)訓(xùn)練中得到應(yīng)用,甚至還是國(guó)家棋院的AI陪練。
回到絕藝與柯潔的讓子棋。其實(shí)當(dāng)天,AI不僅讓子戰(zhàn)勝了柯潔,還戰(zhàn)勝了連笑九段。這次對(duì)弈的情況,野狐圍棋做了更翔實(shí)的記錄。
下文摘自野狐圍棋(微信號(hào):txyhweiqi),量子位已經(jīng)獲得授權(quán)。
1月17日這一天,對(duì)柯潔來(lái)說(shuō)并不愉快。白天的棋圣戰(zhàn)八強(qiáng),柯潔執(zhí)黑中盤(pán)不敵范廷鈺,失去了爭(zhēng)奪80萬(wàn)冠軍獎(jiǎng)金的資格。失利后柯潔登錄騰訊野狐圍棋,與世界冠軍末日(羋昱廷九段)鏖戰(zhàn)295手,終以2目半戰(zhàn)而勝之。或許是有意調(diào)節(jié)心情,面對(duì)圍觀(guān)群眾“和絕藝指導(dǎo)A下一盤(pán)”的鼓噪,柯潔欣然應(yīng)允,向絕藝指導(dǎo)A發(fā)出對(duì)局邀請(qǐng)。
驚天動(dòng)地。職業(yè)頂尖棋手——而且是最頂尖的那個(gè),首次在公開(kāi)對(duì)戰(zhàn)中成為被讓子的一方。這一刻柯潔放下驕傲,選擇勇敢。面對(duì)強(qiáng)大的AI,人類(lèi)展現(xiàn)出了卓越的勇氣與瀟灑風(fēng)度。
看到柯潔真的執(zhí)黑在棋盤(pán)上率先放上兩顆棋子,棋迷們的情緒瞬間失控,唯有瘋狂打call,在聊天框刷滿(mǎn)666已示聲援。便捷而發(fā)達(dá)的網(wǎng)絡(luò),將“柯潔被讓二子”的消息,通過(guò)朋友圈、QQ群、微博傳遍世界的每個(gè)角落。“這必須看啊”,八冠王星宿老仙(古力九段)的短短五個(gè)字,亦是每一名親歷者共同的心聲。
強(qiáng)大如絕藝,亦要在柯潔的人氣面前退避三舍。自涉足讓二子(黑貼6目半)以來(lái),絕藝指導(dǎo)A首次前50手支持率不足50%。被點(diǎn)燃的不止是圍觀(guān)棋迷的熱情,還有柯潔的斗志。開(kāi)局剛過(guò)20手,黑棋主動(dòng)在右上角引誘白棋沖斷,你死我活的激戰(zhàn)一觸即發(fā)。
對(duì)殺過(guò)程中,絕藝再度秀出令人戰(zhàn)栗的精準(zhǔn)與深遠(yuǎn),白61一手猝不及防的“打二還一”,將黑棋的凈殺美夢(mèng)徹底擊碎。弈至77手,上邊黑白兩塊即將不可避免的形成雙活。黑棋作戰(zhàn)已明顯失敗,不過(guò)畢竟只是一場(chǎng)戰(zhàn)斗而已,棋盤(pán)上還有大把廣闊空間可為。或許是對(duì)自己的表現(xiàn)太過(guò)不滿(mǎn),柯潔直接認(rèn)輸,這場(chǎng)意義重大的對(duì)決,就這樣猝然終結(jié)。
卻還留下了陣陣余波,在騰訊野狐圍棋的江湖回蕩不止。失利后的柯潔轉(zhuǎn)換身份,讓二子(黑不貼目)擊敗潘亭宇三段。而潘亭宇,剛剛在一天前受二子爆冷擊敗絕藝指導(dǎo)A,終結(jié)其14連勝的同時(shí)一夜成名。同一時(shí)間絕藝指導(dǎo)A正與手冢國(guó)光(陳翰祺二段)交手,柯潔亦在觀(guān)戰(zhàn)的同時(shí),與星宿老仙回味受讓二子的心得和感悟。
手冢國(guó)光落敗后,等候多時(shí)的超級(jí)銀冠棋手劍過(guò)無(wú)聲(連笑九段)登場(chǎng)挑戰(zhàn)。本局連笑雖一度將絕藝逼上死角,柯潔亦掏出10億狐幣重注聲援小伙伴。誰(shuí)料不為所動(dòng)的絕藝使出一套犀利的連招,成功逼迫人類(lèi)犯下大錯(cuò)。此后連笑拼命追趕,苦戰(zhàn)247手仍然無(wú)奈認(rèn)輸。
至此,絕藝再度用一波連勝,為這注定改寫(xiě)圍棋史的驚魂一夜,畫(huà)上完美句點(diǎn)。這一夜絕藝用圍棋的測(cè)量方式,銘刻下圍棋AI攀登的高度。這款2016年3月誕生于騰訊AI Lab實(shí)驗(yàn)室的圍棋人工智能,經(jīng)歷過(guò)2016年的初試啼聲,再到2017年3月、12月兩奪AI世界冠軍,直至今天,成為讓二子(黑貼7目半)棋份下,對(duì)陣職業(yè)棋手取得8成以上勝率的龐然大物。
關(guān)于A(yíng)lphaGo相關(guān)的研究,量子位做過(guò)一些報(bào)道:
最強(qiáng)AlphaGo怎樣煉成?
新AlphaGo這么強(qiáng)!36小時(shí)從0自學(xué)成大師
AlphaGo Zero的3個(gè)trick
關(guān)于騰訊絕藝,量子位之前也有過(guò)報(bào)道:
絕藝戰(zhàn)勝DeepZenGo又奪一冠
騰訊還在提高圍棋AI絕藝的棋力,柯潔說(shuō)已經(jīng)超過(guò)當(dāng)年AlphaGo
首個(gè)圍棋10段誕生!
OMT
“以后請(qǐng)叫我佛系棋手… ”柯潔今天凌晨在微博上說(shuō)。
圍棋世界第一人,最近心緒有點(diǎn)起伏~
— 完 —
誠(chéng)摯招聘
量子位正在招募編輯/記者,工作地點(diǎn)在北京中關(guān)村。期待有才氣、有熱情的同學(xué)加入我們!相關(guān)細(xì)節(jié),請(qǐng)?jiān)诹孔游还娞?hào)(QbitAI)對(duì)話(huà)界面,回復(fù)“招聘”兩個(gè)字。
量子位 QbitAI · 頭條號(hào)簽約作者
?'?' ? 追蹤AI技術(shù)和產(chǎn)品新動(dòng)態(tài)
丁書(shū)一
版權(quán)所有 未經(jīng)許可不得轉(zhuǎn)載
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證備案號(hào):遼ICP備14006349號(hào)
網(wǎng)站介紹 商務(wù)合作 免責(zé)聲明 - html - txt - xml