科技改變生活 · 科技引領未來
問耕發自凹非寺量子位出品|公眾號QbitAI這是圍棋人機大戰中的又一個第一次。頂級職業圍棋手,在讓子棋中負于AI。更明確一點說,騰訊圍棋AI絕藝,讓二子戰勝了當今圍棋第一人柯潔。而且整個戰局只進行了77手,可以說柯潔落敗的相當快。10天前,
問耕 發自 凹非寺
量子位 出品 | 公眾號 QbitAI
這是圍棋人機大戰中的又一個第一次。
頂級職業圍棋手,在讓子棋中負于AI。
更明確一點說,騰訊圍棋AI絕藝,讓二子戰勝了當今圍棋第一人柯潔。而且整個戰局只進行了77手,可以說柯潔落敗的相當快。
10天前,絕藝開始讓二子(黑貼6目半)對決職業棋手。與柯潔這樣的頂級高手對決前,已取得27勝4負的成績。
可能未來人機大戰的懸念會變成,到底讓幾子人類才能穩贏。
這次戰勝柯潔的絕藝,參考了2017年10月公開的AlphaGo Zero論文,并在實踐中做出了改進。這個版本使用了40 block dual-resnet模型,以老版本的絕藝為基礎進行強化學習,自對弈了數百萬棋局。
據介紹,騰訊在有限的資源和時間內,通過把強化學習和監督學習相結合來加速訓練,快速提升了棋力。
圍棋AI戰勝人類已經不是新鮮事了,但讓子棋情況有些不同。
量子位從騰訊AI Lab獲得了一份詳細的解答。
包括AlphaGo在內的圍棋AI都存在贏棋退讓的問題,原因是AI以贏棋為目標,勝率過高時下哪里都贏,不一定會選擇贏最多的下法。
而讓子棋就是另外一種勝率過低的極端情況,以絕藝海南挑戰賽版本為例,這是一個分先版本的AI,如果要求其以讓2子開始對局,則初始勝率為7%(讓3子則初始勝率1%,讓4子則初始勝率0.1%)。
并且實力越強的版本,下讓子棋時的初始勝率就越低(因為AI下棋時會假設對手跟自己一樣)。
初始勝率過低將導致AI不能發揮出真正的實力,這也是現在絕藝讓2子還不能全勝的原因。我們最近在嘗試優化算法,來解決勝率過低帶來的負面影響,爭取以后在讓子棋里有更好的表現。
從上面的講述可以看出,讓子棋并不簡單。
馬化騰曾經公開說過,絕藝代表著騰訊AI工程化的能力。不過這個方向,連DeepMind未來也不會再投入核心精力研發了,騰訊還會繼續么?
騰訊AI Lab回復量子位說:還會。原因有幾方面,例如:這項研究體現出了價值、在騰訊業務中有應用場景、還有一定的社會責任意義。
至于未來絕藝會不會推出圍棋教學工具,目前還很難回答。不過騰訊絕藝已經在職業訓練中得到應用,甚至還是國家棋院的AI陪練。
回到絕藝與柯潔的讓子棋。其實當天,AI不僅讓子戰勝了柯潔,還戰勝了連笑九段。這次對弈的情況,野狐圍棋做了更翔實的記錄。
下文摘自野狐圍棋(微信號:txyhweiqi),量子位已經獲得授權。
1月17日這一天,對柯潔來說并不愉快。白天的棋圣戰八強,柯潔執黑中盤不敵范廷鈺,失去了爭奪80萬冠軍獎金的資格。失利后柯潔登錄騰訊野狐圍棋,與世界冠軍末日(羋昱廷九段)鏖戰295手,終以2目半戰而勝之。或許是有意調節心情,面對圍觀群眾“和絕藝指導A下一盤”的鼓噪,柯潔欣然應允,向絕藝指導A發出對局邀請。
驚天動地。職業頂尖棋手——而且是最頂尖的那個,首次在公開對戰中成為被讓子的一方。這一刻柯潔放下驕傲,選擇勇敢。面對強大的AI,人類展現出了卓越的勇氣與瀟灑風度。
看到柯潔真的執黑在棋盤上率先放上兩顆棋子,棋迷們的情緒瞬間失控,唯有瘋狂打call,在聊天框刷滿666已示聲援。便捷而發達的網絡,將“柯潔被讓二子”的消息,通過朋友圈、QQ群、微博傳遍世界的每個角落。“這必須看啊”,八冠王星宿老仙(古力九段)的短短五個字,亦是每一名親歷者共同的心聲。
強大如絕藝,亦要在柯潔的人氣面前退避三舍。自涉足讓二子(黑貼6目半)以來,絕藝指導A首次前50手支持率不足50%。被點燃的不止是圍觀棋迷的熱情,還有柯潔的斗志。開局剛過20手,黑棋主動在右上角引誘白棋沖斷,你死我活的激戰一觸即發。
對殺過程中,絕藝再度秀出令人戰栗的精準與深遠,白61一手猝不及防的“打二還一”,將黑棋的凈殺美夢徹底擊碎。弈至77手,上邊黑白兩塊即將不可避免的形成雙活。黑棋作戰已明顯失敗,不過畢竟只是一場戰斗而已,棋盤上還有大把廣闊空間可為。或許是對自己的表現太過不滿,柯潔直接認輸,這場意義重大的對決,就這樣猝然終結。
卻還留下了陣陣余波,在騰訊野狐圍棋的江湖回蕩不止。失利后的柯潔轉換身份,讓二子(黑不貼目)擊敗潘亭宇三段。而潘亭宇,剛剛在一天前受二子爆冷擊敗絕藝指導A,終結其14連勝的同時一夜成名。同一時間絕藝指導A正與手冢國光(陳翰祺二段)交手,柯潔亦在觀戰的同時,與星宿老仙回味受讓二子的心得和感悟。
手冢國光落敗后,等候多時的超級銀冠棋手劍過無聲(連笑九段)登場挑戰。本局連笑雖一度將絕藝逼上死角,柯潔亦掏出10億狐幣重注聲援小伙伴。誰料不為所動的絕藝使出一套犀利的連招,成功逼迫人類犯下大錯。此后連笑拼命追趕,苦戰247手仍然無奈認輸。
至此,絕藝再度用一波連勝,為這注定改寫圍棋史的驚魂一夜,畫上完美句點。這一夜絕藝用圍棋的測量方式,銘刻下圍棋AI攀登的高度。這款2016年3月誕生于騰訊AI Lab實驗室的圍棋人工智能,經歷過2016年的初試啼聲,再到2017年3月、12月兩奪AI世界冠軍,直至今天,成為讓二子(黑貼7目半)棋份下,對陣職業棋手取得8成以上勝率的龐然大物。
關于AlphaGo相關的研究,量子位做過一些報道:
最強AlphaGo怎樣煉成?
新AlphaGo這么強!36小時從0自學成大師
AlphaGo Zero的3個trick
關于騰訊絕藝,量子位之前也有過報道:
絕藝戰勝DeepZenGo又奪一冠
騰訊還在提高圍棋AI絕藝的棋力,柯潔說已經超過當年AlphaGo
首個圍棋10段誕生!
OMT
“以后請叫我佛系棋手… ”柯潔今天凌晨在微博上說。
圍棋世界第一人,最近心緒有點起伏~
— 完 —
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
?'?' ? 追蹤AI技術和產品新動態
丁書一