現在,第一局比賽結束,最終成績:圍棋人工智能AlphaGo執白,僅以1/4子戰勝目前等級分排名世界第一的中國棋手柯潔,暫時1比0領先。
人機大戰前夜:發生的兩個小插曲
在柯潔與AlphaGo人機大戰開賽前夜,發生了兩個小插曲。一個是明知不可為而為之,一個是明知不可為而不為。
5月22日,柯潔更新長微博,稱這是“無論輸贏,這都將是我與人工智能最后的三盤對局”,“不眠夜,且看且珍惜,請大家欣賞我最后的三盤人機大戰”。
決戰前夕,感慨萬千。
在這個特殊的時間,我有些話想和熱愛圍棋、關注圍棋、關注我的朋友們說:
無論輸贏,這都將是我與人工智能最后的三盤對局
很多人可能會問為什么?
其實私底下我已經與朋友家人說了很多次這樣的想法,現在的AI進步之快遠超我們的想象。像國產的絕藝、日產的ZEN雖然和AIphago還有著較大差距,但已經表現出超
強的實力了。我相信未來是屬于人工智能的。
可它始終都是冷冰冰的機器,與人類相比,我感覺不到它對圍棋的熱情和熱愛。對它而言。它的熱情——也只不過是運轉速度過快導致CPU發熱罷了。
我會我用所有的熱情去與它做最后的對決,不管面對再強大的對手——我也絕不會后退!至少這。最后一次。
拼盡全力后,無論結果。管他口中是是非非,來一首《滄海一聲笑》。豈不美哉、快意?我淡然笑到。
不眠夜,且看且珍惜,請大家欣賞我最后的三盤人機大戰。
此前,AlphaGo世紀大戰李世石引發中國科技界極大關注,搜狗CEO周小川也因直播報道點評5場系列賽走紅網絡。這一次,備受全球矚目的人機大戰第二季比賽,作為主辦方,本可以激發國內人工智能產業熱情,卻無奈被潑了一盆冷水。
有互聯網業者爆料稱,柯潔迎戰alphago,三番棋決勝,這是圍棋界翹首以待的一件大事,也是媒體界非常關注的一件事,但就在各大主流媒體做好全部準備,推出全明星陣容來直播報道的時候,某有關部門卻緊急喊停,幾大直播平臺和主流媒體均被要求取消直播,后經過幾輪磋商,相關部門終于還是達成妥協:報道只允許從圍棋角度談及,不允許展開討論信息技術層面,不允許信息技術專家參與。
所以,在今年的世紀決戰上,屏幕前只有圍棋一方的國家級選手們的熱烈討論,而另一方的人工智能技術資深專家的觀點被埋。
人機大戰第一局:柯潔僅以1/4子小負
本局柯潔開局就采用了“以其人之道還治其人之身”的策略,連走了兩個三-三。開局第3手占了個三-三,第7手又點了個三-三。
柯潔抓頭
可是本局白6已經在左邊守角,黑7馬上點三-三,很容易讓白方形成互相呼應的外勢。白22打吃,如果黑3不是在三-三而是在星位,則黑方征子有利,白22不能打吃。
白26打入后,世界冠軍羅洗河認為黑27拆二過分,會遭到白棋的反擊。果然,AlphaGo的白30反擊,但白32有避戰嫌疑,羅洗河認為在35位扳頭更為嚴厲。黑39粘出乎
羅洗河意料,他認為二路小尖是正常下法,實戰柯潔就是想挑起戰斗,但是至黑47角上被吃,多數棋手認為白棋得利。棋局回顧
黑55頑強打入,柯潔意識到形勢不利,早早放出非常手段。至黑65雖然活了角,但白方外勢雄厚,白68夾擊后黑方苦戰。黑69再次下出非常著法,柯潔拼勁兒十足。黑83斷吃一子,黑棋大龍得以治孤,但是全局來看,依然白方形勢樂觀。
黑97是敗招
白84在高位打入很特別,AlphaGo輕松破掉了柯潔的右上角。黑97是天馬行空的一著,但羅洗河認為還是平凡的拆邊更好。白98打入,黑99進攻,這也許是柯潔下97時想要的結果,但白棋治孤很輕松,黑方的攻擊沒什么實效,至150手,將在相談棋出場的某位世界冠軍認為,再過半小時柯潔可能就要認輸了。柯潔托腮
官子階段,AlphaGo一如既往揀厚實著法下,雖然不一定是目數最多的,卻是最穩妥的,電腦在這方面的勝率判斷比人類強太多。柯潔在已知敗局已定的情況下,堅持
收完了官子,可能想盡可能多的了解AlphaGo的特點。
至289手終局,柯潔以1/4子小負。
負責解說羅洗河認為黑97是明顯的敗著,如果改為平凡的拆邊還有希望。縱觀全局,柯潔著法強硬,雖然幾處都達到了戰略目的,但全局依然不樂觀;AlphaGo全局著法自然,雖然沒下出什么特別巧妙的棋,但大局始終領先。
中國圍棋隊總教則對柯潔很有信心,“我認為這個比賽也不是沒有看頭,雖然非常困難,但是柯潔爭取一勝還是有機會的。”
對于這件事,創新工場李開復評價道,此次對決人類勝率幾乎為零。
戰罷:AlphaGo和柯潔對弈是否有意義?
這個問題的答案是肯定的,但并不是外界理解的“這對Google來說是一種宣傳行為”。
石博盟解釋說,AlphaGo在圍棋方面已經做得很好了,但今天的結果是DeepMind的人工智能科學家和世界各國的圍棋頂尖選手共同探索的結果。在這個過程中,其實并不是人類在與人工智能對戰,而是科學家和圍棋選手在共同探索。
科學家探索的是人工智能,而圍棋選手探索的是圍棋藝術。AlphaGo的每一次升級,都意味著DeepMind的人工智能科學家對“如何在有限信息下做出更優選擇”這一問題有了更深刻的認識,而這一問題正是讓人工智能理解人類、產生思維的關鍵。
在獲取棋局信息后,AlphaGo 會根據策略網絡(policy network)探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在分配的搜索時間結束時,模擬過程中被系統最頻繁考察的位置將成為 AlphaGo 的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩后,AlphaGo的搜索算法就能在其計算能力之上加入近似人類的直覺判斷。
對棋手而言,柯潔也談到,與人工智能的多次對弈是十分有收獲的。在AlphaGo勝過李世石后,中國圍棋隊的成員多次復盤了所有比賽,從中發現了很多新的思路。
在以往的圍棋比賽過程中,總有一些“套路”是不會被打破的,這些套路曾被奉為人類經驗知識的圣殿,是不可更改的。但AlphaGo正是通過突破這些規矩,達到了新的高峰,這對人類本身來說也是一種啟發。
對了,這次比賽之所以選在浙江的烏鎮,是因為浙江自古圍棋氛圍就很濃厚。浙江的爛柯山,就是傳說中人類圍觀仙人下棋,回家后卻發現時間已過百年的地方。所以從某種程度上說,你看的其實并不是圍棋比賽,而是一次第三類接觸。