明知AlphaGo變得無法戰勝,柯潔為何還迎難而上?
柯潔與AlphaGo對弈
鳳凰科技 白楊
柯潔輸瞭,在與AlphaGo的第一場對決中,以四分之一子的落後惜敗。
這個結果在很多人意料之中,其中也包括柯潔。
第一場賽後發佈會上,柯潔直言AI的進步速度太快瞭,並且每一次都是巨大的進步。這也是為什麼他在大賽前夕發佈微博稱,此次將是他與人工智能的最後台北靜電油煙機租賃三盤對決。
柯潔心中已經清晰的知道,人類已經無法戰勝AlphaGo。他形容AlphaGo越來越像 圍棋上帝 ,想贏它隻能去找一些BUG,但目前,他還沒看到AlphaGo的任何弱點。
這裡引用搜狗CEO王小川在知乎上發佈的內容,再向大傢科普一下AlphaGo。
去年的AlphaGo 混合瞭三種算法,即蒙特卡洛樹搜索+監督學習+增強學習。
其中蒙特卡洛樹搜索是一種優化過的暴力計算;監督學習,是通過學習3000萬部人類棋譜,對六段以上職業棋手走棋規律進行模仿,也是AlphaGo獲得突破性進展的關鍵算法;而增強學習作為輔助,是兩臺AlphaGo從自我對戰中學習如何下棋。
每當獲取棋局信息時,AlphaGo 會根據策略網絡探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在分配的搜索時間結束時,模擬過程中被系統最頻繁考察的位置將成為AlphaGo 的最終選擇。
簡單來說,AlphaGo下棋依靠的是概率,而概率的得出則依靠前期學習。而這次與柯潔對戰的AlphaGo相較於去年,已經判若兩人。
最初的AlphaGo主要依靠監督學習,即學習對象幾乎全部來自人類棋手,而新版的AlphaGo則強化瞭增強學習,主要對機器自我對弈產生的棋局進行學習。
難怪柯潔會覺得,去年AlphaGo的下法還很接近人類,但今年自己對戰時,AlphaGo已變得更加不合乎 常理 ,下瞭很多人類棋手不可能下的棋子。
第一局結果
DeepMind創始人、AlphaGo之父Demis Hassabis證實瞭這一點,他說與柯潔對戰的AlphaGo更多的是根據自身學習,對人類數據的依賴性越來越小。
除瞭開始脫離人類數據,更讓人類望塵莫及的是其恐怖的進步速度。我們常說要台北靜電機出租 取長補短 ,AlphaGo則可以把這個過程加快成百上千倍。
取長方面暫不多說,AlphaGo的研發團隊一直在找它的缺口。去年輸給李世石之後,他們回去馬上台中靜電機租賃改善瞭AlphaGo的知識缺口,並且投入更多精力去改進算法,讓AlphaGo變得更強。
這次的AlphaGo在算法上就強大瞭很多。去年,AlphaGo還是通過分佈式的計算機來運作,而今年隻用瞭一個單一的機器。所以,柯潔非但沒有讓AlphaGo的CPU因為飛速運轉而發熱,相反,今天的AlphaGo的計算能力比去年要小10倍。
從比賽用時上來看,柯潔幾乎是AlphaGo的兩倍。雙方第一場比賽共耗時4小時17分37秒,其中柯潔用時2小時46分43秒,AlphaGo用時1小時30分54秒。
學的又多又快,人類棋手確實很難看到勝算。柯潔也看到瞭這一點,但他為什麼還要應戰。
這也是普通網友最關心的問題瞭,柯潔的輸贏到底是否需要將其上升到 人類尊嚴 這種高度?答案肯定是不能。
圍棋如同所有競技賽事一樣,柯潔也是專業的運動員。對於運動員來說,勝敗乃兵傢常事,面對實力懸殊很大的對手,任何人都很難取勝。
現在柯潔面對的就是這樣一個對手。所以對於比賽接下來的關註點不該是柯潔能否勝一局,而是AlphaGo所代表AI技術將為人類帶來什麼。
目前來看,AlphaGo已經顛覆瞭傳統的圍棋。柯潔在比賽中也嘗試瞭一些 非常規 下法,他認為AlphaGo已經改變瞭自己很多最初的看法,現在覺得比賽中沒有什麼棋是不能下的。
Demis Hassabis在賽前的致辭中說道,圍棋的樣式變化繁多,可能再過一萬年,人類也無法窮盡圍棋的打法。
而AlphaGo可以作為一個工具,通過它去幫助人類對於圍棋的理解,讓偉大的棋手去發現圍棋更多的奧妙。
這確實是一種很奇妙的感覺。當你認為一件幾乎是唯一的事情,突然有瞭另外一種可能,這就像哥倫佈發現新大陸後,給未來開啟瞭一扇新的大門。
柯潔說活到現在,最大的榮幸是和AlphaGo進行瞭對戰,很感謝能有這樣的對手。他從AlphaGo身上獲得瞭很多比賽的快樂,這種快樂來自於競技,而非結果。
比賽結束以後,柯潔更希望把AlphaGo當做幫助自己提升棋藝的工具。在人與機器之間,他選擇跟人類下棋,他笑著說, 我跟人類比賽的勝率還是可以的。
AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋
AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots
留言列表