如何看待 Google 圍棋 AI AlphaGo 擊敗歐洲圍棋冠軍?

時間 2021-05-05 20:40:00

1樓:oldbig

AlphaGo使用蒙特卡洛樹搜尋(Monte Carlo tree search),借助估值網路(value network)與走棋網路(policy network)這兩種深度神經網路,通過估值網路來評估大量選點,並通過走棋網路選擇落點。AlphaGo最初通過模仿人類玩家,嘗試匹配職業棋手的過往棋局,其資料庫中約含3000萬步棋著。一旦它達到了一定的熟練程度,它開始和自己對弈大量棋局,使用強化學習進一步改善它。

圍棋無法僅通過尋找最佳棋步來解決;遊戲一盤平均約有150步,每一步平均約有200種可選的下法,這意味著有太多需要解決的可能性

2樓:Indra

1)前提假設: 電腦的計算能力是無限的。

2)圍棋的所有變化,不是無限的,而是有限的,其變化極限為 361!(就是 361的階乘,= 361*360*359*358*....*3*2*1=乙個超級大數字)。

證明如下:

19X19的棋盤, 第一步黑子落子,一共有 19X19=361種可能性。 第二步白子落子,一共有360種可能性。 第三步黑子落子,一共有 359種可能性。。。。

以此類推。證畢。

3)演算法設計:

利用窮舉法。計算每乙個棋盤上可以落子的位置,假設在此處落子,那麼接下來所有的棋局變化都計算到最終一步,然後統計在此處落子的最終勝率為多少。 取棋盤上所有可以落子的位置,按照上述模擬的勝率排序,最終選擇最大勝率的落子處落子。

4)演算法特徵分析:

此演算法, 一開盤的時候,需要的計算量極其巨大,達到 361!次。 然後下每一步之後,計算量逐步降低。比如第二步,計算量為360!。第三步,計算量為 359!.....

此演算法,一開盤的時候, 落子處的勝率概率為略大於50%。然後每下一步,落子處的勝率評分逐漸增加。一般而言,下到中局左右,基本上每一步落子的自我勝率評分基本上就接近100%了。

5)此演算法會帶來明顯的冗餘計算,但是這算在演算法優化範疇的細節,暫不歸於此整體設計思路範疇。 另外,比如中途圍殺,造成的棋盤空格增多,那麼直接在下一步計算的時候,把空出來的位置重新納入計算即可。

以上數學設計,可以證明,在極限環境下,電腦必定能贏人。 證畢。

3樓:包季真

不談投入產出比何談「擊敗」?

從功率的角度來說,人類棋手在下棋過程中,大腦功率也就100瓦上下。

但是AlphaGo呢?下面有張圖,是AlphaGo測試中,AlphaGo多次使用不同數目的CPU和GPU,以單機或分布式模式執行。每一步棋有兩秒的思考時間。

最終Elo等級分如下表:(3000分的Elo等級分差不多可以戰勝人類)。

按乙個CPU50瓦,乙個GPU100瓦算,要超過3000分的Elo等級分,要包含764個CPU和112個GPU,也就是超過50千瓦。但是這只是CPU和GPU,你再算上匯流排、散熱。。。百千瓦級別。

好吧,1000個人的團隊打乙個人。。。

4樓:nadi

原文在此:如何看待Alphago戰勝圍棋冠軍?聽奧賽羅冠軍BEN如是說

我們將會一次又一次,不斷不斷地被教做人(被羞辱),來認識到所有我們這些人類有多愚蠢。

(但至少這些羞辱有乙個好處,那就是AI可以為我們服務,教會我們一些事情,這都是我們靠自身無法實現的。所以即使自信心受到了點打擊也是值得的)

顯然,這取決於你從什麼角度來看問題,我們其實不應該為此感到羞愧。這就好比你也跑不過一輛汽車,那又何必為了輸給超強AI而感到被羞辱呢?

但我們人類往往視自己是世界上最聰明的。其他動物可以比我們更快更大更強,但沒有比我們更「聰明」的動物。這一點必然會影響到我們對人類智力等級的評估。

這就是為什麼我此前覺得人們很可能高估了李世石此次的勝算。作為乙個奧賽羅棋手,我已經習慣了輸給AI。而圍棋棋手們大概還沒有看到過這種AI戰勝人類渺小大腦成千上萬次的場景。

頂尖的圍棋棋手並不會比頂尖西洋棋或奧賽羅棋手聰明許多。只是找出如何讓AI適應圍棋需要花更長的時間而已。

大部分人類都對自己的能力沾沾自喜。我們習慣以最強者自居,卻對自己的脆弱和愚蠢視若無睹。

同時,圍棋棋手們也不夠虛心。圍棋是乙個如此複雜的棋類,他們應該知道理論上的完美下法會遠遠超過現有人類棋手可以達到的水平。這不應該是像現在高手們總是下成(接近)平局一樣,所以顯然這裡的潛力要大得多。

潛力越大,AI就越容易快速突破。

5樓:

圍棋的意義是不是被誇大了。

我想,這和人類發明了千斤頂,它比世界第一大力士的力量還要大這件事,有何本質區別?目前的阿爾法還沒有情感,也不能自我複製。

也許我們大部分人不是圍棋手,體會不到被電腦戰勝的失落感和挫敗感。記得小時候看過乙個廣告,瓦爾德內爾對桌球機械人。老瓦怎麼都贏不了一球,我當時作為乙個小桌球手,也深深的體會到了失落和不甘。

廣告的最後老瓦用乙個擦邊球扳回一分,他笑了笑,依然鬥志昂揚,給了我們「希望」。

希望李世石也至少能給我們一點希望,雖然機器終將在圍棋領域超越人類。

6樓:

圍棋的所有的可能,雖然很大,但卻是有限的。

所以,過了某個點,計算機一定全面戰勝人類。別說用模型了,窮舉都行。

雖然是廢話,但確是事實。

但這並不意味真正的智慧型。

7樓:李鴻緒

沒人能戰勝阿爾法,腦容量都不在乙個級別上,戰勝屁啊。人的腦容量是有限的,而機器可以無限公升級處理器,和運算空間。人公升級一下腦容量需要幾千年。

對了,就現在來說,人的腦容量跟機器不在乙個級別上。什麼意思呢?黑猩猩和人類就差那麼一點,區別那麼多。

8樓:炸驢

程式設計師必將占領整個宇宙。。。。

不會下圍棋,但是我們會寫程式呀。

不會寫文章,但是我們會寫程式呀。。

不會洗衣做飯,但是我們會寫程式呀。。。

不會生孩子。。。。。。

9樓:bird

從局勢上來說,白色方前期補刀還是小優勢的,經濟領先1k多。之後中單失誤沒有參加團戰,被黑色方抓住機會收下一血和二血,接著下路團再次被黑色方打出一波小團滅。到此為止黑色方大優,但基於取勝的黑色方試圖偷取大龍被團滅送大龍送一路,然後白色方41分推,黑色方又被帶掉一路,翻盤無望打出GG。

這說明電腦前期和中後期都很厲害,前期局面很穩,中後期計算精準,人類只能從中盤盤面最複雜的時候找機會,發揮大局觀和思路連貫性的優勢。取得優勢以後,要學EDG穩健運營,不要出奇招給對手機會。

10樓:北一

強行回答。

其實不懂圍棋,也不懂計算機,只知皮毛。

聽一些了解圍棋的人講,當年南韓圍棋異軍突起的時候,是因為南韓棋手的下法很兇猛,為了贏棋而下棋,所以下的棋雖然結果是勝,但是最終棋勢並不美,棋形不好看。日本人下棋過多的追求一種下棋的優雅和最終棋盤的美感,中國棋手的下法算是中和了日韓的兩種形式,不是單純為了勝而拋棄了圍棋的勢和形,也不像日本人那樣因為棋形不美就不下子。

所以從這種角度來講,圍棋已經脫離的一種單純比較智力高低的益智遊戲的範圍。所以就算是計算機通過極大量的資料積累和高速的模擬計算後下出了勝棋,但機器能感知或者追求下棋的美感麼?這種說不出來的意境可能才是人和機器的差距吧。

就此而講,現階段的AI距離我們能感知的「人」的那種感覺,真的是非常非常遙遠啊。

11樓:regulus

半個本科生,半個棋手,半個程式猿。

看完了樓上一些專業級大神的解答之後,來談談我通俗淺薄的看法。

在早些年深藍出現的時候,圍棋成為了所謂「人類在計算機面前最後的尊嚴」,雖然當時的計算機在圍棋專案上連學棋幾月的人都難以戰勝,但其實那時早已經可以預見人工智慧挑戰圍棋的那一天,所以AI的出現是必然的,也是人工智慧研究上的乙個重要的突破和偉大的成果。

不談一些答主提到人工智慧就擔憂機械人威脅的觀點,對於AI擊敗歐洲冠軍這件事,我持樂觀和期待的態度。AI下棋時,最大的優勢在於幾乎零犯錯,這與他強大的搜尋運算能力和大量的棋譜儲備有關,是一種檢索;而人類下棋時,最大的優勢在於創新,與唯人類所有的分析、應變能力有關,是一種思索。如一些棋友所想,若對決過程中人類走出天元開局、殭屍流或其他詭手,是否會對AI造成困擾,這也正是我非常期待3月李世石對局的原因,因為九段棋手們的犯錯率也幾乎為零,同樣,他們還有走出新型手段甚至新型流派的可能性。

最後說,作為半個棋手,在我的理解中,圍棋的精髓和價值在於千年的傳承積澱以及對人平心靜氣的修煉。棋局瞬息萬變,明爭暗鬥,對局雙方甚至可通過一局棋了解對方的為人、性格,正因此圍棋被稱作「手談」,但在你和機器下棋的時候,感受是完全不同的,因為說到底人工智慧和人腦智慧型總歸不同,在巨量計算之下的圍棋總缺少了那股「神」在。同時,作為半個程式猿,AI的出現是讓人振奮的,因為歸結起來,這還是人類技術的進步、創新的進步。

人創造出機器,又害怕著機器;人編寫出演算法,又恐慌著被演算法擊敗;人拼命讓機器更好地模仿人類,又花著大力氣區分人類和機器。看,不過都是人的自娛自樂而已。

歸根到底,圍棋永遠有圍棋的樂趣,計算永遠有計算的發展,僅僅因為被人工智慧擊敗就去自卑和恐慌,大可不必。

12樓:一己之見

人的智慧型一定程度上被人腦結構所限制,這不可避免,因此我們不能執著於智慧型高低。蘋果的果肉再怎麼鮮美也不如其中的果核重要。當然在以後人類或者AI破解了蘋果核的秘密之後人類的危機才是真正到來

13樓:

開個腦洞。在未來的某一天。人類將挑選最強的幾位棋手組成若干團隊來對抗超級電腦,比如李世石、古力、時越組成乙個隊,有主將,有輔將,但每一步棋,都可以集體研究,且不限時,這樣子能夠下出完美的圍棋了吧。

14樓:並非學不好

以前的AI只是輸入棋譜或者計算最優的路數,而Deepmind的強大之處是除了強大的資料運算外還有它的學習能力。計算機能學習的能力實在太強大了。

15樓:可哥可棄

畢競是模仿人類的,很多局面其實未有定論。要看人類棋手的創新能不能走在前面。覺得圍棋第一手拍天元將不可避免,用強以劫為核心不可避免。這樣才可洗白AI的價值網路。

16樓:

AlphaGo早就在網際網路上同時跟幾十個高段位棋手下棋積累經驗了,想想人一天下一盤棋,AI一天跟人下幾百盤棋,跟自己下上萬盤棋

如何看待Max Howell被Google拒後去了Apple

當乙個公司拒絕的你時候說因為你不會反轉二叉樹,但是這背後的原因是不是這個未必吧。就好比乙個好小伙兒被乙個姑娘拒絕了,姑娘說你很好但是你的頭太大。那你說女孩兒真的是因為嫌棄他的頭大麼?作為乙個姑娘我誠摯的回答 呵呵。 richard008 蘋果比谷歌更需要類似homebrew這樣的東西吧。谷歌更著眼於...

如何看待 Google 即將關閉?

大概是兩三年起,能感覺出zz社群和梯子社群的重心逐漸轉移到了tg上,可能是因為安全一些?笑 但是ingress社群還有部分存活 剩餘的裡面部分轉到了QQ群部分轉到了tg還有部分轉向了有事約飯沒事躺屍 所以你要問我怎麼看待 不怎麼看待啊,就只剩小部分ingress玩家還在忍受g 的神奇UI了,換成tg...

如何看待 Google 既可以作 Inference,又可以作 Training 的新一代 TPU?

Zhao Aaron 45 TFLOPS是很生猛。但是畢竟是要進入data center,我更好奇的是整個system會有什麼提公升。裡面還有一大堆問題呢。譬如你在data center加入了這麼多個rack的TPU,其他compute unit去呼叫你的TPU的時候延遲又是多少呢?還是你準備每個r...