如何評價 DeepMind 於2023年9月12日公開的 AlphaGo 自戰棋譜及3月人機大戰解說?

時間 2021-05-11 14:31:23

1樓:

2023年9月12日公開的 AlphaGo 自戰棋譜是在和李世石比賽前產生的,也就是和李世石對戰的V18這個版本。

以前知道樊麾下快棋贏過AlphaGo,還以為快棋AlphaGo表現會差一點,這次公開的前2局都是快棋,失誤應該比職業棋手少,如果是每步5秒的快棋,明顯更難贏AlphaGo。

不管是快棋還是慢棋,或者是對李世石的那5盤棋,總的來看,我覺得Value Network絕大部分情況下判斷還是很正確的,基於Value Network做出的判斷,各種出人意料脫先、轉換似乎都是小菜一碟。

職業棋手利用棋理來算下一步,是強項也是弱項,有時更快找到合理答案,或者是能找到比AlphaGo更好的答案,但有時候也會因此出現盲點,AlphaGo不懂棋理,不懂脫先,但是計算結果會告訴它這裡脫先不是問題,另乙個地方更大。AlphaGo目前沒有好辦法找到最優解,但總的來說棋手犯錯的機會大得多,棋手一旦犯了價值判斷上的錯誤,很可能就被追究,而AlphaGo通常只是很偶爾犯一些不致命的錯誤,如果不是像第四盤那樣的致命錯誤,棋手很難贏。

下一次人機對戰,AlphaGo肯定是新版本了,如果這是個好版本,也應該是犯錯的機率更低,至少是避免了某種型別的錯誤,另一方面,AlphaGo的Policy Network、Value Network是可以不斷進步的,理論上,越來越難贏AlphaGo了,能贏AlphaGo的應該是另乙個更好的軟體。

2樓:

要是在下完當天就被職業棋手拿到,且只有總譜沒有各種內部變化圖,alphago概率資料等。

職業選手不一定屑於分析。

職業選手:」黑五跑去掛角再轉成中國流?毫無必要。「

職業選手:「怎麼擋13位?」

職業選手:「白棋在下面發展空間不大,黑棋點角巨大。」

職業棋手:「怎麼30位擋不擋a位?」

職業選手:「38固然是好棋,但是我之前肯定擋另外一邊(上圖a位s15)根本輪不到下出38的機會。」

職業選手:「這49 51 可以考慮扳。」

等等等等

經過一番亂戰之後

職業選手:「轉換還是挺多的,有點看頭。"

開始收官

職業棋手:「咦怎麼不接上,哦還真有棋。」

職業棋手得出結論:「這個版本的電腦比上個版本的電腦強了那麼一點,但是人類有上將李世石,可斬阿法狗。」

aja huang:"這個棋譜是五秒一步的快棋。還有慢棋的你要不要看?"

職業棋手:「what???」

3樓:

從資訊理論/控制論的角度講圍棋是資訊完全透明的,也就是說可能性空間是確定的,或者說每一盤的解是有限的。這說明了什麼?

這說明李世石每走一步都在阿爾法狗的意料之中,李世石腦子裡想到的阿爾法狗全知道,李世石沒想到的狗狗也都知道。

對李世石來講他的計算能力是有限的,他只能計算有限的幾步,因而結果是不確定,他面對的是乙個灰盒。

對阿爾法狗來說,它的計算能力是無限的,李世石每走一步,阿爾法狗可以窮舉每一種可能性,並且直接推演出結局。最後選出一種最優,它的結果具有確定性,它面對的是乙個白盒。因而阿爾法狗是不可能輸的,輸了只有一種可能就是故意的。

完全是降維打擊。。

下面的同學不開心,我說明一下在現場阿爾法狗只需要搜尋,不需要推算。它所有步的完全解並不是現場推算的,而是靠平時左右互博窮舉的,它可以24小時進行。所有的結果存在資料庫中,在比賽中只需要搜尋一下。

4樓:睡死算了

我僅僅糾正一點,中國流小目一側的進入,靠在星位這一手早在阿爾法狗被研製出來之前很久就有人第乙個下出來過,具體比賽我不太記得了應該是中國的連笑第乙個下出來的,而且當時效果不錯,所以不要因為對職業比賽了解太少就對AI的一些招法感到震驚,有些招法職業棋手都下出來過

5樓:清酒瓶

看的我目瞪口呆

講究變化多端的圍棋竟然都出現了「唯一最佳選擇」

看這三盤棋頂自己學至少半年

真的何況遠遠不止三盤

何況「他」還在進化

人類圍棋將會出現前所未有的重大進化吧

進一步說,那人類智商呢

6樓:Rammstein

可惜啊,若非吳大師復生,人族藉此譜將現有對圍棋的認知提公升至新的境界無望矣。

回答圍棋的技術問題總被質疑資格,上個圖給自己打打氣

爆照騙讚了,除了本人(右一)以外,其他人沒有不認識的吧。

7樓:

所以以後的高手下棋都是三兩步就分出勝負,只有臭棋簍子才會下到中盤宮子,就像小李飛刀從來就是一招,絕不會跟人家大戰三百回合的。

8樓:謝丹

早上看了。

1,阿爾法狗已經超越人類,李世石很可能是最後一位戰勝最強電腦的棋手。

2,阿爾法狗有少許弱點,這些弱點在程式上是否已經修正未知。

3,人類或許只有少許在阿爾法狗異常時能有點貢獻。(因為其自己的計算能力更強)

4,具體點看,其特徵是多計算少感覺(特別是目數)5,狗對狗的棋型真難看。

現在人類和阿爾法狗的戰鬥已經沒有意義了,現在是人類+狗和狗的戰鬥,看加入人類後能否

取得少許的勝率優勢(5-10%),也就是說,人類是否還有輔助的功能了。

如何評價deepmind放棄torch7選擇tensorflow?

前段時間在一台雙Titan X的機器上裝TF的時候,就是跑了個小test,竟然讓我正在跑實驗的Mxnet的程序弄了個segmentation fault出來,原因沒查。後來就直接把TF刪掉了。我沒root許可權,TF上的相關檔案全部自己編譯。原因沒有深究。只是給大家提個醒。 小乖他爹 根據deepm...

如何評價 Fama 和 French 最初於 2013 年提出的五因素定價模型 Five factor Asset Pricing Model ?

說個個人經歷,當年french在cicf講這篇文章的時候,坐在我旁邊的Mark Loewenstein和Marcel Rindisbacher相視一笑說了句what is that? 你們考慮過華人經濟學家Lu Zhang的感受麼 其實是他根據Q theory of investment提出了inv...

如何評價 NGA(艾澤拉斯國家地理論壇)於 2019 年 7 月 26日起無法發貼?

小騙子 對這個論壇是又愛又恨,最不明白的是沖水制度,我從沒見過有哪個論壇有這種不可理喻的機制。這種機制下,所有老帖子都消失了,其中有很多質量很高的內容,全沒了,想看看自己以前發的過主題,也沒了,連個標題都不給你留。最近魔獸要開懷舊服了,以前NGA有很多60年代的高質量攻略貼和求助貼,本來都可以直接拿...