如果兩個Alphago對下,可以根據結果測試出黑棋貼多少目才最公平嗎?

時間 2021-05-30 03:24:19

1樓:

我覺得公平的貼目數應當與雙方的水平有關。假設兩邊的水平相同,那所謂公平的貼目數,應當使得兩者勝率相同。

但問題是,對於不同水平的對弈,比如AlphaGO對AlphaGO,九段對九段,先手帶來的目數優勢很有可能是不一樣的。

打個比方,若讓古代士兵公平對決,乙個人的身高體重比另乙個有優勢,為了公平,個高的讓個矮的三招,可能就公平了——即平均勝率相同。然而對於現代士兵來說,讓別人三招(槍),意義是完全不同的。

這裡想說的是,隨著對弈者水平的變化,先手優勢可能會被放大或縮小。

這裡可能有一種方法可以實現,即構造乙個與人類水平相同的AlphaGO,然後再進行對弈實驗。然而有兩個問題:1.

人類之間的水平差異很大;2. 這時就必須要有乙個先驗的貼目數,這樣就可能要求多次迭代逼近。

2樓:林雙

可以。設定不同的貼目數作為引數進行機器學習訓練出阿法狗,這些不同引數的狗各自進行對戰,根據結果就可以確定貼目數是偏多還是偏少。比如貼7.

5黑胜少負多,說明貼目偏多,反之說明貼目偏少。據此進行調整。需要指出,改變貼目後需要從頭開始重新進行機器學習訓練。

3樓:家飛貓

不能。計算公平貼目的難度遠高於擊敗人類:後者只需要職業十幾段水平,前者需要職業+∞段水平。

理論上公平的貼目應該是黑白雙方全域性均下出最優著手導致的終局狀態中黑棋領先的目數。

現實世界中圍棋規則中的貼目是基於職業高手間的先後手勝率確定的統計意義上相對公平的數字。AlphaGo可以被視為更強的棋手(相當於職業十幾段,日後甚至可能達到職業幾十段),但即便是採用AI對弈的結果,(在貼目數相對段位增長收斂的假設下)也只是把貼目變得相對精確一點而已。這就如同用職九的勝率要比用業五的勝率來確定貼目數貌似更合理些一樣。

AlphaGo中使用了統計方法來優化演算法,以保證在人類可接受的時限內行棋,因此雖然可以相對公平地擊敗人類,卻無法保證永遠走出最優解。事實上,因為基於暴力求解/遍歷整棵博弈樹(可以包含不破壞最優解性質的剪枝)的演算法計算量太大,計算公平貼目在可見的未來應該無法實現。

如果女孩有兩個男孩可以選,1 對女孩很好,想要什麼都給她!2 一心想著兩個人的未來!女孩會選哪乙個?

文小德 多遠的未來才算是未來呢,我自己覺得,未來是兩個人一步一步創造出來的,在這個過程中經過很多的磨合,然後讓兩個人變成乙個整體。可能這個女孩更應該考慮一下哪個才是自己更喜歡的人。 眠眠 相比的話我覺得2吧 當然兩者兼有更好 但比起來我更喜歡理智的男孩子,前提是男孩子在聊這個的時候不能過於生硬,懂得...

兩個開頭,指點下,寫得怎樣?

抬別槓 他們說你故事不行,文筆不錯 半年前,有乙個叫情何以甚的,寫了一本 赤心巡天 坦白講,比你這水平要高多了。他的開頭兩段 太陽懸在高天,將它的光和熱,不偏不倚灑落人間。不分老幼,不辨貴賤。大愛如無情。幼鹿涉溪時,飛鳥穿於林。即便是這樣,仍然被人噴了個體無完膚。這雖然跟他的粉絲過於高調的提問有關,...

牛頓擺 如果只有兩個小球 把左右兩個小球都抬起相同高度,然後碰撞,為什麼速度會交換,而不是抵消

RFisker 非常簡單,因為你 生活中的經驗 是不全面的。我們就舉生活例子,兩個人對著踢兩個足球,兩個球在空中相撞,會 速度抵消 然後停在原地嗎? 中藥指紋 抵消?兩個小球都有向下的速度啊。並不是速度完全相反,怎麼抵消?如果乙個向上,乙個向下,同時乙個向左乙個向右,這才叫做速度完全相反,你只看水平...