如果納什均衡不是所有策略中的最優解,那麼求解的意義在哪呢?

時間 2021-05-06 08:00:43

1樓:暮鈴雨花

納什均衡是在自利假設下的最優點,即「不這樣做,【我覺得】別人會讓我更糟」,所以通過誠實的交流和善意的資訊設計——尤其在多輪博弈的情況下——我們能夠改變某種互害的狀態。

來點陰間的形式化。在多智慧型體博弈中,對於玩家 ,其策略 把狀態對映到行動空間。把策略結構 看成乙個列表,對偶地有他者策略 ,那麼乙個納什均衡是乙個joint marginal optimum ,它滿足:

所以我們可以通過賦予value function 某種機制來調整納什均衡,乙個例子是:

這裡 是乙個指示函式,預先審查策略是否不符合帕累託條件,如果不符合直接斃掉。

2樓:劉澤宇

不選擇納什均衡策略的情況下,當其他人的策略發生了變化,你的收益有可能減小;選擇納什均衡策略的情況下,無論別人怎麼變,你永遠能得到相對而言較好的結果。

3樓:呆萌Dimon

納什均衡只是乙個穩定的解,不一定是最優解,比如囚徒困境。

博弈的意思就是相互較量,當然要考慮其他人的選擇,因為這樣的選擇會影響自己收益。還是囚徒困境,當你選擇自身利益最大化,抵賴時,只有在對方也做出相應的選擇時才可以達到,否則你將迎來更嚴重的後果。

納什均衡可以給規則制定者乙個指導,如何通過規則的指定來引導人們的選擇。

出現偏差很正常,這個實在很多假設條件下的人們的選擇,現實情況是很複雜的。比如,人們的偏好本身就不是不變的,

4樓:Hannibal Scipio

通俗地講,納什均衡狀態下,每個人都不會因為單獨改變策略而獲益,也就是說你單獨改變策略,別人不一定不怎麼樣,你的利益一定會受損。

納什均衡可能不是每個人的最優解,甚至不是整體的最優解。但是每個參與的人最有可能接受的狀態。也就是最穩定的狀態。

在現實中,這個理論太有意義啦,哪有那麼多帕累託改進。。。

5樓:三符

納什均衡的結果,首先是非合作博弈,然後是在重複博弈下的才會顯得更加確定,換而言之,不斷進行博弈後能夠產生雙方會達成一致的最終結果。

為什麼不選擇最優解的問題,主要是對參與的其中一方來說,要得到最優策略,需要先要知曉對方的策略,然後才能應對,這實際是不可能,因為這是非合作博弈,比如囚徒困境就是這樣。

怎麼利用這種結果,比如囚徒困境的微妙之處,是把囚徒與警察的博弈轉變成囚徒之間的博弈,警察雖然無法確定一次博弈他們的結果,然而在設定了納什均衡的條件後,就能夠保證在多次博弈後,最終結果會向這個結果靠攏。所以多次博弈後,囚徒們一定會選擇坦白。

6樓:

我來試著從另乙個角度回答這個問題。

從經濟學發展史的角度講,古典經濟學一直在論證的乙個道理是:自由市場配置的結果是最優的,所以大家只要按照市場的外生情況進行個體最優選擇,得到的結果就一定是社會最優的。但是這個結論所適用的條件是模糊不清的,後來經濟學的發展就是不斷縮小這個結論適用的範圍。

博弈論的出現,本質上就是補充「存在市場勢力」這一條件的情況。它想說明的是:在存在市場勢力的情況下,古典經濟學的結論是失效的。

個體進行最優選擇的結果不一定是社會最優的。比如囚徒困境,我們定義了均衡的概念,說明雙方的策略都是個體最優的,但是結果不是社會最優的。後面包括非線性定價、訊號理論、合同理論、機制設計等等,都是在說明「在一定條件下,古典的結論是不成立的」,最後我們把原結論適用的範圍划得越來越小。

那麼求解納什均衡的意義何在?納什均衡代表乙個博弈進行無窮次後趨於穩定的結果,是事實上更可能發生的現實情況。社會最優的結果是什麼?

是剩餘最大化的結果,是乙個假象的social planner所設定的結果,是乙個規範分析。求解納什均衡很多時候就是告訴我們:你看,現實的結果往往對社會來說不是最好的,所以我們要想辦法調整一下,搞搞激勵相容,讓結果趨近於最優結果。

於是很多子方向應運而生,很多經濟學家又找到了工作。

波波攢 遊戲有最優解或者混合策略 納什均衡的解嗎,如何計算?

李思聰 這個問題很有意思。先給結論,實驗過程後面慢慢講,有興趣可以看看,沒興趣只看結論足以,以後玩波波攢輕輕鬆鬆上王者。按照題主的規則,一對一的情況下,如果對手是個程式,不是個活人,有最優解。最優解就是攢波攢波攢波無限迴圈 勝率75 但是這個策略太容易被針對,所以對付真人不是最優解。對付真人可能沒有...

李海鵬 神氣飛天豬等人關於 納什均衡 的爭論中,誰的理解是對的?

朱步衝 樓上兩位的分析能力讓我對 知乎 成員的平均素質衡量狂跌不已.請兩位撥冗去看一下北京理工大學出版社出版,威廉姆.龐德斯通所著 囚徒的困境 馮.諾依曼,博弈論和原子彈之謎 關於納什其人和納什均衡說的非常清楚 那是對非協作博弈的分析強調的是平衡點,非零和博弈也有平衡點,所謂平衡點就是雙方都無怨無悔...

如何論證納什均衡的唯一性?

島是海心上的疤 納什均衡點一般是最大化收益函式。每個參與者的效用函式之間都有相互制約的引數,可以通過迭代的方法 形如第N 1次迭代得到的x1的值 u 第N次迭代得到的x1值 求出使每個參與者收益函式最大的一組策略。 好了,萬一哪一天,可能對其他人有幫助。當我們想要證明乙個已知博弈,是否存在納什均衡,...