博弈論用來解釋和解決現實問題和現象的效果如何?都有哪些例項?

時間 2021-05-05 14:19:55

1樓:知弦MappingU

有乙個特別有趣的小遊戲,The evolution of trust (信任的進化), 用非常生動有趣的方式展示了博弈論如何解釋人與人間的信任問題。

「為什麼人與人間的不信任會像病毒一樣傳播開來?」

鏈結在這裡:https://

ncase.me/trust/

原始版本是英文的,也有中文版本,非常好玩。

大概來說的話,就是假如你是其中乙個小人兒,你要和另外的角色來玩乙個信任遊戲,你可以選擇欺騙或者合作,來獲得更多的硬幣。

遊戲提供了一系列非常有趣的模擬,來看在各種不同條件下什麼樣的行為模式(欺騙or合作?)才能獲利最多,最終得出了以下的結論:

規則如下:

但是實際上,和你玩遊戲的人可能會採取不同的策略,有的人會一直選擇欺騙,有的人會一直選擇合作等等:

雖然單次的遊戲中,「老油條」也就是一直選擇欺騙的人獲利最多,然而在重複的遊戲中「復讀機」(會重複對手行為的人)卻是獲利最多的:

如果遊戲進一步模擬現實生活,一直輸的人會被從遊戲中淘汰出去,什麼樣的人會勝利呢?

後面這個遊戲還引入了更複雜的情況,引入了很多新的行為模式角色,以及新條件,比如共贏的收益減少會怎麼樣,如果引入一定比例的誤會(其中一方原本想合作但是因為意外而欺騙),還有全部可以自己選擇的沙盒模式,非常有意思!

2樓:時遇

先提前說我是小白 ,但是自從知道有個東西叫博弈論後, 就會發現日常生活中有很常見現象。之前看美劇有個人用博弈論來推測選誰當舞伴機率大 ,其中有乙個美女和乙個姿色較為普通的 ,大多數人認為那個普通的女生會容易被選上,只有那個男生說大多數人都這麼想所以反而美女被選機率這麼大,結果不出所料。至於生活中呢哈哈,之前競選實驗助理,我發現有需要5名助理的老師和2名助理的老師,我在想不管哪個老師哦怎麼更容易被選中呢,我腦子裡一下子想起了博弈論哈哈。

最終確實,5名助理的老師那裡報名人多的無法想象,最後我在需要2名助理的老師那裡入選成功啦。 也許我想的博弈論不是真正理論上的博弈論,但至少是興趣的引門磚,趁著暑假我想系統的學習一下,加油!

3樓:JJ謙謙粉

上課正好有做了PPT的展示,我以大學生的博弈論——逃課為例,講解在靜態博弈,動態博弈幾種情況下的納什均衡,並提出解決方案

大學中的博弈論——逃課博弈論

4樓:張幼薇

如果只是看順著結果反過來看問題,你會覺得一切理所當然。那不如,從問題開始,在每個節點上問問自己會怎麼做?做出這些判斷需要哪些資訊,以及你要怎麼傳遞資訊?

假設你是乙個風投,據你觀察,市場上有A和B兩家公司。某項新技術即將走出實驗室,但是距離到產業應用還需要進一步的研發。A和B 兩家公司的研發能力是差不多的,他們能研發成功的概率都是P.

如果只有一家研發成功,那麼它將獨享新技術帶來的經濟效益,我們假設為$24M。如果同時研發成功,那麼兩家同享寡頭競爭下的經濟效益,我們假設為$10M 一家。

這是你所拿到所有資訊,這時候你要考慮的是:1)要不要投?2)什麼情況下投回報率最大?

有了這些前提,我們就開始量化每種情況下的收益和可能:

若雙方均不研發,那麼新增淨利潤為0.

若A/B其中只有一家研發,那麼淨利潤為:

24*p+(1-p)*0-10=24p-10

(即,你要考慮兩種情況,研發成功和研發不成功,對應的概率*對應的收益,再減去研發投入。從數學的角度,就是期望值。)

若雙方同時研發,那麼淨利潤為:

p*(1-p)*24+p*p*10-10

(即,你要考慮兩種情況,只有一家成功和兩家同時成功,再減去研發投入。

為簡化展示結果,我們令24p-10=β,p*(1-p)*24+p*p*10-10=α

如果我們把上面的所有情況整理出來,就會得到以下的博弈矩陣

接下來看博弈過程,

當0If B 選擇No, 由於β<0, A 選擇No

If B 選擇Yes, 由於α <0, A 選擇No

所以,無論B如何選擇,A都會選No

B 知道A肯定會選擇No, 由於β<0,B選擇No.

故,納什均衡為 0/0

當 0.4167If B 選擇No, 由於β>0, A 選擇Yes

If B 選擇Yes, 由於α <0, A 選擇No

If A 選擇No, 由於β>0, B 選擇Yes

If A 選擇Yes, 由於α <0, B 選擇No

故,存在兩個納什均衡0/ β 和β/0

當0.5367If B 選擇No, 由於β>0, A 選擇Yes

If B 選擇Yes, 由於α >0, A 選擇Yes

所以,無論B如何選擇,A都會選Yes

B 知道A肯定會選擇No, 由於α<0,B選擇Yes

故,納什均衡為α /α

從上面的博弈看出,

當研發成功概率低於0.4167,雙方均不該研發,即該新技術不會進入產業,更大程度上停留在非營利機構的實驗室。

當成功概率介於0.4167和0.5367之間,則先進入研發的一方有先發優勢,另一方則退出。

這個階段搶占時間非常重要,需風投介入,且由於壟斷利潤β>寡頭競爭利潤α。 對風投來說,是非常難得進入的時期。

若成功概率高於0.5367,則雙方均會研發,但寡頭競爭利潤α《壟斷利潤β, 風投回報率未必最佳。

值得一提的是,若出現第二種情況,為了搶占市場,其中一方可以通過和第三方簽署對賭協議「若不進行研發,則賠款多少多少」,這樣做其實就是signaling 另一方,你別進來了,我已經下血本做這件事了,從而減少對方的選擇可能。

先更到這。。

5樓:黑錘

博弈論目前取得的成績實際上是很尷尬的。

因為人類對於這個專案的不自覺的研究實際上古以有之,實際上一切文化知識的總和就是博弈論的解。

但是目前採用經濟學和數學的驗證方式實際上這種工具是多麼蒼白與初級。當然這是乙個必經之路,也許以後有了人工智慧的高度發展這一工具可以得到高速發展。

人類主宰了地球以後社會的主要矛盾就是人與人的關係,這也是社會發展的主要動力。

博弈論是最好的現代科學的學科是最好的解決最關鍵問題的工具。

博弈論幾乎是萬能的。主要的問題是發展的很不夠,太初級了。

6樓:Darren丶Dai

這個問題下的答案已經有了很多,我結合我的專業HRM(人力資源管理)來回答一下這個問題。在這個答案裡,我要解決的問題是「為什麼有人會偷懶?」以及「如何解決員工偷懶問題」。

利用的知識是博弈論(Game Theory),關於合作困境博弈,不需要任何基礎,具有高中數學水平即可讀懂。

在工作中,我們常常會遇到這樣的情況,即兩人合作完成工作。在這種情況下,有兩種策略可供選擇,即勤奮或偷懶。那麼相應的博弈標準式如表1:

需要說明的是,括號裡前面的數字是局中人甲選擇乙個策略所對應的支付,後面的最為乙的支付。顯然,佔優策略均衡為(偷懶,偷懶)。接下來說一下這些數字背後的考量。

當兩人都勤奮或偷懶時,兩人的支付均為10或5。當甲偷懶乙勤奮,甲的支付為15,乙的支付為3。這是為什麼呢?

因為甲偷懶,乙卻勤奮工作,所以乙的支付要明顯低於甲,也就是甲不勞而獲。同理,(3,15)則為乙不勞而獲。

接下來說說為什麼佔優策略均衡為(偷懶,偷懶)。對於甲乙來說有兩個策略,即勤奮或偷懶。當乙選擇勤奮時,則對應了表1中第三列,即

此時,甲選擇勤奮,則甲的支付為10,反之為15。所以,甲的佔優策略為偷懶。

那麼,當乙選擇偷懶呢?那麼對應了表1中第四列,即:

此時,甲選擇勤奮,則甲的支付為3,反之則為5。所以,甲的佔優策略為偷懶。

看到了嗎,無論如何,甲的佔優策略均為偷懶。同理,乙的佔優策略均為偷懶。那麼,佔優策略均衡為(偷懶,偷懶)。

那麼,這個問題該怎麼解決呢?引入獎勵、懲罰機制!

下面的表2為獎勵數表:

表2是不是很公平?只有幹活的才有money賺。表1加表2得到表3,即加上獎勵的合作困境博弈標準式:

別急,還有懲罰機制呢。下面的表4為懲罰數表:

那麼,表1加上表4得到的是什麼呢?當然是加上懲罰的合作困境博弈標準式,如表5:

現在看錶3和表5是不是「舒服了」?他們的佔優均衡策略均為(勤奮,勤奮)。

接下來是重頭戲,如何確定獎懲的數值呢?畢竟光談毒性而不談劑量都是耍流氓。我這麼乙個英俊瀟灑、一諾千金的純情男子怎麼會耍流氓呢。

我們來看更一般的情況下是怎樣的,如表6:

具體的數值參照表3和表5就可以得到,即a>b>c>d。回頭看一看,是不是一樣的。這告訴我們乙個什麼道理呢?獎勵和懲罰的力度要到位,否則就失效了。

作為公司的HR,在公司的薪酬與績效管理方面,理應掌握這些知識。所以,不是HR這個崗位工資低,而是現在大部分的HR認知水平低!囿於有限理性,卻又不去學習,HR工資能高起來就怪了。

還有,以後誰再說HRM是文科,幫我給他一巴掌,扇醒他的無知。

局中人(player):指博弈的參與人。

支付(payoff):每個局中人選擇出策略後所獲得的收益。

策略(Strategy):指局中人的行動。

佔優策略(Dominant Strategy):在乙個二人博弈中,如果乙個局中人M有兩個策略M1、M2,無論另乙個局中人採取何種策略,該局中人M的策略M1的收益總是大於或等於M2,那麼稱M1為佔優策略(Dominant Strategy),策略M2為劣策略(Dominated Strategy)。

佔優策略均衡(Dominant Equilibrium):當每乙個局中人都選擇了各自的佔優策略時,相應的博弈結果就是佔優策略均衡。

7樓:

博弈論是經濟學中的一種理論,指的是行為人根據資訊選擇不同的戰略,獲得不同的收益。囚徒困境就是博弈論的乙個應用。而資訊經濟學與博弈論息息相關,研究資訊在博弈論中的應用。

乙個最普通的例子就是求職,求職者為了取得更好的工作,也即獲得更高的收益,而努力展現自己最好的一面,也就是傳遞出良好的資訊,達到讓老闆相中自己的目的。其實,博弈論並沒有多麼高深,相反它無時無刻不隱藏在我們的生活中。而聰明人善於運用博弈論,也就是荀子說的:

「君子性非異也,善假於物也。」而達達尼昂無疑就是乙個會運用博弈論的人。

人與人之間交流就是給出和接收資訊的過程,而每一輪的交流就是一場博弈。對於乙個剛剛到達巴黎的鄉下小夥子來說,官場是難以捉摸的。達達尼昂向自己的老鄉和父親的舊友火槍隊隊長特雷維爾請求乙個火槍手的職位,而後者則推薦他去王家學堂學習馬術、劍術和跳舞。

達達尼昂對官場裡待人接物的一套還一無所知,但依然感覺到自己受到的接待室冷淡的。然而很多人可能會認為這已經是天大的恩典了,這就是在處理資訊時的差異。要想在博弈中取得優勢,首先就必須了解對方給出的資訊是有益於我的還是有害於我的,這種益處或害處又達到何種程度。

在了解了對方的資訊之後,還必須因此制定戰略,給出資訊。這種資訊有可能是虛假的,事實上,為了取得優勢,大多數情況都是值得懷疑的。這也就是博弈論中的逆向選擇問題。

在波那瑟向自己請求幫助解救被綁架的波那瑟夫人時,達達尼昂很敏銳的察覺到波那瑟在試探自己是否是個可靠的人選,因此裝出一副熟悉宮中內情的樣子,博取波那瑟的信任,並且獲取有效資訊。達達尼昂通過給出有利自己的資訊,從而使對方逐漸信任自己,而獲取更高的收益。這就是博弈論中訊號傳遞問題。

事實上,動物界也經常使用訊號傳遞的技巧,例如大猩猩會通過拍打自己的胸脯向入侵者傳遞自己很強壯的訊號。

有時這種訊號傳遞甚至是性命攸關的。當紅衣主教派人抓波那瑟之時,剛剛還答應波那瑟充當他的保護人的達達尼昂馬上就翻臉,對衛士說自己是紅衣主教的擁護者,因此非但不會阻止他們帶走波那瑟,相反還會幫助他們執行。在場的知情者全都被弄糊塗了,可憐的波那瑟悄聲反抗,而達達尼昂則給出自己的理由:

只有我保持自由,才可以救您!因此,達達尼昂逃過一劫。在初次博弈中,通過給出虛假訊號,讓對方分不清你的立場,從而無法做出正確的判斷,正是達達尼昂的制勝關鍵。

當然,這僅限於初次博弈,多博弈幾次以後,這種混淆視聽的辦法就無法發揮作用了。

訊號傳遞理論使資訊像戰爭中的煙霧彈,干擾對方的試聽,發揮不可忽視的作用。正是這種高超的技巧使達達尼昂能夠在火槍手中脫穎而出,出人頭地。

博弈論裡的囚徒困境怎麼解決?

Maggie 現實生活中的博弈行為往往出現在短期關係中,方案一,拉長關係的時間線可以降低博弈所要支付的成本 方案二,制定相應的規則規避博弈時所要承擔的風險。 雪夜陽光 其實囚徒困境很好解決,就是合作,不要舉報對方 兩人罪責相同的情況下 1。如果你舉報對方了,就一定會牢底坐穿!如果你舉報對方,對方也舉...

怎樣用博弈論解釋 皇帝的新衣 ?

開摩托的貓 從博弈論角度看這個故事,這就是典型的共有知識和共同知識的區別。共有知識就是大家都知道這個事情,但是不知道其他知不知道這個事情。共同知識就是大家都知道這個事情,大家都知道大家都知道這個事情,無限迴圈。舉個例子 共有知識 ABC三個人都知道某個事情。共同知識 ABC三個人都知道某個事情,A知...

能否用博弈論解釋地鐵上的乘客不會遵循先下後上的原則?

這題其實有個有趣的別種,當初我在陸家嘴站看到的 大家下車後一起往乙個閘口擠,沒有人分流去旁邊不超過20步的閘口,結果出現了乙個 a 1 b 0 的有趣局面 所以我覺得戰略選擇在這裡還關於history 楊灰球 首先,問題設定的背景條件就是在地鐵上下車人數相對比較多的情況,其次,我們要將在同一時段擠地...