色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

誰能把納什均衡給講清楚點?

李中冰2年前15瀏覽0評論

納什均衡是博弈論中的一個規律,指的是在一個博弈過程中,博弈雙方都沒有改變自己策略的動力,因為單方面改變自己的策略都會造成自己收益的減少。納什均衡點可以理解為個體最優解,但并不一定是集體最有解。

為了解釋這個問題,我們舉兩個最典型的例子:囚徒困境和智豬博弈。

囚徒困境

囚徒困境是說:有兩個小偷集體作案,然后被警察捉住。

警察對兩個人分別審訊,并且告訴他們政策:

如果兩個人都交代坦白,就可以定罪,兩個人各判八年。

如果一個人交代另一個不交代,那么一樣可以定罪。但是交代的人從寬處罰,批評教育就釋放。不交代的人從嚴處罰,判十年。

如果兩個人都不交代,沒法定罪,每個人判一年意思一下。

兩個人的收益情況如下所示:

首先我們考慮A的決策。A會想,我如何才能獲得更大收益呢?如果B坦白了,那么我坦白就會判8年,我抗拒就會判十年,我應該坦白;如果B抗拒了,我坦白會判0年,我抗拒會判1年,我還是應該坦白。所以最終A會選擇坦白。同樣,B也會這樣想,因此最終納什均衡點在兩個人都坦白,各判八年這里。

顯然,集體最優解在兩個人都抗拒,這樣一來每個人都判一年就出來了。但是,納什均衡點卻不在這里。而且,在納什均衡點上,任何一個人都沒有改變自己決策的動力。因為一旦單方面改變決策,那個人的收益就會下降。

這與我國開車夾塞的例子很像。如果大家都不夾塞,是整體的最優解,但是按照納什均衡理論,任何一個司機都會考慮,無論別人是否夾塞,我夾塞都可以使自己的收益變大。于是最終大家都會夾塞,加劇擁堵,反而不如大家都不加塞走的快。

那么,有沒有辦法使個人最優變成集體最優呢?方法就是共謀。兩個小偷在作案之前可以說好,咱們如果進去了,一定都抗拒。如果你這一次敢反悔,那么以后道上的人再也不會有人跟你一起了。也就是說,在多次博弈過程中,共謀是可能的。但是如果這個小偷想干完這一票就走,共謀就是不牢靠的。

在社會領域,共謀是靠法律完成的。大家約定的共謀結論就是法律,如果有人不按照約定做,就會受到法律的懲罰。通過這種方式保證最終決策從個人最優的納什均衡點變為集體最優點。

智豬博弈

智豬博弈是這樣一個例子:有一個食槽中裝有十份食物,但是按鈕在另一端。需要到另一段按一下按鈕食物才能掉下來。大豬和小豬都在食槽一端,他們兩個人都可以跑到另一端按按鈕然后再回來,速度相同,并且都要消耗一定的體力,并且會造成另一只豬先吃食物。

我們假設每只豬跑去按按鈕都要消耗2份食物的體力,并且大豬比小豬吃食物快,所以:

如果大豬先吃食物,二者吃食物的比例為9:1

如果小豬先吃食物,二者吃食物的比例為6:4

如果二者同時吃食物,吃食物的比例為7:3

兩只豬都可以選擇去按按鈕,也可以選擇等待。在考慮了兩只豬消耗的體力因素后,各種決策對應的收益如下所示:

我們來考慮均衡點。小豬會思考:如果大豬去,我跟著去獲得收益1,我等著獲得收益4,因此我應該等著。如果大豬不去我去,我獲得收益-1,如果我們都等著我收益為0,因此我還是應該等著,這樣一來,小豬的決策一定是等待。

在小豬等待的情況下,如果大豬去按按鈕,獲得收益4,如果大豬不去按按鈕,獲得收益0,因此大豬會選擇去按按鈕。這個(4,4)的收益就是納什均衡點。

這和國家或者公司進行基礎研究研發新產品很像。比如一款新的芯片研發需要花很多錢,成功后也能獲得更大的收益。在這樣的情況下,小國家小公司是沒有動力進行研發的,他們會等待大國大公司研發好了之后,直接利用現成的技術獲得收益。

我們的芯片產業就是這樣一個局面,多年以來我們一直認為自己是發展中國家,沒有大力推動半導體產業的基礎研究,許多人秉著做不如買,買不如租的觀點。現在美國對中國展開貿易戰,禁止芯片出口,一下子就卡主我們的脖子了。

約翰納什是一位傳奇人物,前兩年出車禍去世了。想了解納什的一生,可以去看看電影《美麗心靈》