囚徒困境模型問世以來,引起了人們無盡的興趣。羅伯特·阿克塞爾羅德在其著作《合作的進(jìn)化》中,探索了經(jīng)典囚徒困境情景的一個(gè)擴(kuò)展,并把它稱作“重復(fù)的囚徒困境”。與原型略有不同的是采用正分激勵(lì):
每一局有0,1,3,5四種得分,分別命名為——雙方合作獎(jiǎng)勵(lì):3,3;雙方背叛懲罰:1,1;背叛的誘惑:5;笨蛋的收獲:0。
阿克塞爾羅德邀請全世界的學(xué)術(shù)同行來設(shè)計(jì)計(jì)算機(jī)策略,每個(gè)策略與其它策略逐個(gè)對局,看看哪個(gè)策略總體表現(xiàn)最好。令人驚訝的是:勝利者是所有提交策略中最簡單的——首先在第一步合作,然后就模仿對手上一步的策略,我們稱它為“一報(bào)還一報(bào)”。第二輪競賽有更多的參賽者,他們也知道第一輪優(yōu)勝者的策略,結(jié)果獲勝的依舊是“一報(bào)還一報(bào)”。
通過分析兩輪競賽中的高分策略,可以總結(jié)出成功者的幾個(gè)特征:
1,友善
最重要的條件是策略必須“友善”,就是說,不要在對手背叛之前先背叛。絕大部分高分策略都是友善的。
2,報(bào)復(fù)
成功的策略必須不是一個(gè)盲目樂觀者,要容易被激怒,立刻報(bào)復(fù)。有些采用“兩報(bào)還一報(bào)”的策略雖然表現(xiàn)也不錯(cuò),依然沒能勝過“一報(bào)還一報(bào)”。愚善是一個(gè)非常糟糕的選擇,因?yàn)椤靶∪恕辈呗詫埧岬貏兿鬟@樣的傻瓜。
3,寬容
在給對手的背叛行為予以報(bào)復(fù)之后,如果對手不繼續(xù)背叛,就可以退回到合作。只要對手背叛一次,就報(bào)復(fù)到底的“記仇”策略是不會(huì)獲得成功的。
4,不耍小聰明
復(fù)雜的策略并沒有表現(xiàn)得比簡單的策略更好。一些試圖占便宜的“老謀深算”策略在碰到愚善策略時(shí)會(huì)得逞,但在與其它對手打交道時(shí)經(jīng)常會(huì)遭致報(bào)復(fù)而得不到高分。
5,不嫉妒
因?yàn)椴皇紫缺撑,所以在任何一組對局當(dāng)中都不可能獲得比對手更高的分?jǐn)?shù)!耙粓(bào)還一報(bào)”策略不是靠打擊對手來獲勝,而是通過誘導(dǎo)雙方的合作行為來獲得雙贏,戰(zhàn)勝其他不合作的策略。
經(jīng)濟(jì)學(xué)的理性人假設(shè)并沒有錯(cuò),競爭的最終目的仍然是為了自己能夠獲勝!耙粓(bào)還一報(bào)”表現(xiàn)出這樣一種智慧:雖然沒有贏得過任何一場戰(zhàn)役,卻贏得整個(gè)戰(zhàn)爭。
這碗雞湯著實(shí)有點(diǎn)濃。這還不算完,阿克塞爾羅德將游戲設(shè)定成可以傳宗接代——設(shè)定一個(gè)策略的拷貝(后代)數(shù)量與它的競賽得分成正比——來模擬適者生存的自然演化過程。
模擬出來的結(jié)果非常有趣!靶∪恕背跗谶能跟得上大部隊(duì),隨著“愚善者”的滅絕,“小人”在“一報(bào)還一報(bào)”的包圍中也迅速消亡。
如果起始條件非常惡劣,在一個(gè)遍布“小人”的社群中,單獨(dú)的“一報(bào)還一報(bào)”也無法生存,但是“一報(bào)還一報(bào)”對單個(gè)“小人”的劣勢有限,最多只輸1分。即使只有一個(gè)小的友善群體,哪怕只占總數(shù)的5%,“一報(bào)還一報(bào)”也可以通過找到合作慢慢壯大,而且這個(gè)過程不可逆。
正義終將戰(zhàn)勝邪惡,這結(jié)論真是鼓舞人心。難怪理查德.道金斯在為該書撰寫的序言中聲稱:《合作的進(jìn)化》值得取代圣經(jīng)。