作者:harsnaty
連結:https://www.zhihu.com/question/37689195/answer/1971875923553920540
來源:知乎
著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。
我上學的時候參與的一個基於博弈論的社會行為模擬項目,給大家講一講也許能有所認知:
這個模擬有上千個虛擬個體參與,採用不完全信息機制,依賴於個體對周圍及隨機遠方信息聯繫的綜合決策,設計了多個收益種類及收益特性,資源消耗,還加入了記憶影響,每個個體的行為矩陣都是一定範圍內初始隨機的,可被環境影響每輪更新的,甚至還設計了試圖掀桌子及報復社會的函數參數——就是計算卡慘叫的聲音比較大。
當個體的目標被設置為1、追求最大個體利益,2、防止其他個體掀桌子危害到自己,整個模擬的結果是非常非常好的,投入的資源被最大程度使用,群體對失利個體並不死逼,在競爭交易中會主動謙讓失利個體,儘管出現了貧富差距,但是反覆調整參數後基尼係數基本穩定在0.3左右,社會資源流向了所有個體,可以彙報拿個普通的優秀獎了
但是這樣的結果實在是太普通了,儘管有些黑暗,我們在個體目標中加入第三個目標:3、阻止他人獲得最大利益,並且這個參數並不對其他個體公開,純靠其他個體猜測對方的這個參數。
模擬的結果是一個很眼熟的場景,儘管我們在模擬中投入了最為「盛世」的資源,但整個群體對於資源的利用效率非常低下,產生了嚴重的貧富分化,個體在交易時更趨向於雙輸結局,個體的行為矩陣變得不再積極尋找交易目標,而是重複選擇上一次的成功交易對象——儘管交易可能對自己並不有利;整個社群沿著交易路徑變成了一種死氣沉沉的樹狀結構,比如A與BCD都會有得利交易,但BCD幾乎只選擇與A做負利交易,然後BCD又有下一層的得利交易對象,這種樹狀結構的節點層次實際上是一種不可逾越的階層,資源沿著樹榦緩緩流向最底層的末端,相同節點層次的個體更願意相互靠近形成社區形成連接,(可能比較)放心交換自己的資源,背叛成為了維護自己已有交易路徑的方式,掀桌子?別的層次已經主動關閉了與底層的連接不再交易,也只能掀同層人的桌子罷了。
好了,現在我們有三個參數,我們可以平滑調整個體的目標了,但是反覆多次的實驗還是出現了一個有趣的現象:1、追求最大個體利益與3、阻止他人獲得最大利益,這兩個目標函數似乎不能同時得到一個較高的參數值,也就是說,一個個體很少同時既想要追求最大個體利益,又很想要阻止他人獲得最大利益。
該如何解讀這個結果呢,我感覺更像是:更高的個人慾望在這個群體中更極易被人害,只能守著手上的資源壟斷買個高價,裝作高尚無欲無求,找機會打掉別人的資源,自己就贏了。
我們嘗試暫停模擬過程,啟用上帝許可權強制改變每個人的目標函數參數,強制拉到一個高尚社會,但是依舊保留3、阻止他人獲得最大利益,這個目標函數;結果也很有意思,雖然前期環境確實變好,但是隨著時間的拉長,又開始墮入互害社會,啟用天災模擬隨機拿走資源,每次天災造成的長期物質短缺都會加快進入互害社會的進程。
然後就被導師斃掉了這個想法,理由是:「不能以人性惡為設計前提,通過實驗引導人們得出人性惡的結論,這是無意義的,不符合正向良好的學術價值觀」,建議我們研究研究如何促進合作、信任和利他行為,搞個正向的例子拿拿獎
儘管最後只拿了一個優秀獎,但是模擬的結果在我的腦海中一直存在,甚至改變了我的一部分三觀,因為這都是實打實的數學邏輯,沒有爭議的區間,不依賴對現實測量。只是到現在都後悔沒做這兩個實驗:1、把一個互害想法的人投入到第一個烏托邦社會中會怎樣,相反會怎樣,2、兩種群體同場競技正面PK會怎樣
回到這個問題,我不是澳洲人,不是很清楚澳洲的工業實際是怎樣的,更不清楚他們腦中有沒有這個阻止他人獲得最大利益這個目標函數,但是在第一個模擬中,即使投入的資源不均等,通過正向交易,稀缺的資源依然能夠流向弱勢個體。
照此來說,我們更應該做的是鼓勵人們優先考慮自己的利益,停止被迫裝做高尚道德,如果我們還在弘揚謙讓高尚,隱藏自己的慾望,那只能是引導人們往暗處互害上競爭;因為競爭是永恆的,拿不到檯面上,那就可都是看不見的招了,但是這是囚徒困境,第一個改變的人,會被別人永遠背叛
最後沒有模擬到任何可以扭轉互害的方法,只要1、有阻止他人獲得最大利益這個目標函數,2、足夠長的時間,3、足夠威力的天災引髮長期物質短缺,三賢齊聚就足以引導入互害的互動模式;
我不相信人種之間有這種0和1的絕對區別,更有可能的是老外也有阻止他人獲得最大利益的想法,只是沒經歷過長期物質短缺以及模擬的時間不夠長,參數不是很高,那麼,祈禱不是我們成熟得太快吧,否則人類遲早都得上互害TV