作者:harsnaty
链接:https://www.zhihu.com/question/37689195/answer/1971875923553920540
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
我上学的时候参与的一个基于博弈论的社会行为模拟项目,给大家讲一讲也许能有所认知:
这个模拟有上千个虚拟个体参与,采用不完全信息机制,依赖于个体对周围及随机远方信息联系的综合决策,设计了多个收益种类及收益特性,资源消耗,还加入了记忆影响,每个个体的行为矩阵都是一定范围内初始随机的,可被环境影响每轮更新的,甚至还设计了试图掀桌子及报复社会的函数参数——就是计算卡惨叫的声音比较大。
当个体的目标被设置为1、追求最大个体利益,2、防止其他个体掀桌子危害到自己,整个模拟的结果是非常非常好的,投入的资源被最大程度使用,群体对失利个体并不死逼,在竞争交易中会主动谦让失利个体,尽管出现了贫富差距,但是反复调整参数后基尼系数基本稳定在0.3左右,社会资源流向了所有个体,可以汇报拿个普通的优秀奖了
但是这样的结果实在是太普通了,尽管有些黑暗,我们在个体目标中加入第三个目标:3、阻止他人获得最大利益,并且这个参数并不对其他个体公开,纯靠其他个体猜测对方的这个参数。
模拟的结果是一个很眼熟的场景,尽管我们在模拟中投入了最为“盛世”的资源,但整个群体对于资源的利用效率非常低下,产生了严重的贫富分化,个体在交易时更趋向于双输结局,个体的行为矩阵变得不再积极寻找交易目标,而是重复选择上一次的成功交易对象——尽管交易可能对自己并不有利;整个社群沿着交易路径变成了一种死气沉沉的树状结构,比如A与BCD都会有得利交易,但BCD几乎只选择与A做负利交易,然后BCD又有下一层的得利交易对象,这种树状结构的节点层次实际上是一种不可逾越的阶层,资源沿着树干缓缓流向最底层的末端,相同节点层次的个体更愿意相互靠近形成社区形成连接,(可能比较)放心交换自己的资源,背叛成为了维护自己已有交易路径的方式,掀桌子?别的层次已经主动关闭了与底层的连接不再交易,也只能掀同层人的桌子罢了。
好了,现在我们有三个参数,我们可以平滑调整个体的目标了,但是反复多次的实验还是出现了一个有趣的现象:1、追求最大个体利益与3、阻止他人获得最大利益,这两个目标函数似乎不能同时得到一个较高的参数值,也就是说,一个个体很少同时既想要追求最大个体利益,又很想要阻止他人获得最大利益。
该如何解读这个结果呢,我感觉更像是:更高的个人欲望在这个群体中更极易被人害,只能守着手上的资源垄断买个高价,装作高尚无欲无求,找机会打掉别人的资源,自己就赢了。
我们尝试暂停模拟过程,启用上帝权限强制改变每个人的目标函数参数,强制拉到一个高尚社会,但是依旧保留3、阻止他人获得最大利益,这个目标函数;结果也很有意思,虽然前期环境确实变好,但是随着时间的拉长,又开始堕入互害社会,启用天灾模拟随机拿走资源,每次天灾造成的长期物质短缺都会加快进入互害社会的进程。
然后就被导师毙掉了这个想法,理由是:“不能以人性恶为设计前提,通过实验引导人们得出人性恶的结论,这是无意义的,不符合正向良好的学术价值观”,建议我们研究研究如何促进合作、信任和利他行为,搞个正向的例子拿拿奖
尽管最后只拿了一个优秀奖,但是模拟的结果在我的脑海中一直存在,甚至改变了我的一部分三观,因为这都是实打实的数学逻辑,没有争议的区间,不依赖对现实测量。只是到现在都后悔没做这两个实验:1、把一个互害想法的人投入到第一个乌托邦社会中会怎样,相反会怎样,2、两种群体同场竞技正面PK会怎样
回到这个问题,我不是澳洲人,不是很清楚澳洲的工业实际是怎样的,更不清楚他们脑中有没有这个阻止他人获得最大利益这个目标函数,但是在第一个模拟中,即使投入的资源不均等,通过正向交易,稀缺的资源依然能够流向弱势个体。
照此来说,我们更应该做的是鼓励人们优先考虑自己的利益,停止被迫装做高尚道德,如果我们还在弘扬谦让高尚,隐藏自己的欲望,那只能是引导人们往暗处互害上竞争;因为竞争是永恒的,拿不到台面上,那就可都是看不见的招了,但是这是囚徒困境,第一个改变的人,会被别人永远背叛
最后没有模拟到任何可以扭转互害的方法,只要1、有阻止他人获得最大利益这个目标函数,2、足够长的时间,3、足够威力的天灾引发长期物质短缺,三贤齐聚就足以引导入互害的互动模式;
我不相信人种之间有这种0和1的绝对区别,更有可能的是老外也有阻止他人获得最大利益的想法,只是没经历过长期物质短缺以及模拟的时间不够长,参数不是很高,那么,祈祷不是我们成熟得太快吧,否则人类迟早都得上互害TV