观控实验苑(GuanKong Experiment Center,GKEC)分享 http://blog.sciencenet.cn/u/aloofgk  感庶物之机 悟万律之理  究天人之际 索浮沉之秘

博文

“囚徒困境与仁者无敌”观控实验

已有 6104 次阅读 2010-4-2 08:14 |个人分类:超然观控|系统分类:科研笔记| 观控实验, 仁者无敌

 

       YHY按:这里贴出《“囚徒困境与仁者无敌”观控实验》,旨在从博弈论的视角再度审视“管用的活的哲学”(详见 http://www.sciencenet.cn/m/user_content.aspx?id=298944

 

“囚徒困境与仁者无敌”观控实验

 

 

 摘自《世界华人一般性科学论坛WCFSGS 2005 文集(略有修改)

http://www.sciencenet.cn/blog/admin/images/upfiles/20076221266390711.pdf 泛系观控技术§4-3

 

 

引言

 

    管理学博士肖知兴,在《囚徒困境与仁者无敌》中写道:大智若愚,大德若缺,大赢若输。仁者无敌,战胜的是人类与生俱来最为凶险的敌人——自身的贪婪。

 

    囚徒困境一般在入门的博弈论教科书的第一章都有介绍。甲乙同案犯,隔离审讯。如果两个都不招,因为证据不充分,两人都只能判1年。如果一方招了,属立功表现,功罪相抵,无罪释放;而另一方则属抗拒从严,判10年。但如果两人都招了,则各判 5 年。结果大家都知道:两个人争先恐后地招了,结结实实地各判了5年。

 

    基于个人理性的正确选择,道理很简单,重要的是能够举一反三。其实,人们在生活中处处都有囚徒困境:幼儿园小朋友互相分享玩具(给他玩,不给他玩);情窦初开的男女互相表白爱情(表白,不表白);公共走廊卫生的维持(不扔垃圾,扔垃圾);老板与下属的关系(信任,不信任);商场上,生意伙伴的非正式合同,或君子协定(不违约,违约);竞争对手打价格战(不降价,降价);国家间的对抗(和平,战争),等等。虽然括号内前者都是大家想要达到的目标,自私(理性选择)的结果却是大家不得不接受后者。小朋友仍在自己玩自己的玩具,虽然慢慢有点厌烦;韶华已逝的男女偶然发现当年对方暗恋的都是自己,徒呼奈何;你扔垃圾我也扔垃圾的结果是公共走廊难以找到下足之地;怕下属营私而事必躬亲的老板丧失了业务机会;怕对方违约的商人自己也没有做成买卖;怕竞争对手降价后独占市场的商家们竞相杀价,把一个又一个行业做烂;怕吃亏的国家之间也是永远战火绵连。可谓你我谁不是囚徒,天下何处无困境!

 

    为自己的利益考虑,但结果对大家都有利,即谓开明的自利(Enlightened selfishness)。连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的大众定理”(Folk Theorem)的含义。

 

    1984Robert Axelrod出版了一本200来页的《合作的进化》(The Evolution of Cooperation)20多年来畅销不衰,几乎成了西方战略学者、管理学者们的必读书之一。其核心也是这个道理。Axelrod 做了一个试验。他邀请学者们为一个重复囚徒困境游戏设计战略。然后把所有人设计的战略输入电脑,每个人的战略分别和其余各人的战略对弈,重复200次。第一次有15个战略竞争,第二次有63个战略竞争。实验的结果,总得分排在前面的战略有一个共同特点:善良,即他们不主动先背叛对方。两次都荣获第一的是几乎最简单的一报还一报战略(Tit for tat),他不仅善良,不首先背叛对方,而且宽容,对方背叛一次他只惩罚对方一次。更为发人深省的是,每次博弈,他的得分都不比对方高(最多与对方一样高)。他的成功不是建立在别人失败的基础上,而是建立在别人成功的基础之上。他没有赢取任一场战斗,却赢得了整场战争。大智若愚,大德若缺,大赢若输。仁者无敌不是说他战胜所有的敌人,而是他根本就没有敌人,或者说,他战胜的是人类与生俱来最为凶险的敌人:自身的贪婪。

 

实验

 

    1 表明囚徒困境博弈格局与仁者无敌泛系观控实验可能出现的状态:囚徒A 选定的优、良、中、差状态,只有分别与囚徒B 选定的差、良、中、优状态相对应——才可能出现(存在);反之亦然。

 

    2 所示囚徒困境与仁者无敌泛系观控实验 A,是按囚徒A的期望及可能作出的选择——既考虑风险更考虑比较收益后的适宜选择只能是“confess”(供认)而不是“deny”(否认),实际可能实现的较好期望只能是AB期望的交集——“次次优”——“

 

 附3 所示囚徒困境与仁者无敌泛系观控实验 B,是按囚徒B的期望及可能作出的选择——既考虑风险更考虑比较收益后的适宜选择只能是“confess”(供认)而不是“deny”(否认),实际可能实现的较好期望只能是BA期望的交集——“次次优”——“

 

运用泛系观控实验软件PGKE所得附1、附2、附3所示结论,可以举一反三,触类旁通。泛系观控实验可以按必要、可行、有效、乐意性运用于各个领域、各个方面。

 

 

1囚徒困境博弈格局与仁者无敌泛系观控实验

 

编号 观控代码   博弈格局    囚徒A     囚徒B   博弈日期    博弈地点   备注

 

 1    C001           Ac_Bd        A1()      B4()                         囚徒困境

 

 2    C002           Ad_Bd        A2()     B2()                           

 

 3    C003           Ac_Bc        A3()     B3()                         仁者无敌

 

 4    C004           Ad_Bc        A4()     B1()  

 

Ac=A-confess   Ad=A-deny

 

Bc=B-confess   Bd=B-deny

 

 

 

2囚徒困境与仁者无敌泛系观控实验 A2003.05.16__2I

 

—————————————————————————————


观控对象 自由信息 自由序 约束信息  期望值 期望序    风险序  比较收益 GBC

 

—————————————————————————————

 

 C001    1.0000    1   .0000   1.0000 1     .0000     1    100.00    1

 

  C002     .9488     4   .0512    .6800    2     .1800     4         55.76     3

 

  C003     .9990     3   .0010    .6562    3     .0238     3      64.05     2

 

  C004    1.0000    2   .0000    .4300    4     .0000     2      43.00     4

 

—————————————————————————————


3囚徒困境与仁者无敌泛系观控实验 B2003.05.16__2I

 

—————————————————————————————

 

观控对象 自由信息 自由序 约束信息  期望值 期望序    风险序  比较收益 GBC

 

—————————————————————————————


  C001   1.0000    1 
  .0000   .4300    4   .0000  1        43.00     4

 

  C002     .9488    4    .0512    .6800    2   .1800    4        55.76     3

 

  C003     .9990    3    .0010    .6562    3      .0238    3      64.05  2

 

  C004   1.0000    2    .0000   1.0000    1  .0000    2     100.00  1

 

—————————————————————————————


讨论

 

1肖知兴博士引证1688年英国限制国王收税权和其他权力的光荣革命,对西方世界兴起的意义重大。所谓捆住国王的手,对产权的普遍保障,作为一种可信的承诺,是西方资本主义发展以及西方世界兴起的制度渊源。吴思在《潜规则》一书中描绘的中国封建王朝的历史,则是一个反面的典型。暴力集团对农民阶层,以及封建后期新兴的工商阶层横征暴敛的结果是,财富的生产者们都丧失了生产的动力。你不仁,我不义。王侯将相,宁有种乎?反吧! 一将功成万骨枯,历史成了轮盘赌,每三五百年再赌一把,在轮回中走向堕落。肖博士感叹:两千多年前用一生写就一个字的孔夫子,念及于此,也该独怆然而泪下了吧!这里提出一点质疑:既然仁者无敌,战胜的是人类与生俱来最为凶险的敌人——自身的贪婪,中国人只要求与平等待我之世人共存共荣,怎么会独怆然而泪下

 

2泛系观控实验旨在揭示凡事有度,要害在度。人类过度地依赖理性或者过度地依赖感性都会出问题。只有适度地既注重理性又注重感性,既注重历史与逻辑的统一又注重概念的意旨与形象的意蕴一致,使观控主体和观控对象在给定的时空背景条件下足够充分自如地动态交互作用——进行必要、可行、有效、乐意的观控实验——进而按泛系理论主张的宏微局整远近纵横兼顾,多元综合协同优化发展的大善原则——实时观控、超前反馈、跟踪评估、及时应对,让其自动容错纠错趋真——人类文明才能进入到一个更适宜人类生存发展的新境界。

 

3百年或数十年后世界上占主导地位的会不会是观控实验产业观控实验产业的社会基础是:人类至今尚不善于管理自己,人文进步落后于科技进步,科技进步排斥简单劳动,科技进步与扩大就业已是当今人类不容回避的世界性难题。观控实验产业的理论基础是:感庶物之机,悟万律之理,究天人之际,索浮沉之秘,求和谐之谛,扬百家之义的多层网络型的泛系理论。观控实验产业的技术基础是:观控技术、电脑技术、网络技术、实验技术、数字技术,涉及各行各业的专门专业和交融技术。分层聚类的观控实验,主要包括:(1)人才定位定向;(2)产品定位定向;(3)服务定位定向;(4)经营定位定向;(5)管理定位定向;(6)企业定位定向;(7)区域发展定位定向;(8)灾害防治定位定向;(9)安全防务定位定向;(10)生态环境定位定向;(11)科学探索定位定向;(12)艺术创作定位定向。人类进入智能经济时代,思想的无限性和实践的有限性,为观控实验产业的形成和发展提供了内在需求和外在条件,未来占主导地位的、行将竞相发展的观控实验产业是否已是指日可待的了!?

 

参考文献

 

[1]     吴学谋:《从泛系观看世界》,北京:中国人民大学出版社,1990

 

[2]   于宏义:e当量与社会财富配置,《系统辩证学学报》,1998年第3期。

 

[3]     于宏义:比较收益导向 观控协调态势,《科学学与科学技术管理》,1991年第6期。

 

[4]   于宏义:观控技术及其应用,《系统科学理论与应用》,成都: 四川大学出版社,1996

 

[5]   于宏义,冯向军:观控存储系统,《中国专利公报》,2001年第52期。

 

[6]   于宏义等:泛系观控技术:信息量化测度,《科技进步与对策》,2001年第7

 

[7]   于宏义等:知识经济和高技术产业发展预研,《科学中国人》,2000年第1期。

 

[8] 于宏义:虚拟观控实验室,《科技进步与对策》,2002年第7期。

 

[9] 于宏义:泛系运筹:比较收益导向,《系统辩证学学报》,1996年第3期。

 

[10] Yu HongyiLeon (Xiangjun)  Feng and Yu Ran, Pansystems Guankong Technology and Information QuantizationKybernetes, 5/6(2003)905-911.   
 

 



https://blog.sciencenet.cn/blog-2037-308232.html

上一篇:“管用的活的哲学”
下一篇:在读研究生WT与YHY探讨“为人处世之道”
收藏 IP: .*| 热度|

4 朱林 唐常杰 丛远新 yinglu

发表评论 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 02:08

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部