4.扩展式博弈与反向归纳策略PPT文档格式.ppt
- 文档编号:15130139
- 上传时间:2022-10-28
- 格式:PPT
- 页数:45
- 大小:418KB
4.扩展式博弈与反向归纳策略PPT文档格式.ppt
《4.扩展式博弈与反向归纳策略PPT文档格式.ppt》由会员分享,可在线阅读,更多相关《4.扩展式博弈与反向归纳策略PPT文档格式.ppt(45页珍藏版)》请在冰豆网上搜索。
例:
房地产开发博弈例:
房地产开发博弈l需求大,开发需求大,开发者者利润利润8千万,千万,不开发者不开发者利润利润0。
l需求大,需求大,两者都开发两者都开发利润各为利润各为4千万。
千万。
l需求小,开发需求小,开发者者利润利润1千万,千万,不开发者不开发者利润利润0。
l需求小,需求小,两者都开发两者都开发利润各为利润各为-3千万千万l两者都两者都不开发利润各为不开发利润各为0。
房地产开发博弈房地产开发博弈A开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2B1B2B3B4博弈树:
不允许的情形博弈树:
不允许的情形违反传递性和反对称性假设违反传递性和反对称性假设信息完全与不完全信息完全与不完全信息集是每个人进行决策的依据。
如果某人在信息集是每个人进行决策的依据。
如果某人在某决策时刻的信息集包含两个或以上的决策点,某决策时刻的信息集包含两个或以上的决策点,则博弈的信息就是不完全的。
则博弈的信息就是不完全的。
如果所有的信息集都只包含一个决策点,则称如果所有的信息集都只包含一个决策点,则称博弈就是信息完全的。
博弈就是信息完全的。
扩展式博弈的形式扩展式博弈的形式完全信息的情况完全信息的情况不完全信息的情况不完全信息的情况扩展式博弈的规则扩展式博弈的规则l每个决策点至少有一个箭头指向它(表示至少每个决策点至少有一个箭头指向它(表示至少有一个参与者的行动会产生该结果),同时至有一个参与者的行动会产生该结果),同时至多也只有一条箭头指向它。
多也只有一条箭头指向它。
l如果我们从某一点向初始点返回,我们就不可如果我们从某一点向初始点返回,我们就不可能再通过迂回的途径回到这点,我们只能按反能再通过迂回的途径回到这点,我们只能按反向逐次返回原点。
向逐次返回原点。
扩展式博弈扩展式博弈l一个人不可能在他不知道有哪些选择的情况下一个人不可能在他不知道有哪些选择的情况下作出有意义的选择。
作出有意义的选择。
l为了保证局中人在博弈的任何节点总是知道他为了保证局中人在博弈的任何节点总是知道他面临的选择,如果两个决策节属于同一局中人面临的选择,如果两个决策节属于同一局中人的同一个信息集,那么他们的行动分支就必须的同一个信息集,那么他们的行动分支就必须相同。
相同。
动态博弈的基本特点动态博弈的基本特点l策略是在整个博弈中所有选择、行为的计划l结果是上述“计划型”策略的策略组合,构成一条路径l得益对应每条路径,而不是对应每步选择、行为l动态博弈的非对称性先后次序决定动态博弈必然是非对称的。
l先选择、行为的博弈方常常更有利,有“先行优势”。
扩展式博弈扩展式博弈l完美回忆假设l当某个局中人行动时,他记得在这之前他知道的所有的信息。
扩展式博弈扩展式博弈l完美信息完美信息l没有两个决策节属于同一个信息集。
也就是说,当某一局中没有两个决策节属于同一个信息集。
也就是说,当某一局中人开始行动时,他知道过去的一切。
人开始行动时,他知道过去的一切。
l策略策略l扩展式博弈的策略是一套为局中人的每一个可能信息状态决扩展式博弈的策略是一套为局中人的每一个可能信息状态决定行动的规则。
定行动的规则。
l数学上,策略是一个把信息状态映射到行动的函数。
数学上,策略是一个把信息状态映射到行动的函数。
共同知识共同知识1.参与人的知识阶次参与人的知识阶次l零阶知识:
某一事实零阶知识:
某一事实l“亮平生谨慎,不曾弄险亮平生谨慎,不曾弄险”l一阶知识:
参与人知道某一事实一阶知识:
参与人知道某一事实司马懿司马懿知道知道“亮平生谨慎,不曾弄险亮平生谨慎,不曾弄险”l二阶知识:
诸葛亮二阶知识:
诸葛亮知道知道“司马懿知道司马懿知道亮平生谨慎,不曾弄亮平生谨慎,不曾弄险险”。
lK阶知识阶知识:
(参与人参与人知道知道)k“某一事实某一事实”l“计计”高一筹高一筹l2、共同知识共同知识l解释一:
解释一:
共共同知同知识指识指“所有参与人知道,所有参与人知道所有参与人知所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道道,所有参与人知道所有参与人知道所有参与人知道”。
l解释二:
解释二:
如果每个参与人都知道某个事实,每个参与人都知道每个参与如果每个参与人都知道某个事实,每个参与人都知道每个参与人都知道它,如此等等,从而形如人都知道它,如此等等,从而形如“(每个参与人都知道(每个参与人都知道)k(k次方次方)每每个参与人都知道它个参与人都知道它”的语句对的语句对k=0,1,2,都是正确的,那我们就称都是正确的,那我们就称这个事实为参与人中间的共同知识。
这个事实为参与人中间的共同知识。
解释三:
这是一个这是一个“由己及人,由人及己由己及人,由人及己”的无限推理过程,是的无限推理过程,是k时时的高阶知识的高阶知识(每个人每个人)k-1)(k-1次方次方)。
一件事一旦在某个群体中成为共。
一件事一旦在某个群体中成为共同知识,则从任何一个个体出发,他对这件事的理解等等都已达到了完同知识,则从任何一个个体出发,他对这件事的理解等等都已达到了完全的统一,不再有任何层面的不确定性(全的统一,不再有任何层面的不确定性(奥曼奥曼,1976)。
)。
l某一事实成为所有参与人的某一事实成为所有参与人的K阶知识,且阶知识,且K趋向无穷大。
趋向无穷大。
l在共同知识假设下,参与人博弈的各方没有智力高低之分。
在共同知识假设下,参与人博弈的各方没有智力高低之分。
l对于扩展式博弈,博弈树的结构是参与人的共同知识;
对于扩展式博弈,博弈树的结构是参与人的共同知识;
l对于策略式博弈,支付矩阵是参与人的共同知识对于策略式博弈,支付矩阵是参与人的共同知识。
l“脏脸问题脏脸问题”l有三个人,他们的脸都是脏的,但是自己都不知道,他们各自只能看到其他人的脸是脏的还是干净的。
这时如果让他们判断自己的脸是干净的还是脏的,显然3个人都说不出。
这时,作为局外人的我告诉他们:
“你们之中至少有一个脸是脏的!
”,其实这明显是一句“废话”,因为每个人都可以看到其余两个人的脸都是脏的,但就因为这一句看似没用的话,游戏就可以进行下去了。
l这时我再问第一个人脸是脏的还是干净的,他还是答不出来,问第二个人,也答不出来,但是当我问第三个人的时候,如果他足够聪明的话,就应该肯定的回答,我的脸是脏的!
推理过程也很简单,第一个人答不出来,说明二、三至少有一个脸是脏的(否则第一个人就知道自己脸是脏的了),第二个人当然知道第一个人的推理,如果这是他看到三的脸是干净的,就可以迅速判断自己的脸是脏的,第三个人看第二个人还说不出来,拿自己的脸肯定是脏的了。
l这个过程相信很多人都可以很容易理解。
关键是为什么一句看似很没用的话就会让结果不同呢?
换句话说,如果不说“你们之中至少有一个脸是脏的”这句话,每个人也知道这件事,而且每个人也知道其他人知道这件事。
问题就在于,没有说这句话之前,问题就在于,没有说这句话之前,每个人不知道其他人知道其他人知道这件事每个人不知道其他人知道其他人知道这件事.。
l为了说明两种情况下的区别,我们只需推理到一种情景,在这种情境下至少一个人脸是脏的的命题是不成立的(因为如果说了那句话,至少一个人脸是脏就成了“共同知识”,在无论何种情况下都会成立)。
在没有说那句话的时候,A、B、C三人,首先都知道至少一个人脸是脏的。
对A来说,A会想B一定也知道“至少一个人脸是脏的”,因为A能看到C的脸是脏的,所以这点是确定的。
还是对A,因为在A看来,B也许只能看到一个脏脸C,因为A知道B也不知道自己的脸是否是脏的,所以再这样想下去,A想到B会想到C可能看到的都是干净的脸,这样想了三层以后就出现了和“共同知识”不符合的一种情景,命题得证。
所以在缺少“共同知识”的条件下,如果还进行上面的那种推理的话,第三个人是无法知道第二个人的推理的,所以他就无法判断。
l在一个偏僻的山里,有一个村庄,村里有100对夫妇。
在这个村里已经形成了约定成俗的规定,如果女人发现自己的丈夫对自己不忠的话,就会毫不犹豫的将他杀死,而且当天执行。
当然,她必须有确切的证据来证明他丈夫的不忠。
由于这个因素,某个女人发现某个男人不忠,她不会告诉那个不忠男人的妻子。
但是,她会告诉其他人的妻子,并且女人们会相互的传递这一信息,因此最后,一个男人不忠,除了其妻子不知道外,其他女人都知道。
事实上是,村子里的这100对夫妇的男人都不忠,但由于女人不会将她们知道的事实告诉不忠男人的妻子,每个女人不知道自己的男人不忠,因此,该村子一直很稳定,而没有发生妻子杀丈夫的行为。
村子里有1个辈分很高的老太太,她德高望重,诚实可敬,对村子里的情况了如指掌。
一天,这位老人对这这100个女人说了一句很平常的话:
“你们的男人当中至少有一个是不忠的。
”于是,村里发生了这样一个事情,前99天,村里风平浪静,但到了第100天,村里发生了一场大屠杀,所有的女人都杀死了她们的丈夫!
为什么会这样?
l如果只有一个不忠的丈夫,则他的妻子在神仙走后的第一天晚上就会杀如果只有一个不忠的丈夫,则他的妻子在神仙走后的第一天晚上就会杀死他。
原因是他原来知道没有人不忠,并且知道如果有其他人不忠的话,死他。
原因是他原来知道没有人不忠,并且知道如果有其他人不忠的话,他本应该知到,现在神仙说了他才知道这件事,就说明是不忠的一定是他本应该知到,现在神仙说了他才知道这件事,就说明是不忠的一定是他丈夫。
他丈夫。
l如果只有两个不忠的丈夫,则他们妻子会在神仙走后的第二天晚上杀死如果只有两个不忠的丈夫,则他们妻子会在神仙走后的第二天晚上杀死他们。
原因是她只知道有一个人的丈夫不忠,如果还有其他人的话,她他们。
原因是她只知道有一个人的丈夫不忠,如果还有其他人的话,她本应知道,现在神仙说了她才直到,说明不忠的一定是他丈夫。
本应知道,现在神仙说了她才直到,说明不忠的一定是他丈夫。
l依此类推,可以知道大家为什么会同时在第依此类推,可以知道大家为什么会同时在第100天的事后爆发了。
天的事后爆发了。
l但问题是,其实神仙并没有向妻子们报告任何新消息问题是,其实神仙并没有向妻子们报告任何新消息妻子们都知妻子们都知道有人不忠了,为什么妻子们能发现自己的丈夫不忠了?
道有人不忠了,为什么妻子们能发现自己的丈夫不忠了?
l原因是:
有人使得原因是:
有人使得“至少有丈夫不忠至少有丈夫不忠”成为了一个共同知识。
成为了一个共同知识。
l这表明:
一个事实是共同知识所带来的结果和一个事实为人们所周这表明:
一个事实是共同知识所带来的结果和一个事实为人们所周知带来的结果会由显著不同。
知带来的结果会由显著不同。
l3、私人信息(私人信息(privateinformation)l某个参与人的私人信息是该参与人知道的、没有成为博弈各某个参与人的私人信息是该参与人知道的、没有成为博弈各方共同知识的信息。
方共同知识的信息。
l4、历史节点(、历史节点(historynode)l如果一个博弈的过程中出现了某个参与人的私人信息,则我如果一个博弈的过程中出现了某个参与人的私人信息,则我们需要一个历史节点来告诉我们其他参与人对于博弈所知道们需要一个历史节点来告诉我们其他参与人对于博弈所知道的信息。
的信息。
l有了历史节点,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 扩展 博弈 反向 归纳 策略