查看完整版本: 从围棋定式谈纳什均衡(3)

dymkj 2008-10-28 10:14

从围棋定式谈纳什均衡(3)

<TABLE cellSpacing=0 cellPadding=0 border=0>
<TBODY>
<TR>
<TD class=lb align=middle width=660><STRONG>作者 : 余治国 江雨燕 </STRONG></TD></TR>
<TR>
<TD class=content2 width=660><BR><BR><BR><BR><CLK>  博弈的结果并不都能成为均衡。博弈的均衡是稳定的,则必然可以预测。纳什均衡的另一层含义是:在对方<NOBR oncontextmenu="return false" onmousemove=kwM(1) id=clickeyekey1 onmouseover="kwE(event,1, this)" style="COLOR: #6600ff; BORDER-BOTTOM: #6600ff 1px dotted; BACKGROUND-COLOR: transparent; TEXT-DECORATION: underline" onclick=kwC(event,1) onmouseout=kwL(event,this)>策略</NOBR>确定的情况下,每个参与者的策略是最好的,此时没有人愿意先改变或主动改变自己的策略。</CLK><BR><BR><CLK>  在上面的“囚徒困境”变形的博弈中,A和B都不坦白就是一个纳什均衡,这对<NOBR oncontextmenu="return false" onmousemove=kwM(3) id=clickeyekey3 onmouseover="kwE(event,3, this)" style="COLOR: #6600ff; BORDER-BOTTOM: #6600ff 1px dotted; BACKGROUND-COLOR: transparent; TEXT-DECORATION: underline" onclick=kwC(event,3) onmouseout=kwL(event,this)>双方</NOBR>来说都是最优选择。同时在这个博弈中,其均衡对双方来说是全局最优的。当然博弈达到纳什均衡,并不一定是对<NOBR oncontextmenu="return false" onmousemove=kwM(2) id=clickeyekey2 onmouseover="kwE(event,2, this)" style="COLOR: #6600ff; BORDER-BOTTOM: #6600ff 1px dotted; BACKGROUND-COLOR: transparent; TEXT-DECORATION: underline" onclick=kwC(event,2) onmouseout=kwL(event,this)>参与者</NOBR>最有利的结果,更不意味着对整体而言是最有利的结果,比如“囚徒困境”的例子导致了整体的不利。</CLK><BR><BR><CLK>  <NOBR oncontextmenu="return false" onmousemove=kwM(0) id=clickeyekey0 onmouseover="kwE(event,0, this)" style="COLOR: #6600ff; BORDER-BOTTOM: #6600ff 1px dotted; BACKGROUND-COLOR: transparent; TEXT-DECORATION: underline" onclick=kwC(event,0) onmouseout=kwL(event,this)>围棋</NOBR>与这个博弈的例子是有所不同的。上面的这个例子是A和B双方没有信息交换下的博弈,这就是博弈论中的静态博弈概念。</CLK><BR><BR><CLK>  围棋则是对弈双方相继按照一先一后次序<NOBR oncontextmenu="return false" onmousemove=kwM(4) id=clickeyekey4 onmouseover="kwE(event,4, this)" style="COLOR: #6600ff; BORDER-BOTTOM: #6600ff 1px dotted; BACKGROUND-COLOR: transparent; TEXT-DECORATION: underline" onclick=kwC(event,4) onmouseout=kwL(event,this)>行动</NOBR>的博弈。对于一人一步的相继行动的博弈,每个参与者都必须向前展望或预期,估计对手的意图,从而倒后推理,决定自己这一步应该怎么走。</CLK><BR><BR>  这是一条线性的推理链:“假如我这么做,他就会那么做———若是那样,我会这么反击”,后面的步骤依此类推。也就是说,你怎么走棋,完全取决于对手的上一招。这在博弈论上叫做“倒推法”。<BR><BR>  在动态博弈中,存在明显的马太效应,也就是说凡是拥有较少的,连他仅有的那一点点也夺过来;凡是多的,就加给他,让他更多。比如在围棋上,就有“一招不慎,满盘皆输”的谚语,当然我们也要应用马太效应原理,在获得优势的情况能够保持优势,扩大优势,直至最后成功。<BR><BR><CLK>  而在同时行动的静态博弈里,没有一个博弈者可以在自己行动之前得知另一个博弈者的整个计划。在这种情况下,互动推理不是通过观察<NOBR oncontextmenu="return false" onmousemove=kwM(7) id=clickeyekey7 onmouseover="kwE(event,7, this)" style="COLOR: #6600ff; BORDER-BOTTOM: #6600ff 1px dotted; BACKGROUND-COLOR: transparent; TEXT-DECORATION: underline" onclick=kwC(event,7) onmouseout=kwL(event,this)>对方</NOBR>的策略进行,而是必须通过看穿对手的策略才能展开。</CLK><BR><BR>  要想做到这一点,单单假设自己处于对手的位置会怎么做还不够。即便你那样做了,你只会发现,你的对手也在做同样的事情,即他也在假设自己处于你的位置会怎么做。<BR><BR>  因此,每一个人不得不同时担任两个角色,一个是自己,一个是对手,从而找出双方的最佳行动方式。与一条线性的推理链不同,这是一个循环,即“假如我认为对方认为我认为……”。<BR><BR><CLK>  这样来看,<NOBR oncontextmenu="return false" onmousemove=kwM(5) id=clickeyekey5 onmouseover="kwE(event,5, this)" style="COLOR: #6600ff; BORDER-BOTTOM: #6600ff 1px dotted; BACKGROUND-COLOR: transparent; TEXT-DECORATION: underline" onclick=kwC(event,5) onmouseout=kwL(event,this)>定式</NOBR>是一系列纳什均衡的累计直至局部达到稳定的一种变化,直到一方认为可以根据形势选择任何变化或脱先而无局部受损之虞。由于定式是在大量实战基础上不断被验证并长期积累而成。</CLK></TD></TR></TBODY></TABLE>
页: [1]
查看完整版本: 从围棋定式谈纳什均衡(3)