支配された戦略を逐次削除

  • 投稿日:
  • by
  • カテゴリ:
 

 相手が選択する戦略によって、どの戦略が最大の利得を出すかが変化するゲームの場合、他の戦略すべてを支配できる戦略が存在しない場合がある。こうした場合、他の戦略から支配されている戦略(被支配戦略)を削除していくことで、残った戦略の組み合わせが支配戦略均衡である。支配戦略によるナッシュ均衡がある場合、消去によるものと一致する。

 例えば、プレイヤーP1はa1a2a3、プレイヤーP2はb1b2b3という戦略の選択肢を持っている場合、b3b2に支配されている(b2の方が常に利得が多い)のであれば、まず、b3を削除して考える。つまり、プレイヤーP2にとって、どんな組み合わせの場合でも、b2の方の利得が大きいので、b3という戦略選択肢は初めから無かったと考える。

 これにより、9つのマトリックスが6つになる。そこで今度は、プレイヤーP1の立場で考えると、a3a2に支配されているとすると、上記と同様にa3を削除することになる。このように、被支配戦略を次々に削除していくと、マトリックスは4つ、2つと減少していく。そして最後に、残った組み合わせの中から最適な戦略の組み合わせを見つけ出す。

 プレイヤーP1の戦略がa1a2、プレイヤーP2の戦略もb1b2という組み合わせの支配戦略の場合は、まず、P1の利得に注目する。この場合P2がどちらの戦略を選択しようが、P1はa1を選んだ方がより大きな利得が得られるという関係があるとき、a1は支配戦略ということになる。つまり、他の戦略を選ぶより有利であることを意味している。

 次に、プレイヤーP2の利得に注目すると、どちらの戦略を選択してもb2の戦略を選んだ方がb1戦略のとき以上に利得が得られるという支配関係があるか、あるいは弱支配関係にある場合は、P1にとっての最適戦略はa1、P2にとっての最適戦略はb2となるから、両社ともこれらの戦略を変更しても利得は減る。よって、(a1b2)が支配戦略均衡となる。

 つまり、支配された戦略を逐次削除するということの意味を論理的に説明するのは簡単ではないが、日常生活における意思決定の場面をイメージすれば、それほど難しくはない。すなわち、選択肢が思い浮かんだとすると、それによる相手の反応を予測すると、実際にとり得る選択肢は極限定されたものとなる。この取捨選択のプロセスのことなのである。