支配戦略と最適反応戦略

  • 投稿日:
  • by
  • カテゴリ:
 

 ゲーム理論は、個人ばかりではなく、企業や団体が意思決定をする際に、その意思決定によって得られることが期待される利得を検討するツールとして活用される。ゲームというからには、ルールがあり勝ち負けを問題にする形をとるが、このゲームは大きく分けて、非協力ゲームと協力ゲームがあり、1人対1の対戦の場合は、非協力(対立)ゲームである。

 この場合は、自分がとり得る戦略により、対戦者(相手)がどのように反応するかを問題にするので、その戦略により獲得でき利得を数値で表し、単純化しているところが、いかにもゲームらしいのだが、意思決定のために、あらゆる可能性を検討することで、MECEにものごとを整理できるという点で、交渉や説得など多方面に活用されている理論である。

 用いるツールは2×2のマトリックスからなる利得表で、その組み合わせを精査することで、彼我の利得を測定し、取りえる戦略のなかから、最適な戦略を選択するというものである。ここでの基本ルールは、自分も相手も、同じ情報を共有していることであり、利得表の中で不利な戦略を選択したが、それが正解であったような場合は対象外としている。

 2人ゲームにおいて、一方がある戦略をとると、他方がどんな戦略を選択しようと必ず有利になる場合がある。この場合の戦略を支配戦略と呼んでいる。そうすると、他のプレイヤーは、一方がとる支配戦略を前提にして、これに対応する最適な反応をすることになる。これが最適反応戦略と呼ばれるものであり、ゲームの解でもあるということになる。

 当然、2×2の利得表で、必ずしも一方にとって必ず有利な戦略があるという保証はない。その場合でも、どちらにとっても好ましくない戦略は避けなければならないと考えれば、自ずからその戦略は避けようとするはずであるから、これらの組み合わせを除くと、最適反応戦略はある。これがナッシュ均衡と呼ばれるもので、これもゲームの解である。

 なお、最大値が2つ以上ある場合は、それらの戦略はすべて最適反応戦略となるが、支配戦略は、他の戦略より必ず利得が高くなければならない。他の戦略と同じ利得では支配戦略とは呼べない。すなわち、逆の言い方をすれば、相手のすべての戦略に対して、最適な反応戦略となる戦略でなければ、支配戦略とは呼べないということになるわけである。