同時進行ゲーム{４．戦略の均衡点}

　絶対優位の戦略と絶対劣位の戦略による単純化を完全に行うと、ゲームはそれ以上簡単にできないレベルに至り、どの戦略をとるかはいくら考えても堂々巡りに陥る。自分にとって最善の戦略は、相手がどう出るかにかかわっている。以下で堂々巡りを解決する方法を考察する。まずタイムとニューズウィークの価格戦争に戻って、今度は雑誌の価格を二ドルか三ドルに限るのではなく、どんな価格でもむ設定できるようにしよう。

タイム経営陣は、ニューズウィークの価格に対抗して最善の価格設定をしなければならない。両誌には、価格に関係なく購入してくれる固定的な読者と、価格によっては購入する流動的な読者がいるとする。仮に何らかの理由でニューズウィークの経営陣が価格を一ドル、すなわち生産コストに等しいレベルにした場合、タイムの経営陣は、この利益ゼロの戦略をまねしようとはせず、それよりは高い価格たとえば二ドルに設定して、固定的な読者への販売から利益を得ようとするであろう。

ニューズウィークが高い価格をつけた場合にはタイムも価格を上げるだろうが、上げ幅を小さくして競争上の有利さを得ようとするかもしれない。ニューズウィークの価格が上がった場合のタイムの最善の対応は、一ドルの上昇に対して自分の価格を五〇セント上げることであるとしよう。そのとき、ニューズウィークの価格に対するタイムの最善の価格の関係は図3-11（省略）のグラフのようになる。

　両誌ともコスト、固定的読者数及び流動的読者への訴求力などが全く同じであると仮定すると、タイムの価格に対するニューズウィークの最善の価格の関係も同様のグラフで表わせる。ここで両誌の経営者は別々に思考をめぐらし、例えばタイムの経営者はこう考える。「もし相手が一ドルにすればこちらは二ドルにしよう。しかしそのことを相手が悟れば相手はこちらの二ドルへの最善の対応である二・五ドルでくるだろう。だからこちらはそれに対して二・七五ドルで応じなければならない。しかし相手は...」これはいつ終わりになるのか。答えは三ドルである。

ニューズウィークが三ドルでくるとタイムの経営陣が予測するとき、タイムにとっての最善の対応価格は三ドルになる。もちろんニューズウィーク側から見ても同様である。これで堂々巡りは収斂する。このことを別のグラフ図3-12（省略）で説明してみよう。両誌の対応を一つのグラフに描くと、二本の直線は三ドルのところで交わる。この点で、両者の行動はそれぞれ他のプレーヤーに対して最善となる。

他者の行動を前提にすれば、どちらも自分の戦略に変更を加える理由はない。ゲーム理論では、このような状態を均衡という。この考え方は、プリンストン大学の数学者、ジョン・ナッシュが発展させたので、ナッシュ均衡と呼ばれている。同時進行ゲームを解決するための最後のルールはナッシュの考え方から導きだされる。

《ルール4：絶対劣位の戦略を消去し、絶対優位の戦略を見つけようとしても解決に至らない場合は、ゲームの均衡点を探せ》

これが、シャーロック・ホームズとモリアーティ教授がお互いの心を読みあえた理由である。このルールには若干の説明が必要だ。なぜゲームのプレーヤーは均衡点へと導かれなければならないのだろうか。これにはいくつかの理由があげられる。重要なものを取り上げて考えてみよう。第一に、結論の出ない堂々巡りを避ける必要がある。こちらがこうであれば相手はこうするだろうからこちらは...」という推理を安定状態にしなくてはならない。

均衡によって、相互の行動についての予測は一貫性をもったものとなり、各プレーヤーは的確に相手の行動を予測したうえで、自らの最善の戦略を選択できる。第二に、均衡戦略の利点は、ゼロサムゲームで現れる。これは当時者の利害は完全に対立しており、このようなゲームでは、均衡点においてだけ、プレーヤー間の搾取が避けられる。ゼロサムゲームでは、相手もこちらの戦略に対して最善の反応をしてくるということを考慮して、こちらも自分の戦略を立てるのだ。

第三の理由は実用性からくる。均衡によって解釈されるゲームは数多く存在する。均衡の手法を用いて、さまざまなゲームをこの本の中で論じていく。それらの例で均衡の考え方を使って、ゲームの結果と行動のルールを考えてみてほしい。抽象的な議論をするより、均衡のメリットの大きいことがわかるだろう。最後に、均衡の概念について謝った解釈をする恐れがあるので言及しておこう。ある結果が均衡状態であるとしても、必ずゲームの全プレーヤーにとって最善であるとはかぎらないし、また、社会全体からみて最善であるともいえない。このような評価はまた別の問題で、それへの答えは状況に応じて異なったものとなろう。

第４、５章ではこのような問題例を取り扱う。