統計検定2級の過去問が面白い。
サークルの部室にいたS君は、隣の部室にお菓子をもらいに行った。隣の部室にはT君とU君がいて、自分たちと腕相撲を3回して2連勝した時点でお菓子をあげるという。
S君の対戦順序には2つの選択肢があり、「T君-U君-T君」、または「U君-T君-U君」の順である。
S君がT君に勝つ確率をp、U君に勝つ確率をqとし、とする。ただし、各腕相撲の試合の勝敗は互いに独立とする。
S君は、U君なら勝ちやすいと考えて、U君とより多く対戦する「U君-T君-U君」の順が有利だと考えた。
この選択は正しいか?
-- 統計検定2級2018年6月問題より
確かによりT君よりU君のほうが勝てる確率が高い。パッと見だと「U君-T君-U君」のほうが良さそうに思える。僕もその選択は正しいを選んでしまった。
だが正解は「T君-U君-T君」の選んだほうが有利、だった。
それぞれの順で2連勝する確率を計算してみる。
ここで間違えてはいけないのは「2回勝つ確率」ではなく「2連勝する確率」を計算するということ。間違うと結果も異なってしまう。
一回戦(T君)と二回戦(U君)で勝って2連勝する確率は、
一回戦(T君)で負けて二回戦(U君)と三回戦(T君)に勝って2連勝する確率は、
よって 「T君-U君-T君」の場合に2連勝する確率は、それぞれを足して
一回戦(U君)と二回戦(T君)で勝って2連勝する確率は、
一回戦(U君)で負けて二回戦(T君)と三回戦(U君)に勝って2連勝する確率は、
よって「U君-T君-U君」の場合に2連勝する確率は、それぞれを足して
「T君-U君-T君」の確率から「U君-T君-U君」の確率を引いてみて、答えがプラスなら「T君-U君-T君」の確率のほうが高く、マイナスなら「U君-T君-U君」の確率のほうが高いということになる。
より、qの値はpの値よりも高いのでは必ずプラスとなりもプラスとなる。
よって「T君-U君-T君」で2連勝する確率のほうが高いということになる。
直感的な感覚とは真逆の結果になるのが不思議。実際に試せるようなシミュレーションがあったら面白そう。
そのうち作ってみようと思う。
腕相撲をそれぞれの順序でやってみて2連勝した回数をカウントできるようにしてみた。
強い相手と対戦すると2連勝する確率は高くなる?
理論上は「T君-U君-T君」のほうが高いといっても、なぜそうなるのか腑に落ちていなかった。
実際に試してみてようやく直感的に理解できた。強者に挑めるチャンスが多いから2連勝できる確率も高くなるということだった。
また、対戦順序や対戦回数が異なると結果もまったく違うものとなる。それも試せるように順序や勝率などいろいろな条件で実行できるように設定変更できるようにしてみた。