数IAの第3問の確率の問題を見てみよう。
この問題は「確率の問題」の形態をとってはいるが、確率の計算を公式に当てはめるだけ、という考え方をするのではなく、「アルゴリズム」とか「シミュレーション」という観点から問題を捉えることにしよう。現実の現象の解析、たとえば、自動車の運転席の窓ガラスが事故で割れるメカニズムとか、風に吹かれた落ち葉が散った先の地面における分布だとかは、その運動を規定する方程式を完全に解き切って、解析的な解(厳密解という)を手にすることが、多くの場合、困難だ。そこで、方程式を細切れに切って(つまり離散近似して)数値計算によるシミュレーションを行い、運動の概略を知ろうとする。この場合、運動の分岐は確率的に取り扱い、分岐のタイプを「アルゴリズム」という形で定式化する。
この問題では赤白の袋やら玉が登場するが、「赤白」を分岐のパターンとみなせば、シミューレションの一種だと考えることが可能だろう。たとえば、白玉、赤玉という代わりに、ガラスの亀裂が右に入る、左に入る、という具合に考えることは可能だ、ということだ。
能書きはこの辺でやめておこう。この問題では、取り出した玉は袋にまた戻す。つまり、特定の色を取り出す確率は変化しないという性質は、アルゴリズムの観点からは重要な性質なので、忘れないようにしたい。
サイコロはアルゴリズムの初期値の設定につかう。つまり最初に玉を取り出す袋の色を決めるためにだけ使う。それは3の倍数か否かだ。
確率の問題の定式化で役に立つ概念は「集合」の概念だ。アルゴリズムの分岐や分岐条件は、現実に発生する事象をすべて網羅する必要がある。考慮すべき事象に漏れがあると、想定外の過程が発生するたびにシミュレーションの質が下がってしまう。
まずは、サイコロの目という事象を考え、これをdとおこう。dは1から6の間の整数値をとる。この集合をDと書こう。\(D=\{d=1,2,3,4,5,6\}\)。Dは2つの部分集合に分かれ、それは三の倍数の集合\(T=\{3,6\}\)と、その補集合\({T}^c=D-T=\{1,2,4,5\}\)だ。
\(D=T\oplus{T}^c=\{3,6\}\oplus\{1,2,4,5\}\)と直和の形に書ける。直和というのは、2つ(以上)の集合の間に重なりがない、つまり\(A\cap B = \phi\)が成り立つときの、和集合\(A\cup B\)のことだ。AとBは「排反事象」の関係にある、ともいう。
確率は
\[
P(T) = \frac{2}{6} = \frac{1}{3}, \\
P(T^C) = P(D-T) = 1 - \frac{1}{3} = \frac{2}{3}
\]
と書ける。当然ながら\(P(D) = P(T)+P(T^C)=1\)だ。
最初にサイコロを振る理由は、その結果を用いて、紅白の袋のどちらから玉を取り出し始めるか決めるためだ。袋の色の初期値決めみたいなものだ。n回目の取り出しに使う袋の色をC(n)と表せば、C(1)を決めるためにサイコロを振るということだ。\(T\)の場合は白い袋、\(T^C\)の場合は赤い袋を選ぶことになる。
プログラムでこのアルゴリズムを表せば、
if(\(T\))
C(1) = W
else if (\(T^C\))
C(1) = R
といった感じだろう。
当然ながら、
白い袋を選ぶ確率 \(=P(T)=\frac{1}{3}\),
赤い袋を選ぶ確率\(=P(T^C)=1-P(T)=\frac{2}{3}\)
となる。
さて、赤い袋には赤:白=2:1、白い袋には赤:白=1:1で入っている。この事象をどう記号に表すかは、実は重要なポイントだ。当初は袋の色で事象を分けて、赤い袋ならR、白い袋ならWとしていた。これは、上のプログラムの内容を踏襲している。しかし、このやり方が色々と問題を起こすことはやってみるとわかる。「サイコロの目」という事象Dの次に問題となる事象は、「玉の色」であり、「袋の色」としない方が頭の中を整理しやすい。つまり、この問題は2つの事象が独立でない場合の「条件付き確率」の問題であり、Dに応じて「玉の色」という事象の確率が変わってくることを認識した方がいい。「玉の色」という事象をbで表す。bはr(赤)あるいはw(白)の二種類の値だけを持つ。この集合をBであ表すことにする。
\[B=\{b=r,w\}=R(r)\oplus W(w)\]
Bという集合がDの結果によって変わることを表すために、\(B_W, B_R\)という具合に識別することにしよう。前者が三の倍数、すなわちTが発生した場合の集合Bであり、後者がそうでない場合、つまり\(T^C\)の場合の集合Bに対応する。これらの集合の違いを際立たせるには、色が同じものには番号をつけて識別できるようにしておくのが良い(量子力学では識別できなくなるが、この問題で扱う玉は古典物理のそれだとしよう...)。つまり、
\[
B_R =\{b=r_1,r_2, w_1\}=R_R(r_1,r_2)\oplus W_R(w_1), \\
B_W=\{b=r_1, w_1\}=R_W(r_1)\oplus W_W(w_1)
\]
この表現は、「条件付き確率」の概念にフィットする。つまり、n=1の時の、赤い袋で赤い玉を出す確率というのは、Tが発生した下での赤玉が出る確率であり、それはP(r|T)と書くべきだろう。もちろん、それは2/3である。
条件付き確率をまとめておくと、
\[
P(r|T)=\frac{2}{3}, \quad P(w|T)= \frac{1}{3}\\
P(r|T^C)=\frac{1}{2}, \quad P(w|T^C)=\frac{1}{2}
\]
となる。
条件付き確率の引数となる「事象」は通常の「事象」とちょっと違う感じがする。例えば、A|Bというのは、「Bが起きた上でのAという事象」という風に表現できるが、\(A\cap B\)、つまり「AかつBという事象」とは違うものであることに注意しないといけない。前者の場合は、もうBが起きてしまっていることが仮定されている。つまり、「赤い袋を選んだ場合に、赤玉が出てくる確率」という類の確率だ。赤い袋を選ぶ過程に確率的なものが入っていないことが重要だ。一方で、\(P(A\cap B)\)の計算には、Bが起きるかもしれないし、起きないかもしれないしという確率的な過程が入り込み、その上でAが起きる確率を考えるために、\(P(A|B)\)が必要となる。結局は問(1)の場合をよく理解すると、具体的な「感覚」が身につくだろう。
問(1)は、最初のステージn=1での話である。サイコロによって決まった袋の色に対して、何色の玉が出るかを考える問題だから、典型的な条件付き確率の問題だ。しかも、最初の事象Dの結果によって、特定の色が出る確率が変化するから、DとBが独立でない場合になっている。つまり、DとBの組み合わせ事象DBが、集合の直積\(D\otimes B\)とは表せない場合に相当する。問題となるのは、\(P(r|T)\)を答えるのか、それとも\(P(R\cap T)\)を答えるのか、という判断であるが、問題文をよく読むと「赤い袋が選ばれ」とあるから、赤い袋が選ばれる過程に確率的な過程が入り込んでいる。したがって、計算するのは、後者、つまりDとBの積事象の確率\(P(R\cap T)\)である。したがって、積事象の公式により、
\[
P(R\cap T) = P(r|T)P(T) = \frac{2}{3}\cdot\frac{2}{3}=\frac{4}{9}
\]
となる。同様に、n=1で白い袋が選ばれ、そこから赤い玉を取り出す確率は、
\[
P(W\cap T^C)=P(w|T^C)P(T^C) = \frac{1}{2}\cdot\frac{1}{3} = \frac{1}{6}
\]
と計算される。
次の問(2)は、袋の色を考える事象の問題で、「2回目が白い袋」である確率を計算せよ、というのだが、2回目が白袋、というのは「1回目が赤袋で2回目が白袋」という事象と「1回目が白袋で2回目も白袋」という事象の2つの合計であるから、それぞれの確率の和になる。しかし、2回目の袋の色が白になるためには、1回目に取り出した玉が白でないといけないから、より厳密に書くと、「1回目が赤い袋となり、そこで白い玉を取り出す確率」+「1回目が白い袋となり、そこで白い玉を取り出す確率」ということになる。つまり、
\[
P(T^C\otimes R_w)+P(T\otimes W_w) = P(T^C)P(R_w) + P(T)P(W_w) =
\frac{2}{3}\cdot\frac{1}{3} + \frac{1}{3}\cdot\frac{1}{2} = \frac{7}{18}
\]
(3)にいこう。1回目の操作で白玉を出す確率pと2回目の操作で白玉を出す確率wの間には線形関係\(w=kp+\frac{1}{3}\)が成り立つそうで、その比例係数kを求める問題である。
2回目の操作で白玉を出すというのは、(i)2回目に白い袋で白玉を出す場合と(ii)2回目に赤い袋で白玉を出す場合の2通りがある。
(i)の場合、1回目がどちらの袋であろうとそこで白玉を出さないと、2回目に白い袋から取り出せないので、\(p\cdot \frac{1}{2}\)という確率になる。
(ii)の場合は、1回目に赤玉を取りだし、2回目に赤い袋で白玉を取り出す確率となるので、\((1-p)\cdot\frac{1}{3}\)という確率になる。
したがって、2回目に白玉を取り出す確率\(w\)は、
\[
w = p\cdot\frac{1}{2} + (1-p)\cdot\frac{1}{3} = \frac{1}{6}p + \frac{1}{3}
\]
となる。 つまり\(k=1/6\)となる。
1回目の操作で白玉を出す確率pは、白袋で白玉を選ぶ確率\(\frac{1}{3}\cdot\frac{1}{2}\)と、赤袋で白玉を選ぶ確率\(\frac{2}{3}\cdot\frac{1}{3}\)の和になるので、
\[
p = \frac{1}{6} + \frac{2}{9} = \frac{7}{18}
\]
と求まるが、これは(2)の答えと一致している。(2)は「2回目に白い袋」の確率なので、1回目に白玉を引いた確率、つまりpと同じ意味になっている。これに気づけば、上の計算は必要なくなる。いずれにせよ、これをwとpの関係式に代入すると、
\[
w = \frac{1}{6}\cdot\frac{7}{18} + \frac{1}{3} = \frac{43}{108}
\]
となる。
続けて、3回目に白玉が取り出される確率uは、2回目に白玉が取り出される確率wを用いて、\(u = \frac{1}{6} w + \frac{1}{3}\)と表せるので、\(w=43/108\)を代入し、\[u=\frac{259}{648}\]という結果を得る。
確率の問題では、センター試験でも結構えげつない数字が出てくるのをみて、少し安心した。いつでも、教科書に出てくるような簡単な数字に抑えるのはやはりちょっと無理のようだ。受験生は、こういう数字が出てきても驚かないように心の準備をしておくべきだろう。
さて、いよいよ最後の(4)にとりかかろう。条件付き確率の計算法の確認問題で、内容は簡単だ。が、計算すべき分数が複雑になるので、計算間違いに気をつけたい。
2回目の事象が白玉となる場合というのは、(i)白い袋で白玉を取り出す場合と、(ii)赤い袋で白玉を取り出す場合の2通りあるが、この場合はすでに問(3)で考察済みで、前者は\(p/2\)、後者は\((1-p)/3\)となる。したがって、この条件のうち、白袋で白玉を取り出す条件付き確率は、
\[
P(w|W)=\frac{p/2}{p/2 + (1- p)/3} = \frac{p/2}{p/6+1/3}
\]
と表せ、これに上で求めた\(p=7/18\)を代入すると\(P(w|W)=\frac{21}{43}\)を得る。
一方、3回目の事象が白玉だったとき、それが初めてだった条件付き確率というのは、3回目の事象が白玉であるすべての事象をひとつひとつチェックしていけば基本的には解ける。ただ、(3)で3回目が白玉だった確率が259/648で与えられているから、条件付き確率の分母にはこの数字がくるはずである。とすると、1回目に赤袋で赤玉あるいは白袋で赤玉、2回目に(赤袋で)赤玉、そして3回目に赤袋で白玉が出る確率は、
\[
\left(\frac{2}{3}\cdot\frac{2}{3}+\frac{1}{3}\cdot\frac{1}{2}\right) \frac{2}{3}\frac{1}{3} = \frac{11}{81}
\]
と計算されるので、答えは
\[
\frac{\frac{11}{81}}{\frac{259}{648}} = \frac{88}{259}
\]
となる。