2019年2月16日土曜日

阪大(2018)問題2: 因数定理と2次式(2)

問(2)は、f(x)が因数分解できるとき、\(a\geqq 4\)を示せ、
というもの。

まずは、f(x)の因数分解が\(c,c^{-1}\)のdualityにより、
\[
f(x) = (x-u)(x-u^{-1})(x-v)(x-v^{-1})
\]
となることは問(1)の結果から言える。また\(u,v>0\)も問(1)の結果として再利用する。

上の式を展開すると、
\[
f(x) = x^4 - (p+q)x^3+(pq+2)x^2-(p+q)x + 1,
\]
となる。 ただし、
\[
p=u+\frac{1}{u}, \quad q=v+\frac{1}{v}
\]
とした。\(u,v>0\)であることは、(1)で確認済みだが、p,qの範囲については調べないといけない。\(p=p(u), q=q(v)\)という関数だと思って解析すればよい。もちろん、こういうのは数値解析すれば一発なのだが、一応「マニュアル方式」もやっておこう。量子力学の1次元問題などでよくやる内容だから、やっておいて損はないだろう。

まずは漸近形である。つまり\(u,v>0\)の場合だと、\(u,v\rightarrow 0\)と\(u,v\rightarrow\infty\)という2つの極限領域で関数がどのように振る舞うかを調べる。明らかに、
\[
u+\frac{1}{u} \rightarrow u \quad (u\rightarrow \infty)\\
u+\frac{1}{u} \rightarrow \frac{1}{u} \quad (u\rightarrow 0)
\]
であることがわかる。つまり、原点付近で\(+\infty\)に発散し、(正の)無限遠でx軸に収束するように漸近するという大雑把な形状だ。その間の領域で極値を持つかどうかは、微分してみればすぐにわかるが、2つの漸近形であるuと1/uの競合ということになるから、きっとu=1/uが成立する辺りで極小値を持ちそうだというのは直感的に想像がつくだろう。

微分すると、
\[
\frac{dp}{du} = 1-\frac{1}{u^2} = \frac{(u-1)(u+1)}{u^2}
\]
であるから、増減表を作れば、u>0の領域では(予想通り)u=1で極小値2を持つことがわかる。つまり、\(u,v>0\)という定義域は、変数をp,qに書き変えると\(p,q\geqq 2\)に変わるということだ。

さて、gnuplotで表示してみよう。

縦軸がp(q)、横軸がu(v)に対応。
 f(x)のそもそもの定義と比べると
\[
a=p+q,\\
b=pq+2
\]
という対応があることがわかる。つまりaおよびbは、pとqの2変数に依存する関数 であるということだ。p,qは独立だからpとqの最小値2をそれぞれ代入すれば
\[
a\geqq 4 (=2+2)
\]
ということが示せる。

最後の問題に取り掛かろう。
問(3) \(a=5\)の場合、f(x)が因数分解できるような自然数bの値を求めよ。

問(1)-(2)の結果は全て使える。
\[
b=b(p,q)=pq+2\\
a=p+q=5\\
p,q\geqq 2
\]
である。まずはp,qが2より大きいという制限がどのような意味をもつか考えよう。pとqはa=5という条件により、今回は「束縛」(数学用語では拘束条件という)が入る。p=2のとき、q=3となる。これは許される。(同様にq=2のとき、p=3である。) pをもう少し増加してみよう。p=3のとき、q=2となり、これはギリギリOKだ。pがこれ以上大きくなると、qは2より小さくなって条件から外れてしまう。つまり、
\[
2\leqq p,q \leqq 3
\]
という制限がつくということだ。この制限を忘れないようにして、bからqを消去して、pの二次式として表し、bの最大最小の問題を考えよう。
\[
b=p(5-p)+2 = -\left(p-\frac{5}{2}\right)^2+\frac{33}{4}
\]
となるから、\(2\leqq p \leqq 3\)の範囲に(上の凸の)放物線の頂点は含まれている。
頂点の値は\(8 < 33/4 < 9\)であるから、bが自然数だというなら、まずは1,2,3,4,5,6,7,8に限られることがわかる。p=2のときb= 8。p=3のときもb=8。したがって、pの区間の中でbが取りうる自然数は8に限られる。つまり、答えは8となる。

postscriptで図示してみた。
座標軸において、Xはp、Yはbを表す。





2019年2月15日金曜日

阪大(2018)問題2: 因数定理と2次式

問題2は比較的解きやすい。が、色々な変数を導入して、式を書き換える作業が必要になる。力学でいう「カノニカル変換」みたいなものだ。いちばん解きやすい変数を選び、方程式が解きやすい形になったら、最後にオリジナルな変数に立ち返る必要がある。この問題では、それは新しい変数の定義域を注意深く決めるという作業に相当する。この点に気をつけて解いてみよう。

与えられる式は4次式である。
\[
f(x) = x^4 - ax^3 + bx^2-ax+1
\]
ただし、\(a,b>0\)は正の実数 である。

(1) \(f(x)\)が\(x-c\)で割り切れるとき、\(x-\frac{1}{c}\)でも割り切れることを示すこと。また、\(c>0\)も証明すること。

さっそく、因数定理を使う。
\[
f(c) = c^4-ac^3+bc^2-ac+1 = 0
\]

cの正負を決めよ、ということだから、cの偶数べきの項と、奇数冪のこうでまとめてみる。
 \[
c^2(c^2+b)- ac(c^2+1) + 1 = 0
\]
第二項にcが残り、残りはcの自乗の形となった。自乗部分は必ず正になることを利用し、次のように変形する。
 \[
c=\frac{c^2(c^2+b)+1}{a(c^2+1)}
\]
\(a,b>0\)だから、上式右辺は正の量であるから\(c>0\)は証明された。

次に、\(f(c)=0\)の両辺を\(c^4\)で割ると、
\[
1-a\frac{1}{c}+b\frac{1}{c^2} - a\frac{1}{c^3} + \frac{1}{c^4} = 0
\]を得るが、左辺は\(f(1/c)\)に等しいから、\(x-\frac{1}{c}\)に関する因数定理とみなせる。したがって、f(x)は\((x-c)(x-\frac{1}{c})\)を因数に持つ。

上の恒等式が成立する理由は、f(x)の係数を並べて書いてみるとはっきるする。すなわち
\[
1, -a, b, -a, 1
\]
となり、2次の項に対して対照的な配置になっている。全体で4次式だから、全体を4次の単項式で割ると、

4次の項⇄0次の項、 3次の項⇄-1次の項、
2次の項⇄-2次の項、
0次の項⇄-4次の項、1次式⇄−3次の項、

という具合に、符号を除いて「対称的な」関係がある。これを「反対称」と呼ぶべきかどうかはともかく、綺麗な対応関係が存在する。
この問題は、つまり
\[
c \leftrightarrow c^{-1}
\]
という「対称性」が隠れたキーワードとなっていると感じた。

\(f(c)=0\)と\(f(c^{-1})=0\)の式をもう一度書き下してみよう。今度は、「べき」の形を採用する。
\[
f(c) = c^4 -a c^3 + bc^2 -ac + 1 = 0, \\
f(c^{-1}) = c^{-4} -a c^{-3} + bc^{-2} - ac^{-1} + 1 =0
\]
冪数の正負が変わっただけで、似たような構造をもっていることがわかるだろう。

これと似たような性質は、2次方程式の複素解にみられる。\(\alpha=a+bi\)が二次方程式の解になっているならば、\(\alpha^*=a-bi\)も解である、という性質である。ただし、a,bは実数、iは純虚数である。これは、二次方程式\(x^2-2ax+a^2+b^2=0\)の解であるが、
この方程式全体の複素共役をとっても、\((x^*)^2-2a(x^*)+a^2+b^2=0\)となり、同じ形が保たれるから、複素共役も解となることがわかる。これは、一般のn次方程式(ただし、係数は実数でないとだめ)にも成り立つ。

n次方程式の性質として重要な基本事項は、それは複素解を含めれば、n個の解を持つ、という性質だ。今考えているのは4次関数だから、f(x)=0は4つの解をもつ。面白いのは、その全てが「正の実数」となり、複素共役とはちょっと違うが、似たような「ペア」(c,1/c)で現れるという点だ。

ペア(対)に関しては、東大のランダムウォークの問題でも議論したが、今回のような逆数を用いたペアは、「duality」という概念でよく物理にも登場する。よく知られているのが、電磁気学の真空の誘電率\(\epsilon_0\)と真空の透磁率\(\mu_0\)だ。前者は電場\(\boldsymbol{E}=-\boldsymbol{\nabla}\phi-\frac{\partial}{\partial t}\boldsymbol{A}\)を特徴付ける量であり、後者は磁場\(\boldsymbol{B}=\boldsymbol{\nabla}\times\boldsymbol{A}\)を特徴付ける。例えば、静電場と静磁場を記述する微分方程式は、双方ともにポワソン方程式で記述されるが、透磁率と誘電率の入り方が「逆転」する。
\[
\boldsymbol{\nabla}^2\phi=-\frac{\rho}{\epsilon_0}\\
\boldsymbol{\nabla}^2\boldsymbol{A} = -\mu_0\boldsymbol{j}
\]
電場のセクターと磁場のセクターで、\(\epsilon_0^{-1} \leftrightarrow \mu_0\)という対応があれば、上の2つの式は実に綺麗な対称性をもっているように見える。

東大二次試験(2017)問2: ランダムウォーク

ランダムウォークの理論(酔歩理論ともいう)は、物理学のみならず、コンピューターシミュレーションでもよく利用される模型だ。物理学では、アインシュタインが1905年にブラウン運動の解析に利用し、「原子の実在」を決定づけたことでよく知られる。

ただ、ノーベル賞をもらったのは、アインシュタインの理論に基づいて、実験を行なったペランだった。アインシュタインは、いろいろな理由で(たとえば、妬みや経歴など)色々と損をしていると思う。1905年に発表したアインシュタインの論文は、ブラウン運動のみならず、プランクの光量子理論を光電効果に適用し「量子」の実在を証明した論文、そして特殊相対論の論文の3つあり、それぞれが物理学に革命を引き起こしたことで知られる。1905年は「奇跡の年」と言われるくらいだ。アインシュタインがノーベル賞を受賞したのは、光量子に関する2つ目の業績だけで、残りの2つは受賞対象から外された。誰もが感じるのは、これらの論文一つ一つにノーベル賞を授与してもよいのではないか?という疑問だろう。

問題では、デカルト座標を離散化した「格子」の上で、確率的に移動する点の位置を考える。現代物理では「格子」というのは重要な概念だ。というのは、複雑な問題は数値計算で研究する場合が増えているからだ。例えば、Lattice QCD(格子量子色力学)は、強い核力に従うクォークやグルーオンの物理を、格子化した4次元時空で取り扱う数値計算物理だし、強相関物理や磁性体の模型であるイジング模型でも格子は登場する。

格子の上を確率的に運動するのがランダムウォーク模型であるが、こちらはさまざまな身の回りの現象に適用されてきた。最近でも、カオス力学とか、多体問題のシミュレーションに適用されている。

原点から出発した点が6秒後に到達する場所に関する問題だ。(1)ではy=xつまり(m,m)に来る確率、(2)では原点にいる確率を計算させている。色々な解き方があると思うが、私が考えた方法だと、(2)の方が簡単に計算できる。

x方向に1進む事象をm, -1進む事象を-mと表すことにしよう。同様に、y方向に関してもn, -nという事象を導入しよう。6秒全体の事象は、6文字で表すことができるから、○○○○○○となり、○の中には(m,-m,n,-n)のいずれかが入る。6秒経っても原点に留まるということは、±のペアが3つあるということだ。例えば、(m,-m,-n,n,m,-m)は原点にとどまる事象の一つだ。この場合は、mのペアが2つ、nのペアが1つ、という分類となる。
mに着目すると、(i)mのペアが3つの場合、 (ii)mのペアが2つの場合、(iii)mのペアが1つの場合となるが、もう少し丁寧に書くと、
(i)   3 m-pairs + 0 n-pair,
(ii)  2 m-pairs + 1 n-pair
(iii) 1 m-pair   + 2 n-pairs
(iv) 0 n-pair    + 3 n-pairs
となるが、(i),(ii)と(iii),(iv)は、(m,n)の交換によって対応がつくので、(i),(ii)の場合の数を数えて2倍すれば(i)-(iv)の場合の数の総数となる。

(i) 3 m-pairsの場合。6つの○の中に、m,m,m,-m,-m,-mを割り当てる場合の数を計算すればよい。それは明らかに\(\frac{6!}{3!3!}\)で与えられる。

(ii) 2 m-pairs+1 n-pairの場合、6つの○の中にm,m,-m,-m,n,-nを割り当てる場合の数を計算する。まず、6つの○の中に2つのmを入れる場合の数\(\frac{6!}{2!4!}\)を数え、次に残りの4つの○の中に-mを入れる場合の数\(\frac{4!}{2!2!}\)をかけ、最後にn,-n、および-n,nを最後の2つの○に入れるので2倍する。すなわち、
\[
\frac{6!}{2!4!}\cdot \frac{4!}{2!2!}\cdot 2
\]
が求める場合の数となる。

(i)と(ii)は排反事象だから、足し算すると200となる。(m,n)交換の分を考慮して、さらに2倍すると原点に留まる場合の数は400通りとなる。格子点から4つの方向に移動する確率はそれぞれ等しく1/4だから、ある格子点(m,n)に6秒後にいる確率は\((1/4)^6\)となる。したがって、原点に残る確率は
\[
2\left(\frac{6!}{3!3!}+\frac{6!}{2!4!}\cdot\frac{4!}{2!2!}\cdot 2\right)\cdot\left(\frac{1}{4}\right)^6 = 400\cdot \frac{1}{4^6} = \frac{25}{256}
\]
で与えられる。

問(1)に戻ろう。上のやり方を拡張するだけでよい。まずはy=x上で到達できる最遠の地点は(3,3)あるいは(-3,-3)であることはすぐにわかる。したがって、考えるのは(±3,±3),(±2,±2),(±1,±1),(0,0)の7通りであることがわかる。ただ、最初3つのパターンは+/ーの反転に対して対称的な関係にあるから、正の場合だけを数えてから2倍すればよい。

[ケース0] (0,0)の場合。この場合は、すでに(2)で考察した。400通りある。

[ケース3] (3,3)の場合。この場合は(m,n)のペアを3つ使って○を埋めることになる。
したがって、[m,m,m,n,n,n]を6つの○に割り当てる場合の数を計算することになるので、
\[
\frac{6!}{3!3!} =20
\]
となる。

[ケース2] (2,2)の場合。今度は(m,n)のペアを2つ使う。残りは(+,-)ペアになるが、mのペアとnのペアの二種類がある。最初の場合は[m,n,m,n,m,-m] = [m,m,m,n,n,-m]を6つの○に割り当てる場合の数となり、これはm⇄n交換の対称性により、もう一つのペア、つまりn-pairの場合と同じ数になる。したがって、
\[
\frac{6!}{3!3!}\cdot\frac{3!}{2!} \times 2 = 120
\]
を得る。

最後に
[ケース1](1,1)の場合。(m,n)pairは一つだけ。残りは(+,-)ペアとなるが、2 m-pairs, 2 n-pairs, 1m-1n pairsの3通りある。最初の場合は[m,n,m,-m,m,-m] = [m,m,m,-m,-m,n]となる。これは2 n-pairsケースと同じ数になるから、
\[
\frac{6!}{3!3!}\cdot \frac{3!}{2!} \cdot 2 = 120
\]
次に、1m-1n pairsの場合は[m,n,m,-m,n,-n] = [m,m,n,n,-m,-n]であるが、この場合の数は
\[
\frac{6!}{2!4!} \cdot \frac{4!}{2!2!}\cdot 2 = 300
\]
となる。

ケース0-3までの場合の数を足し合わせる(ただし、ケース-1,-2,-3の場合を考慮し、ケース0以外の場合の数は2倍する)と、
\[
400 + 2(20 +120+300) = 1280 = 4^4\cdot 5
\]
を得る。したがって、y=xに留まる確率は
\[
\frac{4^4 \cdot 5}{4^6} = \frac{5}{16}
\]
となる。■

プラスマイナスのペア(対)を考えるというのは、超伝導を記述するBCS理論や、ヘリウム3の超流動を記述するLeggett理論などで導入されている。これらの理論では、電子やフェルミオンのスピンの+/ーに関してのペアを考える(クーパーペアという)。「対相関」、pair correlationというのは、現代物理、特に凝縮系の物理(物性のみならず、原子核や素粒子にも適用される)で非常に重要な役割を果たす。自発的対称性の破れを考案し、ノーベル賞を受賞した南部陽一郎先生の理論は、素粒子(π中間子など)に質量が発生する機構を解明した理論だが、この理論を思いついたきっかけは、対相関を導入し超伝導を記述する方程式と、電子などフェルミオンの相対論的量子力学を記述するディラック方程式が、数理的に類似性を持っていることに気づいたことである。この発見を報告した南部先生の論文を初めて読んだ時、非常に感動したものである。

この問題は東大の入試問題としては非常に簡単だと思うが、対の考えやその他の概念が盛りだくさんに詰め込まれていて、物理を志す者には親近感が湧いてくるはずである。

2019年2月12日火曜日

東大二次試験(2017)問題1: ボルツァーノーワイエルシュトラスの定理の応用

大学の解析学で習う項目に、ボルツァーノーワイエルシュトラスの定理というのがある。数学科に進んだ人なら覚えているかもしれないが、物理学科に進んだ私には霞の中にぼんやりと浮かぶ提灯の火のように感じられる...などと、言い訳をいってもしかたがない。要は、その詳細な概要は忘れてしまった。2017年の問題を解いてみると、「開区間における最大値、最小値の存在」についての考察が必要になることがわかる。そこで、久しぶりにこの定理に出くわしたというわけだ。正確にいえば、直接使うのは「最大値最小値の定理」という定理だが、この定理の心幹にボルツァーノーワイエルシュトラスの定理がある、という位置付けだ。

今回の問題で利用するのは、「開区間においては、最大値、最小値の存在は担保できない」という連続関数の性質だ。この講義ノート(p.24の定理2.2.9のコメント文)にもはっきり書いてあるように、開区間で単調に変化する関数は最大値、最小値を持たない!たとえば、\(-1<x<1\)で定義された関数\(f(x)=x\)は最大値も最小値も持たないのだ。ただ、極限値として\(f(x)\rightarrow 1 (x\rightarrow 1)\)とか、\(f(x)\rightarrow -1 (x\rightarrow -1)\)を考えることはできるから、この関数の値域に上限と下限がある、\(-1 < f(x) < 1\)ということはいえる。 しかし、最大値も最小値もこの開区間には存在しないのだ。もちろん、関数の定義域を閉区間\(-1\le x \le 1\)に変更するとこの関数f(x)=xは最小値-1、最大値+1を持つ。

まずは、この問題の前半部分をみてみよう。前半部分には最大値最小値定理は登場せず、むしろフーリエ級数展開のような式が与えられる。

問題1(2017)
実数\(a,b\)を用いて、関数\(f(\theta)\)を次のように与える。\[ f(\theta) =\cos3\theta + a\cos2\theta + b \cos\theta,\] また\(0<\theta < \pi\)の領域で定義される関数\(g(\theta\)を次のように与える。\[ g(\theta) = \frac{f(\theta)-f(0)}{\cos\theta - 1} \]このとき,以下の問(1)-(2)に答えよ。

というのが本文である。

f(x)は偶関数のフーリエ級数展開もどき、のような関数に見える。ただ、有限項しか含まないので、「フーリエ多項式」と表現するべきだろうか?\(x=\cos\theta\)とおくやり方は、量子力学や電磁気学で出てくる特殊関数の一つ「ルジャンドル多項式」の扱いでよくみられる。ルジャンドル多項式に関しては、別の機会で詳細に論じることにして、ここは形式的にf(x)をルジャンドル関数で書いてみることにしよう(あくまで練習として)。

そういえば、以前にも似たような考察をしたことがあった。 あのときは、阪大の問題に触発されて、三角関数の冪がどんなフーリエ級数で表されるかを加法定理だけを使って調べたのだった。あれはあれでなかなか面白かったが、今回はその逆である。つまり\(cos(nx)\)を\(\cos x\)の冪で表そうという趣旨だ。とはいえ、\(\cos 3x\)までなので、それほど大変ではない。余力が有り余っていると思うので、今回はそれを「ルジャンドル多項式で表してしまえ」というテーマでやってみよう。

\[
\cos 2\theta = 2\cos^2\theta -1 = 2x^2 -1\\
\cos 3\theta = 4\cos^3\theta - 3\cos\theta = 4x^3 - 3x
\]
である。\(\cos(nx)\)は、nが偶数のときは偶関数で、nが奇数のときは奇関数となるらしいことがわかる。数学的帰納法を使えば、一般の場合も証明可能だろう。

今回はこれをルジャンドル多項式\(P_n(x)\)で表すことにする。ルジャンドル多項式は\(-1\le x \le 1\)で定義されたxの多項式なので、\(x=\cos\theta\)として、角度\(\theta\)方向に依存する量、たとえば静電ポテンシャルや波動関数など、方向依存性をもった物理量の記述に用いられる。ただし、回転対称性をもち方位角(azimuthal angle)に依存しないタイプである。方位角に依存するときは、球面調和関数\(Y_{lm}(\theta\phi)\)で記述する。\(\theta\)のことを極角(polar angle)と呼ぶこともある。

ルジャンドル関数を用いると、
\[
\cos(3\theta) = \frac{8}{5}P_3(\cos\theta) - \frac{3}{5}P_1(\cos\theta)\\
\cos(2\theta) = \frac{4}{3}P_2(\cos\theta) -\frac{1}{3}P_0(\cos\theta)
\]
などと表すことができる。ただし、
\[
P_0(x) = 1, \quad  P_1(x) = x, \quad P_2(x) = \frac{1}{2}\left(3x^2-1\right), \quad P_3(x) = \frac{1}{2}\left(5x^x -3x\right)
\]
と与えられている。

ルジャンドル多項式は直交多項式であり、
\[
\int_{-1}^1 P_{m}(x)P_n(x) dx = \frac{2}{2n+1}\delta_{mn}
\]
を満たす。したがって、次の積分が成り立つ。
\[
\int_{-1}^1 P_n(x) dx = 2\delta_{n0}\\
\int_{-1}^1xP_n(x)dx = \frac{2}{3}\delta_{n1}\\
\int_{-1}^1x^2P_n(x)dx = \frac{2}{3}\left(\delta_{n0}+\frac{2}{5}\delta_{n2}\right)\\
\int_{-1}^1x^3P_n(x)dx = \frac{2}{5}\left(\delta_{n1}+\frac{2}{7}\delta_{n3}\right)
\]
\(x^{2k+1} \)や\(x^{2k}\)にルジャンドル多項式\(P_n(x)\)をかけて積分すると、\(n=1,3,\cdots,2k+1\)あるいは\(n=0,2,\cdots,2k\)に対応するルジャンドル多項式は非零な寄与を与えることがわかる。

\(x\)についての3次式\(f(x) = \sum_{k=0}^3c_kx^k\)は、3次のルジャンドル多項式までで展開し直すことができる。つまり、
\[
f(x) = \sum_{k=0}^3 c_kx^k = \sum_{l=0}^3e_lP_l(x)
\]
したがって、展開係数\(e_m\)を求めるには両辺に\(P_m(x)\)をかけて積分すればよい。
\[
\sum_{l=0}^3 \int_{-1}^1e_l P_l(x)P_m(x) dx = \sum_{k=0}^3 c_k\int_{-1}^{1}x^k P_m(x)dx
\]
左辺に直交条件を適用すると、上式は
\[
e_m = \frac{2m+1}{2} \sum_{k=0}^3c_k\int_{-1}^1x^kP_m(x)dx
\]
と書き直せる。

ルジャンドル多項式で遊ぶのはこの辺にしておこう。

(1)
xの冪でf(x), g(x)を書くと
\[
f(x) = 4x^3+2ax^2+(b-3)x-a, \\
g(x) = \frac{4x^3 + 2ax^2+(b-3)x-2a-b-1}{x-1}
\]
を得る。問題は、g(x)が割り切れて、「整式」つまり多項式になっていることを示せるかどうかである。これは簡単にできて、
\[
g(x) = 4x^2 + 2(a+2)x + 2a+b+1\\
=4\left(x+\frac{a+2}{4}\right)^2+1+b-\left(\frac{a-2}{2}\right)^2
\]
という2次関数になる。

(2) \(g(\theta)\)が\(0<\theta<\pi\)で最小値0をとるための条件を求めよ。また、その条件が満たす図形を図示せよ。

\(-1< x < 1\)の範囲に極小値、つまり放物線の頂点が入る場合と入らない場合に分ける。入る場合、つまり
\[
-1 < -\frac{a+2}{4} < 1, \rightarrow -6 < a < 2
\]
のときは、最小値は放物線の頂点としてよいから、
\[
1+b-\left(\frac{a-2}{2}\right)^2 = 0, \rightarrow b = \left(\frac{a-2}{2}\right)^2 -1
\]
が成立する。

白丸は区間に含まれない点
この問題の最重要ポイントは\(a<-6, a>2\)のときだ。つまり、放物線の頂点が開区間\(-1<x<1\)の中に入らないときである。このときこの開区間で\(g(x)\)は単調減少、あるいは単調増加の関数となる。開区間の場合、このような関数は「最大最小定理」によって最大値、最小値が存在しない!つまり、考えなくてよいのである。■

2019年2月9日土曜日

センター試験の数IA問題5: 後半

後半部分に入ろう。問題文の記号と違う記号を採用してしまったので、その確認から。
我々の接点Tは問題文では接点Dとして、我々の接点Sは接点Eとして記されている。つまり、
\[
T\leftrightarrow D, \quad S\leftrightarrow E
\]
という対応だ。

さて、接点T,Sから頂点C,Bへたすき掛けに線分を張って、その交点をPとする。また、この交点Pと頂点Aを結んで直線APを張り、線分BCとの交点をQとする。これだけ読んでもなんのことかよくわからない。図に描こうとしても様々な線が絡み合って実に複雑だ。こういう時ほど代数幾何法は力を発揮する。

まず今までの状況を整理しておこう。


線分CTと線分SBの交点がPだ。内接円の中心Kの付近に来そうだが、来ないかもしれない。まずはPの座標を計算してみよう。我々は既にC、T、B、Sの座標は全て計算してある。この情報を使って、直線CT, BSの方程式をまず導こう。

\[
 CT: y=\frac{0-2\sqrt{6}}{1-(-1)}(x-1) = -\sqrt{6}\left(x-1\right)\\
 BS: y=\frac{0-\frac{2\sqrt{6}}{5}}{4-(-\frac{1}{5})}(x-4) = -\frac{2\sqrt{6}}{21}(x-4)
\]
この連立方程式の解を求めると、交点Pの座標がわかる。それは
\[
P\left(\frac{13}{19},\frac{6\sqrt{6}}{19}\right)
\]
となる。これは(予想通り)Kとは異なる点であることが確認できた。

この計算結果から、直線AP(=OP)の方程式がわかる。\(\angle BOP = \alpha\)とおくと、
\[
\tan\alpha = \frac{6\sqrt{6}/19}{13/19} = \frac{6\sqrt{6}}{13}
\]であるから、
\[
OP: y=\left(\tan\alpha\right) x = \frac{6\sqrt{6}}{13}x
\]
となる。

ここで、前回の二等分線の性質で導出した幾つかの性質を利用しよう。まず、問題文で、
CQ: BQの比の値を計算させているが、これはOPが角Aの二等分線であったなら 、「瞬殺」で、CQ:BQ = OC:OB=b:cとなる。しかし、OPは二等分線ではない。その情報は角αの中に含まれている。二等分線のときと同じように、三角形の面積を2つの方法で求めておき、その比を考えることで、比の公式の拡張ができるはずだ。

三角形OBQの面積\(S_1\)を2通りの方法で求めよう。まずは、底辺BQ、高さhを使った表現を用いると\(S_1=BQ\cdot h / 2\)となる。hは点Oと線分BCの距離と定義しても良い。次に、αを用いると\(S_1=OQ\cdot OB \cdot \sin\alpha /2\)とも表現できる。これと同じようにして、三角形OCQの面積を表現することもできる。最初の表現の比と二つ目の表現の比は等しいから、
\[
\frac{BQ}{CQ} = \frac{OB\cdot \sin\alpha}{OC\cdot \sin(\theta-\alpha)}
\]
となる。二等分線の場合は、\(\theta = 2\alpha\)だったから、BQ:CQ=OB:OCという公式が得られたわけだ。今回はその状況の拡張とみなせる。\(\sin\theta\)と\(\cos\theta\)の値は問題文に与えられている。また\(\sin\alpha\)の値は\(\tan\alpha\)から計算できるから、加法定理を用いて上の式は計算することができる。ただ、ここではせっかく\(\sin\alpha/\sin(\theta-\alpha)\)の比で与えられているから、それを最大限活用しよう。
\[
\frac{\sin\alpha}{\sin(\theta-\alpha)} = \frac{\sin\alpha}{\sin\theta\cos\alpha-\cos\theta\sin\alpha} = \frac{\tan\alpha}{\sin\theta-\cos\theta\tan\alpha} \\
=\frac{6\sqrt{6}/13}{2\sqrt{6}/5 - (-1/5)(6\sqrt{6}/13)} = \frac{15}{16}
\]
が求まる。したがって、OB=4, OC=7を代入すると、
\[
\frac{BQ}{CQ} = \frac{4}{5}\cdot\frac{15}{16} = \frac{3}{4}
\]
を得ることができる。BC = BQ+CQ = 7だから、BQ=3, CQ=4はすぐにわかる。

実は、この計算法は「代数幾何法」の観点からすると、まだ「邪道」である。代数幾何法を徹底するなら、Qの座標を求めてしまうのがよい!BCの方程式とOPの方程式の連立方程式を解くとQの座標が手に入る。

\[
BC: y=- \frac{2\sqrt{6}}{5}x + \frac{8\sqrt{6}}{5} \\
OP: y= \frac{6\sqrt{6}}{13}x
\]
これを解くと、
\[
Q(\frac{13}{7},\frac{6\sqrt{6}}{7})
\]
を得る。
したがって、
\[
CQ = \sqrt{\left(\frac{13}{7} - (-1)\right)^2 + \left(\frac{6\sqrt{6}}{7}- 2\sqrt{6}\right)^2} =4\\
BQ = \sqrt{\left(\frac{13}{7} - 4\right)^2 + \left(\frac{6\sqrt{6}}{7}\right)^2} =3
\]
となって、比どころか絶対値が先にわかってしまう。

さて、ここまでの結果をpostscriptで描いてみよう。

 まず、直線BSと直線CTの交点Pは、ほんのわずかながら角Aの二等分線には乗っていないことがわかる。したがって、直線OPは、二等分線からわずかにずれる。面白いことに、直線OPは内接円の接点Rに向かって進み、そこでBCと交差する!つまり、R=Qなのである。

上の計算では、\(Q(\frac{13}{7},\frac{6\sqrt{6}}{7})\) という結果だが、最初にやった計算では\(R(\frac{91}{49},\frac{6\sqrt{6}}{7})\)としていた。つまり、Rのx座標の分数は7を使って約分できるのだ....そう言われれば、91 = 7×13であるし、49=7×7である。

内接円にはこんな面白い性質があったのだ!今年のセンター試験は問題の難易はともかく、おもしろい内容が多く、とても勉強になったと思う。

R=Qであれば、Qは接点なのであるから、KQ=KRは内接円の半径に他ならない。こうして、最後から2つ目まで解くことができた。とはいえ、代数幾何学法にこだわるなら、こういうことは何も考えず、KとQの座標をピタゴラスの定理(距離の公式)に適用して計算すればよい。いずれにせよ、正解を得ることができる。

最後の問題は、 直線CTと内接円の交点F(ただしFはTとは異なる)に対する円周角\(\angle SFT\)の余弦を求める問題である。角Aの二等分線と内接円の交点をGとすれば、円周角の定理により、これは\(\angle SGT\)に等しい。三角形SRTは二等辺三角形だから、\(\angle OGT\)の大きさが分かれば良い。これも円周角の定理により、\(\angle OKT\)の半分の角度に等しい。三角形OKTは直角三角形であり、Tは接点なので、KTとOBは垂直の関係にある。\(\angle KOT=\theta/2\)という定義だから、三角形の内角の和の性質を使って、\(\angle OKT = \frac{\pi}{2} - \frac{\theta}{2}\)であることがわかる。したがって、\(\angle OGT = (1/2) \angle OKT = \frac{\pi}{4}-\frac{\theta}{4}\)となる。したがって、\(\angle SGT = 2 \angle OGT = \angle OKT\)であるから、
\[
\cos\angle SFT = \cos\left(\frac{\pi}{2}-\frac{\theta}{2}\right)
= \cos\frac{\pi}{2}\cos\frac{\theta}{2} + \sin\frac{\pi}{2}\sin\frac{\theta}{2}\\
= \sin\frac{\theta}{2} = \frac{\sqrt{15}}{5}
\]
が求まる。最後のところは、すでに求めた\(\tan\frac{\theta}{2}=\frac{\sqrt{6}}{2}\)の値と、\(1+\frac{1}{\tan^2x} = \frac{1}{\sin^2x}\)の関係式を用いた。

円周角の知識を使わず、「代数幾何法」を貫徹するつもりなら、直線CTと内接円の方程式を連立して交点Fの座標を求め、それをつかって線分FT, FS, TSの長さを求めた後に、余弦定理\(TS^2 = FT^2 + FS^2 - 2FT\cdot FS\cos\angle SFT\)を計算すればよい。が、そこまで執着せずとも、お許しいただけるであろう。

角の二等分線を使った性質

先ほどの問題では、三角形の角を二等分する直線について考えた。この直線は内接円の中心を通るわけだが、そこを突き抜けて対辺と交差するとき、その交点Pは、内接円の接点Rとは異なることを確かめた。

 ここでは、点Rではなく、点Pのもつ性質について考えてみたい。内接円の半径を求める時、面積を利用した手法を導入したが、ここでもその手法が使える。ここで証明したい性質は、
\[
CP: BP = OC: OB
\]
だ。二等分線の性質、および面積を使って証明できる。

\[
S(\triangle OPC) = \frac{1}{2}OC\cdot OP\sin\theta = \frac{1}{2}CP\cdot h\\
S(\triangle OPB) = \frac{1}{2}OB\cdot OP\sin\theta = \frac{1}{2}BP\cdot h, \\
S(\triangle OBC) = \frac{1}{2}OB\cdot OC\sin(2\theta)
\]
が成り立つ。ただし、hというのは、点Oと線分BCの距離である。
故に、
\[
\frac{S(\triangle OPC)}{S(\triangle OPB)} = \frac{OC}{OB} = \frac{CP}{BP}
\]
となり、与えられた性質が証明できた。

また、\(S(\triangle OBC)=S(\triangle OPC) + S(\triangle OPB)\)であることから、
\[
\frac{1}{2}OC\cdot OP \sin\theta + \frac{1}{2}OB\cdot OP \sin\theta
= \frac{1}{2}OB\cdot OC\sin(2\theta)
\]
がなりたつ。これを整理すると
\[
OP = \frac{2bc}{b+c}\cos\theta
\]
という関係式が得られる。ただし\(b=OB, c=OC\)とした。

たとえば、今年(2019年)のセンター試験の数IA問題5の場合、\(b=4, c=5,\cos\theta = \sqrt{\frac{2}{5}}\)だから、\(OP=\frac{8}{9}\sqrt{10}\)と計算できる。

さらに、三角形OBPについて余弦定理を適用すると、
\[
PB^2 = OP^2 + b^2 - 2b\cdot OP \cos\theta
\]
となるが、最初に証明した辺の比に関する関係式により、
\[
PB = \frac{ab}{b+c}
\]
が成り立つ。ただし、\(BC=a\)とした。これを代入すると、
\[
\left(\frac{ab}{b+c}\right)^2 = p^2 + b^2 - 2bp\cos\theta
\]
が成立する。ただし\(OP=p\)とした。

2019年2月8日金曜日

センター試験の数IA問題5: 内接円

取り扱う図形は下図の通り。

\(\angle BAC \equiv \theta\)とおこう。問題ではこの角度に対する三角比が与えられていて、
\[
\cos\theta =-\frac{1}{5}, \quad \sin\theta = \frac{2\sqrt{6}}{5}
\]
である。前回やったように、\(\cos\theta\)に関する計算は、三辺の長さ\(a,b,c\)から計算できる。
\[
\cos\theta = \frac{b^2+c^2-a^2}{2bc} = \frac{5^2 + 4^2 - 7^2}{2\cdot 5\cdot 4} = \frac{29+16-49}{20} = \frac{-4}{20}
\]
どうしてわざわざ問題でこの値をおしえてくれたのだろう?と不思議に感じる人もいるはずだ。 しかし、\(\sin\theta\)に関しては正負の分だけ曖昧さが残る。というのは、
\[
\sin\theta = \pm \sqrt{1-\cos^2\theta} = \pm \frac{2\sqrt{6}}{5}
\]
となるからだ。もちろん、負符号の場合は、点Cはx軸に対して線対称な位置に動くだけだから、本質的な違いはない。が、この問題では、上のような図形と座標系をあらかじめ指定してきているのが、特徴的である。

3頂点の座標は、前の考察により
\[
A(0,0), \quad B(4,0), \quad C(-1, 2\sqrt{6})
\]
となる。 Cが第4象限にあるから、この三角形は鈍角三角形になることがわかる。

さて、さっそくこの三角形に内接する内接円(inscribed circle)の半径を出せといってきた。postscriptで描くためには、この円の中心座標も知りたいところだ。

まず言えるのは、三角形の辺全てが内接円の接線となることである。まず、辺AB, ACに着目する。幾何学的な考察により、内接円の中心Kと点Aを結ぶ直線AKは、角Aの二等分線になることである。

この二等分線の方程式は
\[
y=\tan(\theta/2)x
\]
で与えられる。ここで、\(\theta\)を含む様々な三角比の計算をやってしまおう。

まず問題文には(上記の通り)
\[
\cos\theta = -\frac{1}{5}, \quad \sin\theta = \frac{2\sqrt{6}}{5}
\]
と与えられている。したがって、
\[
\tan\theta = - 2\sqrt{6}
\]
である。また、
\[
\tan\theta = \tan\left(2\frac{\theta}{2}\right) = \frac{2\sin\frac{\theta}{2}\cos\frac{\theta}{2}}{\cos^2\frac{\theta}{2} - \sin^2\frac{\theta}{2}}
= \frac{2\tan\frac{\theta}{2}}{1-\tan^2\frac{\theta}{2}}
\]
であるから、整理して、
\[
\tan\theta s^2 + 2s - \tan\theta = 0
\]
ただし、\(s=\tan\frac{\theta}{2}\)とおいた。これをsについて解くと、
\[
\tan\frac{\theta}{2} =  \frac{\pm 1-\cos\theta }{\sin\theta}
\]
を得る。与えられた\(\cos\theta, \sin\theta\)の値を代入すると
\[
\tan\frac{\theta}{2} = \frac{\sqrt{6}}{2}, -\frac{\sqrt{6}}{3}
\]
となるが、二等分線の傾きは正だから最初の解を採用する。
すなわち、
\[
y=\frac{\sqrt{6}}{2}x
\]
が二等分線の方程式となる。すなわち内心円の中心Kは\(K(x, \frac{\sqrt{6}}{2}x)\)と表せる。

内心円は、三角形の全ての辺と接するから、中心Kと接点Tを結ぶ直線は、三角形の辺と直行し、最短距離にある。線分ABと中心C、およびAB上の接点Tの関係は自明であって、
T(x,0), \(KT=\frac{\sqrt{6}}{2}x\)となる。

次に線分ACについて考えよう。この線分上の接点Sの座標は、点と直線の距離に関する考察に基づき、計算することができる。直線ACの方程式は
\[
AC: y=\tan\theta x = -2\sqrt{6}x
\]
である。したがって、中心KとACの距離KSは
\[
KS = \frac{\frac{\sqrt{6}}{2}x+2\sqrt{6}x}{\sqrt{1+(-2\sqrt{6})^2} }
= \frac{\sqrt{6}}{2}x
\]
で与えられ、その座標は
\[
S=(-\frac{x}{5}, \frac{2\sqrt{6}}{5}x)
\]
となる。

最後に線分BCとの距離を計算しよう。直線BCの方程式は
\[
y=\frac{0-2\sqrt{6}}{4-(-1)}\left(x-4\right) = -\frac{2\sqrt{6}}{5}x + \frac{8\sqrt{6}}{5}
\]
であるから、中心Kとの距離が最短となる場所(接点R)のx座標は
\[
x_R = \frac{ -\frac{2\sqrt{6}}{5}\left(\frac{\sqrt{6}}{2}x\right) + x -\left(-\frac{2\sqrt{6}}{5}\right)\left(\frac{8\sqrt{6}}{5}\right)}{\frac{7^2}{5^2}}
= -\frac{5}{49}x + \frac{96}{49}
\]
で表現でき、距離KRは
\[
KR= \frac{\left|\frac{\sqrt{6}}{2}x-\left(-\frac{2\sqrt{6}}{5}\right)x-\frac{8\sqrt{6}}{5}\right|}  {\sqrt{1+\left(-\frac{2\sqrt{6}}{5}\right)^2}}=\frac{\sqrt{6}}{7}\left|\frac{9}{2}x-8\right|
\]
となる。絶対値が出てくる理由について考察してみよう。\(x=16/9\)で距離がゼロになる。つまり、二等分線と直線BCがそこで交差するということだ。\(x=0\)は頂点A(つまり原点O)に相当するから、\(0<x<16/9\)の範囲のとき、点Kは\(\triangle ABC\)の内部にあることがわかる。一方、\(x>16/9\)の領域で、Kは三角形の外側に出てしまうのである。Kが三角形の内部にあるとき、\(9x/2 -8 <0\)なので、絶対値を外す時は負符号をつけることになる。

Kのy座標、つまりKT, そしてKS, KRは内接円の半径rに他ならない。\(KT=KS=\sqrt{6}x/2\)なので、これとKRが等しいという方程式から、xの値がわかる。
解くべき方程式は
\[
\frac{\sqrt{6}x}{2} = \frac{\sqrt{6}}{7}(-\frac{9}{2}x+8)
\]
であり、これを解くと\(x=1\)を得る。つまり、内接円の中心Kの座標は
\[
K\left(1, \frac{\sqrt{6}}{2}\right)
\]
であることがわかった。
内接円の半径は、Kのy座標に他ならないから、
\[
r=\frac{\sqrt{6}}{2}
\]
であることもわかった。これが最初の問の答えだ。

また、接点S,Rの座標もわかる。
\[
S(-\frac{1}{5},\frac{2\sqrt{6}}{5}), \quad R(\frac{91}{49},\frac{6\sqrt{6}}{7})
\]

さて、上の情報を元に、postscriptで描画してみよう。書き込むのは円の方程式
\[
\left(x-1\right)^2 + \left(y-\frac{\sqrt{6}}{2}\right)^2 = \left(\frac{\sqrt{6}}{2}\right)^2
\]
だ。やってみると、見事に内接円が現れた!

\(\angle A\)の二等分線\(y=\sqrt{6}/2 x\)も描き入れてみよう。


ついでに、接点3つも描き入れてみた。ひとつ気がついたのは、二等分線は接点Rを通らないという点である。内接円は接点において三角形の辺と接するから、そこで半径と辺は垂直になる必要がある。つまり\(KR\perp BC\)。しかし、角Aの二等分線がBCと垂直になるのは、三角形ABCがAB=ACの二等辺三角形の場合に限られる。したがって、二等分線は一般に接点を通らないのである。この性質はとても重要だ。

ちなみに、接点T,S,Rから中心Kに向かって線分を引くと、その線分は三角形の対応する辺と垂直になるから、三角形ABCを3つの部分に分け、\(\triangle AKC, \triangle AKB, \triangle BKC\)とすると、それぞれの三角形の面積はbr/2, cr/2, ar/2となる。したがって、三角形ABCの面積Sは
\[
S(\triangle ABC) = \frac{a+b+c}{2}r
\]
と表すことができる。今問題文には\(\sin\theta \)の値が与えられているので、
\[
S(\triangle ABC)=\frac{1}{2}bc\sin\theta = \frac{1}{2}\cdot 4 \cdot \frac{2\sqrt{6}}{5} = 4\sqrt{6}
\]
と計算することができる。したがって、内接円の半径は、
\[
r = \frac{2\cdot 4\sqrt{6}}{7+5+4} = \frac{\sqrt{6}}{2}
\]
と計算できる。もちろん、試験会場ではこちらの計算をした方が手っ取り早い。しかし、なかなかこの性質を思い浮かべることができなかったら、躊躇せずに最初に考察した「代数幾何法」をやってみるべきだろう。(おそらくAIなら、代数幾何法を採用して問題解決を図るはずだ。)

試験問題では、続いてADおよびDEの長さを尋ねている。我々の記号ではDはT、EはSのことである。OT=1はすでに(x=1として)求めてあるし、TSの長さは、点Tと点Sの座標がわかっているので、ピタゴラスの定理により
\[
TS = \sqrt{(-\frac{1}{5}-1)^2 + (\frac{2\sqrt{6}}{5})^2} = \frac{2\sqrt{15}}{5}
\]
とすぐに求まる。

試験会場では、直角三角形OKTに着目する。KTは内接円の半径rであり、角TOKは\(\theta/2\)だから、\(\tan\frac{\theta}{2}=\frac{r}{OT}\)の値を使って計算できる。また、DEの長さは三角形STOに対して余弦定理を使えば良い。その際、OT=OSを利用する。すなわち、
\[
AE^2 =  OT^2 + OS^2 - 2 OT\cdot OS\cos\theta = 2OT^2 (1-\cos\theta)\
\]
を計算する。内接円に関連する幾何学的な基本的な特質をちゃんと覚えているかを問う、なかなか良い問題だが、試験の緊張の中では「ど忘れ」とか、「勘違い」というのがあるかもしれない。そう言う時は、系統的に計算できる「代数幾何法」を援用してミスを減らしたいものだ(つまり、受験生なら短時間で効率よく解ける受験技術でサッと解いた後に、見直しの手段として代数幾何法をやってみたらどうだろうか?)






2019年2月7日木曜日

点と直線の距離:忘れた時に

点P\((x_0,y_0)\)と直線\(y=ax+b\)の距離を求める公式を忘れてしまった時にやるべき計算をここに書いておこう。

直線上の点は\((x,y)=(x,ax+b)\)と表せる。したがって、直線上の任意の点と点Pの間の距離\(L\)の二乗は、
\[
L^2 = (x-x_0)^2 + (y-y_0)^2
\]
となる。この量をxで微分して、最小値を与えるQ(x,y) が求まった時、線分PQの長さが、点Pと直線の最短距離となる。

\(d^2\)をxで微分すると
\[
\frac{dL^2}{dx} = 2(x-x_0) + 2(y-y_0)\frac{dy}{dx} =2(x-x_0) + 2a(ax+b-y_0)
\]
したがって、極値(最小値)を与えるxは
\[
x=\frac{ay_0 + x_0 - ab}{1+a^2}
\]
である。これを\(L^2\)に代入すると、
\[
L^2 = \frac{(y_0-ax_0-b)^2}{1+a^2}
\]
を得る。したがって、点Pと直線の距離は
\[
L = \frac{\left|y_0-ax_0-b\right|}{\sqrt{1+a^2}}
\]
という形で与えられる。

この方法の「優れている点」は、高校の教科書には載っていない、直線上にある、点Pへの最短地点の座標が求まる点である。この座標の公式もセットで「記録」(記憶ではない)しておくと、いろいろな場面でいろいろ役立つだろう。


センター試験の数学IA問5:(1)ポストスクリプト

毎年恒例のポストスクリプトによる幾何問題の勉強を始めよう。

今年は、3辺の長さが与えられた「鈍角三角形」に、円が内接する問題だ。まずは、該当する図形をpostscriptで描いてみたい。

私の基本方針は、幾何の問題は代数の問題に落として解く、というデカルトの「代数幾何」の精神に従うこと。したがって、図形を描く際には、まず座標系を導入する。一番やりやすいのはAを原点とし、ABをx軸に合わせることだ。したがって、問題文の設定からA=O(0,0), B=(4,0)とおける。

問題はCの座標である。これは計算しないとわからないので、まずC(x,y)と置くことにしよう。

ACは原点から伸びる線分(長さ5)になっているので、 x軸から線分ACまでの角度を\(\theta\)とおき、極座標を用いて
\[
x = 5\cos\theta, \quad y=5\sin\theta
\]
と表すことにしよう。問題文をよく読むと\(\cos\theta = -\frac{1}{5}, \sin\theta=\frac{2\sqrt{6}}{5}\)がすでに与えられているから、Cの座標はすぐに、
C=(\(-1, 2\sqrt{6}\))であることが計算できる。

 3点の座標がわかれば、postscriptで三角形を描くことは簡単だ。

0 0 moveto
4 0 lineto
-1 2 6 sqrt mul lineto
closepath

でOK(もちろん、相対座標と絶対座標の調整とか、細かい設定は必要だが、エッセンスは上の3行)。

 このままでは面白くないので、3辺の長さ\(a,b,c\)が与えられた時に座標A,B,Cを計算して、三角形ABCを描くpostscriptのプログラムを考えてみよう。a=BC, b=CA, c=ABとおく。

上の考察に習えば、点A,B,Cの座標は\((0,0), (c,0), (b\cos\theta,b\sin\theta)\)とおける。ただし\(\theta = \angle\text{BAC}\)とした。A,Bは確定だから、あとはCの座標を計算するだけだ。これも上と同じようにして、ピタゴラスの定理により
\[
a^2 = (b\cos\theta - c)^2 +(b\sin\theta)^2
\]
これを整理すると
\[
\cos\theta =  \frac{b^2+c^2-a^2}{2bc},\quad
\sin\theta = \frac{\sqrt{(a-b+c)(a+b-c)(b+c-a)(b+c+a)}}{2bc}
\]
を得る。ただし、\(\sin\theta\)は\(\sin^2\theta+\cos^2\theta=1\)を利用した。

よく見ると、\(\cos\theta\)の式の方は、余弦定理を変形したものであることに気づくだろう。つまり、余弦定理を記憶していれば、座標を用いた代数計算をしなくても、この問題を解くことはできる。一方、逆に考えれば、余弦定理など覚えていなくても、ピタゴラスの定理さえ知っていれば、代数幾何の手法で余弦定理を自分で導出し、この問題を解くことができる、ということだ。

以上の結果をプログラムすると、次のようなprocedure(関数のようなもの)を定義できる。

\triangle0 {

  /c exch def
  /b exch def
  /a exch def

  /x b b mul c c mul add a a mul sub 2 b mul c mul div def
  /y 4 b b mul mul c c mul mul a a mul add b b mul sub c c mul sub sqrt 2 b mul c mul div def

  0 0 moveto
  c 0 lineto
  x y lineto
  closepath

} def

使い方は、

a b c triangle0

である。これを使えば、上図のような図形が簡単に描けるようになる。もちろん、今回の問題では

7 5 4 triangle0

と打てば良い。

さて、基本的な図が手に入ったので、これを元に問題を解いてみよう。

2019年2月4日月曜日

センター試験数学IA: 条件付き確率の問題の再考(4)

問(1)では、全体集合Uがなんなのか、いまひとつはっきりしない、という議論を前回行った。前にも書いたが、この問題は答えだけは正しく求められるのである。では、その正解を用いて、全体集合Uについてなにか手がかりを得られないか、「逆アセンブル」してみよう。

正解はもちろん、
\[
P(T^C\cap B_{Rr}) = P(r|B_R)P(T^C) =  \frac{n(B_{Rr})}{n(B_R)}\cdot\frac{n(T^C)}{n(D)} =\frac{2}{3}\cdot\frac{2}{3}
\]
分子の部分は十分に納得できる内容だ。すなわち、考えるべき最初の事象\(T^C\subset D\)と次に起きるもう一つの事象\(r\subset B_r\subset B\) の部分集合同士の直積集合\(T^C\otimes B_{Rr}=T^C\cap B_{Rr}\)に対応している。
\[
n(T^C\cap B_{Rr}) = n(T^C)n(B_{Rr}) = 4\cdot 2
\]
となると、分母の部分が全集合に相当する部分であるから、
\[
n(B_R)n(D) \rightarrow n(U) = 3\cdot 6
\]
と理解するべきということだ。つまり、
\[
U=D\otimes B_R
\]
と理解しなさい、というのが「逆アセンブル」の結果ということになる。

サイコロの目に三の倍数が出る場合は、白い袋での試行となるので、その場合は
\[
U=D\otimes B_W
\]
となるだろう。

全集合UがDの結果によって変わるというのは、DとBは独立事象でないことから(なんとか)理解できる。しかし、上の結果をちょっと意外に感じる人は多いのではないだろうか?

Dの結果により袋の色は変わるので、 \(T\subset D\)は\(B_W\)と接続し、\(T^C\)は\(B_R\)と接続する。したがって、全集合は\[U=B_W\otimes T + B_R\otimes T^C\]という風に書けるのでは、と考える人は一定の割合でいると思う。しかし、これでは正解にたどり着けない。

条件付き確率の問題というのは、意外に難しいということが、今回の分析でもあぶり出されたような気がする。高校の教科書では全集合Uが変わる可能性などは解説されていないし、全体集合が表現しにくい場合も書いてない。大学で学ぶ確率論では、こういう問題はどのように取り扱っているのか、興味が湧いてきた。

とはいえ、これ以上、この問題に時間を割くのは得策ではないだろう。条件付き確率の問題は、なかなか難しいということを肝に銘じつつ、精進を積んでいくことにしよう。いずれ、この疑問に対する答えは与えられるものと信じることにして。

2019年1月31日木曜日

センター試験数学IA: 条件付き確率の問題の再考(3)


問題文には、「1回目の操作(試行)で、赤い袋が選ばれ赤玉が選ばれる確率は?」とある。これは赤い袋が選ばれる事象(つまり\(T^C\))と、赤玉が選ばれる事象(R)の積事象\(T^C\cap R\)のことをいっているのか、それとも条件付きの事象\(R|T^C\)のことをいっているのか、いまひとつはっきりしない(もちろん、受験数学の特殊日本語に慣れ親しんだ人々にはいささかの疑問もないだろうが)。

教科書を見ると、どうやらこの日本語の表現は前者であるらしいことがわかる。つまり、「赤い袋が選ばれ、かつ赤玉が選ばれる事象」という意味だ。では、後者の場合にはどういう日本語を使うかというと、「赤い袋が選ばれているとき、赤玉が選ばれる事象」と書き表すようだ。うーむ...実に曖昧だ。これはもう慣れるしかない。いっそのこと、「赤い袋から選ぶという部分集合を考え、その条件のもとで赤玉を取り出す確率」と書いてもらいたいものだ。

教科書でよく扱う例では、前の記事でやったように、全集合Uを、Sで分解する方法と、Fで分解する方法を同時に採用する問題だ。部分集合への二種類の直和分解は、切り口が違うだけで、U=S, U=Fであることは保持される。したがって、S,Fの組み合わせにより、Uは4つの部分集合に分解される。このような場合に「条件付き確率」について考えるのは比較的優しいだろう。

横軸がF、縦軸がSに対応している。

しかし、今回の問題では、サイコロの目という事象Dと、袋の中にある玉の色Bという事象であり、これは共通の全集合Uを切り口の異なる部分集合に分解する状況にはなっていない。そもそも、U自体の姿がこの問題ははっきりしないのが一番の問題ではないだろうか?

2つの事象の組み合わせを新たな事象と考えることで、Uを定義してみよう。つまりU=DBと考えるのである。DBに含まれる事象は(d,b)、ただし\(d\in D, b\in B\)と表すことにする。問題では、三の倍数という条件によってDを2つの部分集合に直和分解している。つまり、\(D=T\oplus T^C\)である。したがって、Uはまず、Tという「座標」によって「縦に2つに分解される」とみなすことができる。

次はBに関する分解であるが、Bは白い袋と赤い袋に分けられ、さらにそれぞれの袋の中に紅白の玉が入っている。Bに含まれる事象をラベルするためには、一種類のラベルではだめで、袋の色と玉の色の二種類が必要になるということだ。袋の色はR,W、玉の色はr,wで分けることにしよう。さらに、同色の玉は\(r_1,r_2,\cdots\)といった具合に番号で区別することにする。そうすると、Bは
\[
B=\{(R,r_1),(R,r_2),(R,w_1),(W,r_1),(W,w_1)\}
\]
という5つの要素を含むことがわかる。これをまとめて、
\[
B=\{b_1,b_2,b_3,b_4,b_5\}
\]
と書くことにしよう。つまり、
\[
b_1=(R,r_1), b_2=(R,r_2),b_3=(R,w_1),\cdots
\]
と定義する。袋の色をつかって、Bは2つの部分集合の直和に分解できる。
\[
B=B_R\oplus B_W,
\]
ただし、
\[
B_R=\{b_1,b_2,b_3\}, \quad B_W=\{b_4,b_5\}
\]
さらに、赤い袋の中にある赤い玉の事象を\(B_{Rr}=(b_1,b_2)\)、赤い袋の中にある白い玉の事象を\(B_{Rw}=(b_3)\)とすると、
\[
B_R = B_{Rr}\oplus B_{Bw}
\]
と書くことができる。同様に、
\[
B_W = B_{Wr}\oplus B_{Ww}
\]
と書ける。

これにより、全集合Uは4つの部分集合に直和分解できる。
\[
 U=DB =(T,B_R)\oplus (T,B_W) \oplus (T^C,B_R) \oplus (T^C,B_W)
\]
要素の数は、
\[
n(U)=n(D)n(B)=6\cdot 5 = 30, \\
n(D)=6, n(T)=2, n(T^C)=4, \\
n(B)=5, n(B_R)=3, n(B_W)=2
\]
となる。

\(T^C,B_R\)はさらに分解できて、
\[
(T^C,B_R)=(T^C,B_{Rr})\oplus (T^C,B_{Rw})
\]
と書ける。したがって、赤い袋で赤玉を取り出す確率は、\(P(T^C\cap B_{Rr})\)と書け、
\[
P(T^C\cap B_{Rr}) = \frac{n(T^C\cap B_{Rr})}{n(U)} = \frac{n(T^C)n(B_{Rr})}{n(U)} =  \frac{n(T^C)n(B_{Rr})}{n(D)n(B)}\\ = \frac{n(T^C)}{n(D)}\cdot\frac{n(B_{Rr})}{n(B_R)}\cdot\frac{n(B_R)}{n(B)}=P(T^C)P(r|R)\frac{n(B_R)}{n(B)}
\]
と書けるような気がするが、これは間違った答えだ。\(n(B_R)/n(B)\)の分だけずれている。これは、赤い袋と白い袋に入っている玉の総数5で、赤い袋の玉の総数3を割った数で、あたかも白い袋の内容と赤い袋の内容がごちゃまぜになっていて、その中から赤い袋に「属している」玉を取り出す確率、という余計な確率が忍び込んでしまっている。つまり、U=DBという形では、この問題は記述できないということだ。この方法だと、目に見えない、触っても感触のない袋に入れられた玉5つが、形式的に白袋、赤袋に属するとされ、同じ箱に混ぜて入れられているのを取り出す、という違う問題になってしまうのだ。

事象Dの結果に応じて、白袋と赤袋は明確に分けられなくてはならない。手を突っ込むのは、どちらかの袋1つであって、白袋なら全部で2つ、赤袋なら全部で3つの玉があって、そこから1つ取り出すという試行にならねばならない。5つの玉が同じ袋に入っており、その玉に(R,r)(R,r),(R,w),(W,r),(W,w)とプリントされているというわけではないのだ。

この問題は、意外に手強い。

2019年1月30日水曜日

センター試験数学IA: 条件付き確率の問題の再考(2)

教科書によくあるタイプの問題では、まず「人間」という「根源事象」uを考え、この根源事象が、たとえば100個集まってできる集合Uを全集合(Universal set)として定義する。

次に、Uの部分集合(subset)を定義するために、性別という事象Sを考える。\(S=M\oplus F\)という直和で書ける(社会的に微妙なところはこの問題では無視し、MとFは互いに排反な事象と仮定し、Sはその和事象であるとする)。したがって、Sの全体は、Uの全体と一致する。事象M、Fが作る部分集合もM、F と表すことにする。その要素の数が例えば、\(n(M)=40, n(F)=60\)であるとする。この集団の中から人間を一人抽出した際に、Mとなる確率はP(M)=0.4、Fとなる確率はP(F)=0.6となる。排反な和事象なのでP(M)+P(F)=1.0という確率保存則も成り立つ。

Uの中に、もう一つ別の部分集合を考える。たとえば、サッカーをやった経験があるかどうかという事象Fを取り上げよう。経験者はY、未経験者をNとすると、この場合も\(F=Y\oplus N = U\)となる。YとNは(通常は)排反事象である。n(Y)=50, n(N)=50とする。
つまり、全事象はSという切り口と、Fという切り口によって、異なるタイプの部分集合の直和として表せることになる。
\[
U=S=M\oplus F \\
=F=Y\oplus N
\]

となると、S,Fを組み合わせると、Uは4つの部分集合に分割できる。
\[
U=(M,Y)\oplus (M,N) \oplus (F,Y) \oplus (F,N)
\]
たとえば、男でサッカー経験者は(M,Y)という集合に属し、その要素数をn(M,Y) で表すことにする。例えば、n(M,Y)=35, n(M,N)=5, n(F,Y)=15, n(F,N)=45としよう。


全集合Uから無作為に一人を選んだとき、その人物が(M,Y)である確率は、積事象\(M\cap Y\)の確率のことであり、
\[
P(M\cap Y) = \frac{n(M,Y)}{n(U)} = \frac{35}{100} = 0.35
\]
となることはすぐにわかる。この式を変形すると
\[
P(M\cap Y) = \frac{n(M,Y)}{n(U)} = \frac{n(M,Y)}{n(M)}\frac{n(M)}{n(U)}\\
= P(Y|M)P(M)
\]
となる。実質上、\(n(M,Y)=n(M\cap Y)\)であるから、条件付き確率の定義は、
\[
 P(Y|M) = \frac{n(M\cap Y)}{n(M)}
\]
となることがわかる。つまり\(M\subset U\)という部分集合の中における\(M\cap Y\)という別の部分集合の割合として、\(P(Y|M)\)は定義されるということだ。

実際, \(P(M)=0.4=2/5, P(Y|M)=\frac{n(M\cap M)}{n(M)} = 35/40=7/8\)なので、
\[
 P(Y|M)P(M) = \frac{7}{8}\cdot\frac{2}{5} = \frac{7}{20}=0.35=P(Y\cap M)
\]
であることが示せる。

これで、条件付き確率\(P(A|B)\)と積事象\(P(A\cap B)\)の確率の違いがわかった。前者は、条件Bで括られる部分集合Bを分母にもつ事象\(A\cap B\)の確率であり、後者は、事象\(A\cap B\)の全集合Uに対する確率である。

この基本事項の理解の基に、センター試験の(1)に戻ってみよう。

(つづく)

2019年1月29日火曜日

センター試験数学IA: 条件付き確率の問題の再考(1)

確率の問題の問(1)を違う角度から再度考察してみたい。

問(1)を条件付き確率を利用する問題、あるいは積事象の問題だと指摘している解説は皆無だ。「赤い袋が選ばれ、赤い玉が取り出される確率」が、なぜ「赤い袋が選ばれる確率(2/3)」と「(赤い袋で)赤い玉が取り出される確率(2/3)」の積になるのか、解説している文章はなく、「直感的に」あるいは「自明に」積となることを強要し、理由も挙げずに答えを書き下している。「センター試験では答えが合えばそれでいい」と考える人には、これでいいのかもしれないが、数学/物理の研究を志す者には到底耐えられない書き方だ。

とある解説では、「独立事象だから赤い袋が選ばれる確率と赤い玉を取り出す確率の積を計算する」と書いているが、それは間違いだろう。もし独立だとしたら、赤い玉を取り出す確率は、サイコロの目に何が出ようと一定のはずだが、問題文では、サイコロの目によって2/3になったり、1/2になったりして変化するのだから、赤い玉を取り出す確率は「赤い玉」という事象だけでは決まらず、サイコロの目に依存した量になっている。しかし、「サイコロの目と玉を取り出す事象は独立」と考えるこの解説は、正しい答えを(誤った根拠に基づき)得ているのである。これは非常におもしろい現象だ。理由が間違っていても、(1)は直感的に解くことが誰にでもできるのだ。

この問題を解くに当たって誰もが容易に推測できるのは、サイコロの目に三の倍数以外の数、つまり1,2,4,5が出るという事象(\(T^C\)の確率\(P(T^C)=2/3\)が重要だろう、という「感覚」だろう。したがって、計算すべき確率を\(P\)と書けば、
\[
 P=X\cdot P(T^C)
\]
となることには誰もがたどりつく。問題は、この比例関係の係数、つまりXが何になるかである。もし、それが赤玉が出るという事象(R)のみに依存する、つまり最初の事象\(T^C\)と独立であるならば、
\[
 P=P(R)P(T^C)
\]
と書けるだろう。

Rと\(T^C\)が独立であるためには、条件付き確率の定義より、
\[
P(R|T)=P(R|T^C)
\]
が成り立つ必要がある。しかし、問題に与えられているように、
\[
P(R|T) = \frac{1}{2}, \quad P(R|T^C) = \frac{2}{3}
\]
となって、2つの条件付き確率に異なる値が割り当てられているから、玉の色という事象Bとサイコロの目という事象D\(=T\oplus T^C\)は独立ではないのだ。

もし、この問題で計算すべき確率が積事象の確率\(P(R\cap T^C)\)だとすれば、定義に基づき、
\[
P(R\cap T^C) = P(R|T^C)P(T^C) = \frac{2}{3}\cdot\frac{2}{3} = \frac{4}{9}
\]
と計算できる。つまり、問(1)は積事象の確率計算であり、条件付き確率をうまく使いこなす問題である、と理解することができる。

しかし、この問題で計算すべき確率が、条件付き確率\(P(R|T^C)\)そのものだとしたら、答えは単に2/3となる。 しかし、問題文には「赤い袋が選ばれ」とあるから、その確率\(P(T^C)\)を普通は使いたくなるから、直感的に掛けたくなるはずだ。(そしてそれはあっているのである。)「直感的に」というのは数学の研究にならないから、なんとかして理由を見出さねばならない。ここで、積事象の定義に立ち戻って考えることにしょう。

(つづく)

2019年1月28日月曜日

確率の基礎:(2)積事象

積事象についてまとめておこう。事象Aと事象Bの積事象とは、事象Aに対応する集合Aと事象Bに対応する集合Bの「共通部分(重なり部分)」に対応する事象のことであり、\(A\cap B\)と表される。和事象の関係式を変形すると、
\[
A\cap B = A+B - A\cup B
\]
とも表せるが、あまりこの式は重要ではない。
積事象の確率\(P(A\cap B)\)を\(P(A)\)や\(P(B)\)を使ってどのように表すことができるかが一番の興味だが、和事象の場合と同じように、条件によって表現が変わる。

和事象では「排反」という概念が重要だったが、積事象では「独立」という概念が重要となる。一般には、
\[
P(A\cap B) = P(A|B)P(B) = P(B|A)P(A)
\]
などと表すことができるが、\(P(A|B)\)とか\(P(B|A)\)という確率が何を表すかが重要となる。これらは「条件付き確率」と呼ばれる。

結局、積事象とは、「Aであり、かつBである」ということだから、「Aが成り立つ」とか、「Bが成り立つ」という単発の条件は、必要条件とみなされる。したがって、積事象が成立するには、「まずBが成り立ち、その上でAも成り立つ」、あるいは「まずAが成り立ち、その上でBも成り立つ」という具合に考える必要がある。上の式の\(P(B)\)とか\(P(A)\)というのが、「まずBが成り立ち」とか「まずAがなりたち」という部分に相当する。ということは、\(P(A|B)\)というのは「(Bが成り立ち)その上でAが成り立つ」という部分に相当する。

独立事象というのは、P(A|B)=P(A)、あるいはP(B|A)=P(B)と書けるかどうか、という点で重要な概念であり、数学的には
\[
P(A|B)=P(A|B^C)
\]
が成立するとき、つまりBであろうとなかろうと、Aの確率が一定であるとき、
\[
P(A|B)=P(A)
\]
が成り立ち、積事象は
\[
P(A\cap B) = P(A)P(B)
\]
となる。

つまり、P(A|B)の値がBに依存しないとき、AとBは「独立事象」である。このとき、
\[
P(A|B) = P(A), \quad P(B|A) = P(B)
\]
であり、
\[
P(A\cap B)=P(A)P(B)
\]
となる。

たとえば、同じサイコロを2度振る事象を考えよう。1回目のサイコロの目という事象を\(A_1\)、2回目のサイコロの目という事象を\(A_2\)とすると、\(A_1\)と\(A_2\)は独立であるから、\(A_1A_2\)は\(A_1\otimes A_2\)と表せる。\(A_1A_2\)の全事象Uの要素はしたがって6x6=36個となる。

一方で、男女50-50%の集団を、喫煙/非喫煙で分けたとき、喫煙者の男女比が50-50となり、非喫煙者の男女比も50-50となるだろうか?もしそうならば、喫煙の有無と男女との間には関係(相関)はないから、それぞれの事象は独立となる。しかし、現実にはそうならず、喫煙者には男が、非喫煙者には女が多く含まれ、喫煙有無と性別は「独立な事象」とは認められない。

以上の内容は、こちらのノートを参考にした。

2019年1月27日日曜日

確率の基礎:(1)和事象

和事象についてまとめておこう。事象Aと事象Bの和事象は\(A\cup B\)と表される。これは、
\[
A\cup B = A + B - A\cap B
\]
とも表せる。この関係式は、A+Bは重なり部分\(A\cap B\)が二重勘定してしまうから、その補正を引いておく必要があるという意味だ。
和事象\(A\cup B\)は、2つの円の外縁に相当する。
事象A,Bは重なり\(A\cap B\)を持つことを考慮する必要がある。
全事象Uが\(U=A\cup B\)であるとする。つまり、AにもBにも属さない事象はないものとする。このとき、確率\(P(U)\)は1に規格化される(確率の保存則といってもよいかも)。
\[
P(U) = 1
\]
事象Aが起きる確率を\(P(A)\)、事象Bが起きる確率を\(P(B)\)とすると、P(A)+P(B)は1を越えてしまう。というのは、重なり部分が二重勘定されているからだ。したがって、AかつBという事象が起きる確率\(P(A\cap B)\)を用いて、
\[
P(A\cup B) = P(U) = P(A) + P(B) - P(A\cap B)
\]
となる。特に、AとBが排反事象の場合、つまり\(A\cap B = \phi\)のとき、
\[
P(U) = P(A) + P(B)
\]
となる。このとき全集合ZはAとBの直和で書ける。
\[
 U = A\oplus B
\]
従って、
\[
P(U) = P(A\oplus B) = P(A) + P(B)
\]
が成り立つ。


2019年1月26日土曜日

センター試験数学IA: 確率の問題

数IAの第3問の確率の問題を見てみよう。

この問題は「確率の問題」の形態をとってはいるが、確率の計算を公式に当てはめるだけ、という考え方をするのではなく、「アルゴリズム」とか「シミュレーション」という観点から問題を捉えることにしよう。現実の現象の解析、たとえば、自動車の運転席の窓ガラスが事故で割れるメカニズムとか、風に吹かれた落ち葉が散った先の地面における分布だとかは、その運動を規定する方程式を完全に解き切って、解析的な解(厳密解という)を手にすることが、多くの場合、困難だ。そこで、方程式を細切れに切って(つまり離散近似して)数値計算によるシミュレーションを行い、運動の概略を知ろうとする。この場合、運動の分岐は確率的に取り扱い、分岐のタイプを「アルゴリズム」という形で定式化する。

この問題では赤白の袋やら玉が登場するが、「赤白」を分岐のパターンとみなせば、シミューレションの一種だと考えることが可能だろう。たとえば、白玉、赤玉という代わりに、ガラスの亀裂が右に入る、左に入る、という具合に考えることは可能だ、ということだ。

能書きはこの辺でやめておこう。この問題では、取り出した玉は袋にまた戻す。つまり、特定の色を取り出す確率は変化しないという性質は、アルゴリズムの観点からは重要な性質なので、忘れないようにしたい。

サイコロはアルゴリズムの初期値の設定につかう。つまり最初に玉を取り出す袋の色を決めるためにだけ使う。それは3の倍数か否かだ。

確率の問題の定式化で役に立つ概念は「集合」の概念だ。アルゴリズムの分岐や分岐条件は、現実に発生する事象をすべて網羅する必要がある。考慮すべき事象に漏れがあると、想定外の過程が発生するたびにシミュレーションの質が下がってしまう。

まずは、サイコロの目という事象を考え、これをdとおこう。dは1から6の間の整数値をとる。この集合をDと書こう。\(D=\{d=1,2,3,4,5,6\}\)。Dは2つの部分集合に分かれ、それは三の倍数の集合\(T=\{3,6\}\)と、その補集合\({T}^c=D-T=\{1,2,4,5\}\)だ。

\(D=T\oplus{T}^c=\{3,6\}\oplus\{1,2,4,5\}\)と直和の形に書ける。直和というのは、2つ(以上)の集合の間に重なりがない、つまり\(A\cap B = \phi\)が成り立つときの、和集合\(A\cup B\)のことだ。AとBは「排反事象」の関係にある、ともいう。

確率は
\[
P(T) = \frac{2}{6} = \frac{1}{3}, \\
P(T^C) = P(D-T) = 1 - \frac{1}{3} = \frac{2}{3}
\]
と書ける。当然ながら\(P(D) = P(T)+P(T^C)=1\)だ。

最初にサイコロを振る理由は、その結果を用いて、紅白の袋のどちらから玉を取り出し始めるか決めるためだ。袋の色の初期値決めみたいなものだ。n回目の取り出しに使う袋の色をC(n)と表せば、C(1)を決めるためにサイコロを振るということだ。\(T\)の場合は白い袋、\(T^C\)の場合は赤い袋を選ぶことになる。

プログラムでこのアルゴリズムを表せば、

if(\(T\))
   C(1) = W
else if (\(T^C\))
   C(1) = R 

といった感じだろう。

当然ながら、
 
白い袋を選ぶ確率 \(=P(T)=\frac{1}{3}\),
赤い袋を選ぶ確率\(=P(T^C)=1-P(T)=\frac{2}{3}\)

となる。

さて、赤い袋には赤:白=2:1、白い袋には赤:白=1:1で入っている。この事象をどう記号に表すかは、実は重要なポイントだ。当初は袋の色で事象を分けて、赤い袋ならR、白い袋ならWとしていた。これは、上のプログラムの内容を踏襲している。しかし、このやり方が色々と問題を起こすことはやってみるとわかる。「サイコロの目」という事象Dの次に問題となる事象は、「玉の色」であり、「袋の色」としない方が頭の中を整理しやすい。つまり、この問題は2つの事象が独立でない場合の「条件付き確率」の問題であり、Dに応じて「玉の色」という事象の確率が変わってくることを認識した方がいい。「玉の色」という事象をbで表す。bはr(赤)あるいはw(白)の二種類の値だけを持つ。この集合をBであ表すことにする。
\[B=\{b=r,w\}=R(r)\oplus W(w)\]
Bという集合がDの結果によって変わることを表すために、\(B_W, B_R\)という具合に識別することにしよう。前者が三の倍数、すなわちTが発生した場合の集合Bであり、後者がそうでない場合、つまり\(T^C\)の場合の集合Bに対応する。これらの集合の違いを際立たせるには、色が同じものには番号をつけて識別できるようにしておくのが良い(量子力学では識別できなくなるが、この問題で扱う玉は古典物理のそれだとしよう...)。つまり、
\[
B_R =\{b=r_1,r_2, w_1\}=R_R(r_1,r_2)\oplus W_R(w_1), \\
B_W=\{b=r_1, w_1\}=R_W(r_1)\oplus W_W(w_1)
\]
この表現は、「条件付き確率」の概念にフィットする。つまり、n=1の時の、赤い袋で赤い玉を出す確率というのは、Tが発生した下での赤玉が出る確率であり、それはP(r|T)と書くべきだろう。もちろん、それは2/3である。

条件付き確率をまとめておくと、
\[
P(r|T)=\frac{2}{3}, \quad P(w|T)= \frac{1}{3}\\
P(r|T^C)=\frac{1}{2}, \quad P(w|T^C)=\frac{1}{2}
\]
となる。

条件付き確率の引数となる「事象」は通常の「事象」とちょっと違う感じがする。例えば、A|Bというのは、「Bが起きた上でのAという事象」という風に表現できるが、\(A\cap B\)、つまり「AかつBという事象」とは違うものであることに注意しないといけない。前者の場合は、もうBが起きてしまっていることが仮定されている。つまり、「赤い袋を選んだ場合に、赤玉が出てくる確率」という類の確率だ。赤い袋を選ぶ過程に確率的なものが入っていないことが重要だ。一方で、\(P(A\cap B)\)の計算には、Bが起きるかもしれないし、起きないかもしれないしという確率的な過程が入り込み、その上でAが起きる確率を考えるために、\(P(A|B)\)が必要となる。結局は問(1)の場合をよく理解すると、具体的な「感覚」が身につくだろう。

問(1)は、最初のステージn=1での話である。サイコロによって決まった袋の色に対して、何色の玉が出るかを考える問題だから、典型的な条件付き確率の問題だ。しかも、最初の事象Dの結果によって、特定の色が出る確率が変化するから、DとBが独立でない場合になっている。つまり、DとBの組み合わせ事象DBが、集合の直積\(D\otimes B\)とは表せない場合に相当する。問題となるのは、\(P(r|T)\)を答えるのか、それとも\(P(R\cap T)\)を答えるのか、という判断であるが、問題文をよく読むと「赤い袋が選ばれ」とあるから、赤い袋が選ばれる過程に確率的な過程が入り込んでいる。したがって、計算するのは、後者、つまりDとBの積事象の確率\(P(R\cap T)\)である。したがって、積事象の公式により、
\[
P(R\cap T) = P(r|T)P(T) = \frac{2}{3}\cdot\frac{2}{3}=\frac{4}{9}
\]
となる。同様に、n=1で白い袋が選ばれ、そこから赤い玉を取り出す確率は、
\[
P(W\cap T^C)=P(w|T^C)P(T^C) = \frac{1}{2}\cdot\frac{1}{3} = \frac{1}{6}
\]
と計算される。

次の問(2)は、袋の色を考える事象の問題で、「2回目が白い袋」である確率を計算せよ、というのだが、2回目が白袋、というのは「1回目が赤袋で2回目が白袋」という事象と「1回目が白袋で2回目も白袋」という事象の2つの合計であるから、それぞれの確率の和になる。しかし、2回目の袋の色が白になるためには、1回目に取り出した玉が白でないといけないから、より厳密に書くと、「1回目が赤い袋となり、そこで白い玉を取り出す確率」+「1回目が白い袋となり、そこで白い玉を取り出す確率」ということになる。つまり、
\[
P(T^C\otimes R_w)+P(T\otimes W_w) =  P(T^C)P(R_w) + P(T)P(W_w) =
\frac{2}{3}\cdot\frac{1}{3} + \frac{1}{3}\cdot\frac{1}{2} = \frac{7}{18}
\]

(3)にいこう。1回目の操作で白玉を出す確率pと2回目の操作で白玉を出す確率wの間には線形関係\(w=kp+\frac{1}{3}\)が成り立つそうで、その比例係数kを求める問題である。

2回目の操作で白玉を出すというのは、(i)2回目に白い袋で白玉を出す場合と(ii)2回目に赤い袋で白玉を出す場合の2通りがある。

(i)の場合、1回目がどちらの袋であろうとそこで白玉を出さないと、2回目に白い袋から取り出せないので、\(p\cdot \frac{1}{2}\)という確率になる。

(ii)の場合は、1回目に赤玉を取りだし、2回目に赤い袋で白玉を取り出す確率となるので、\((1-p)\cdot\frac{1}{3}\)という確率になる。

したがって、2回目に白玉を取り出す確率\(w\)は、
\[
w = p\cdot\frac{1}{2} + (1-p)\cdot\frac{1}{3} = \frac{1}{6}p + \frac{1}{3}
\]
となる。 つまり\(k=1/6\)となる。

1回目の操作で白玉を出す確率pは、白袋で白玉を選ぶ確率\(\frac{1}{3}\cdot\frac{1}{2}\)と、赤袋で白玉を選ぶ確率\(\frac{2}{3}\cdot\frac{1}{3}\)の和になるので、
\[
 p = \frac{1}{6} + \frac{2}{9} = \frac{7}{18}
\]
と求まるが、これは(2)の答えと一致している。(2)は「2回目に白い袋」の確率なので、1回目に白玉を引いた確率、つまりpと同じ意味になっている。これに気づけば、上の計算は必要なくなる。いずれにせよ、これをwとpの関係式に代入すると、
\[
w = \frac{1}{6}\cdot\frac{7}{18} + \frac{1}{3} = \frac{43}{108}
\]
となる。
続けて、3回目に白玉が取り出される確率uは、2回目に白玉が取り出される確率wを用いて、\(u = \frac{1}{6} w + \frac{1}{3}\)と表せるので、\(w=43/108\)を代入し、\[u=\frac{259}{648}\]という結果を得る。

確率の問題では、センター試験でも結構えげつない数字が出てくるのをみて、少し安心した。いつでも、教科書に出てくるような簡単な数字に抑えるのはやはりちょっと無理のようだ。受験生は、こういう数字が出てきても驚かないように心の準備をしておくべきだろう。

さて、いよいよ最後の(4)にとりかかろう。条件付き確率の計算法の確認問題で、内容は簡単だ。が、計算すべき分数が複雑になるので、計算間違いに気をつけたい。

2回目の事象が白玉となる場合というのは、(i)白い袋で白玉を取り出す場合と、(ii)赤い袋で白玉を取り出す場合の2通りあるが、この場合はすでに問(3)で考察済みで、前者は\(p/2\)、後者は\((1-p)/3\)となる。したがって、この条件のうち、白袋で白玉を取り出す条件付き確率は、
\[
 P(w|W)=\frac{p/2}{p/2 + (1- p)/3} = \frac{p/2}{p/6+1/3}
\]
と表せ、これに上で求めた\(p=7/18\)を代入すると\(P(w|W)=\frac{21}{43}\)を得る。

一方、3回目の事象が白玉だったとき、それが初めてだった条件付き確率というのは、3回目の事象が白玉であるすべての事象をひとつひとつチェックしていけば基本的には解ける。ただ、(3)で3回目が白玉だった確率が259/648で与えられているから、条件付き確率の分母にはこの数字がくるはずである。とすると、1回目に赤袋で赤玉あるいは白袋で赤玉、2回目に(赤袋で)赤玉、そして3回目に赤袋で白玉が出る確率は、
\[
 \left(\frac{2}{3}\cdot\frac{2}{3}+\frac{1}{3}\cdot\frac{1}{2}\right) \frac{2}{3}\frac{1}{3} = \frac{11}{81}
\]
と計算されるので、答えは
\[
\frac{\frac{11}{81}}{\frac{259}{648}} =  \frac{88}{259}
\]
となる。




2019年1月21日月曜日

センター試験数学II (2019) : 対数と指数

ようやく2019年の問題が公開されたので、さっそく数IIの指数/対数の問題を解いてみよう。今年は、指数と対数が混ざった問題で、結局は連立方程式を解くことになるパターンだった。

与えられた式は、対数関数の方程式と指数関数 の方程式、ひとつずつ。
\[
\log_2(x+2)-2\log_4(y+3) = -1 \\
\left(\frac{1}{3}\right)^y - 11\left(\frac{1}{3}\right)^{x+1} + 6 = 0
\]

まずは、対数の方程式から簡単にしていこう。一目瞭然なのは、この方程式は初項と第二項で底が一致していないので、揃えることにする。\(4=2^2\)なので、底は2で揃えるのが便利だろう。
\[
\log_4( y+3) = \frac{\log_2(y+3)}{\log_2 2^2} = \frac{1}{2}\log_2(y+3)
\]
であるから、最初の方程式は
\[
\log_2(x+2) -\log_2(y+3) = -1 \Longleftrightarrow \log_2\left(\frac{2(x+2)}{y+3}\right) = 0
\]
と変形できる。\(\log_2 1 = 0\)だから、
\[
y= 2x + 1
\]
という線形方程式が出てくる。つまり、最初の式は、結局はこの簡単な線形方程式にすぎないのに、「わざわざ対数表現を使って、「京都弁」のような持って回った表現をしていたということだ(京都の皆様、ごめんなさい)。しかし、注意する点が一つだけある。それは、最初の対数方程式と、上の線形方程式が対応している場所が、真数条件によって限られているという点である。その条件を満たさない場所では、両者は等価とはいえない。等価であることがいえる領域とは、
\[
x+2 > 0, y+3 > 0
\]
である。この条件は後で方程式の解を決めるときに重要な役割を果たす。 

次は2つ目の式の変形に移ろう。この式は特に京都風の表現になっているわけではないが、上の線形関係を代入することで2次方程式と等価であることが示せる。yを消去するパターンを問題では想定しているが、両方でやってみよう(こういう考察は新しい共通試験の対策にもなるので)。

まずはyを消去する。この場合、指数に分数が登場しないので面倒なことは発生しない。
\[
 \left(\frac{1}{3}\right)^{2x+1} - 11 \left(\frac{1}{3}\right)^{x+1} + 6 = 0
\]
この問題は教科書によく出ているタイプの方程式で、\(t = (1/3)^x\)という変数を導入して書き直すのだ。そうすると、
\[
\frac{1}{3}\left(t^2 - 11 t\right) + 6 =0
\]
となる。両辺に3をかけて因数分解をすると、上式は\((t-2)(t-9)=0\)とまとまるので、この2次方程式の解は\(t=2,9\)、すなわち\((1/3)^x = 2, 9\)を得る。両辺の対数をとると
\[
x\log_3\frac{1}{3} = \log_3 2, \log_3 3^2 \Leftrightarrow x = -\log_3 2 , -2
\]
という結果を得る。しかし、真数条件により\(x>-2\)であるから、2つ目の解は除外しなくてはならない。したがって、答えは\(t=2\)のとき、すなわち
\[
x = -\log_3 2 = \log_3\frac{1}{2}
\]
である。この結果を線形関係式に代入すると\(y=\log_3\frac{3}{4}\)を得る。

問題では、真数条件をtに対して再解釈させているが、この問題に答えるには指数関数の性質を利用する。tとxの関係を
\[
t(x) = \left(\frac{1}{3}\right)^x  =3^{-x}
\]
という関数だと考えればよい。まず、負冪の指数関数は単調減少のグラフとなり、\(x\rightarrow\infty\)で0に収束する(\(t(x)\rightarrow 0\))。したがって、t(x)の上限値はxの下限\(x\rightarrow -2\)に対応するから、t(x)<9である。t(x)の下限は、収束値と単調減少性を考慮すると\(x\rightarrow\infty\)のときだから0となる。まとめると、0<t(x)<9が答えとなる。

参考のためにyでまとめたらどうなるかやってみよう。x = (y-1)/2だから、
\[
\left(\frac{1}{3}\right)^y - 11\left(\frac{1}{3}\right)^{\frac{y-1}{2}} + 6 = 0
\]
となる。一番自然な選び方は
\[
s = \left(\frac{1}{3}\right)^{y/2}
\]
だと思うので、これを採用すると、上式は
\[
s^2 - {11}{\sqrt{3}}s + 6 = 0 
\]
となり、無理数を係数にもつ2次方程式となる。この方程式は解けないわけではないが、xについてまとめた場合に比べて格段に面倒臭いのがわかる。来年の受験生なら、計算力のトレーニングのために、やり続けるのはためになるだろう。再来年以降の受験生なら、どうしてyではなく、xについてまとめた方がいいのか、その理由を考えるというのは、よい勉強になると思う。もちろん、その答えの一つが「無理数の係数が入るから」であるが、そのほかにもあるかどうか、いろいろと分析してみたらよいだろう。







2019年1月20日日曜日

センター試験の数学II:指数と対数(2)

数IIの大問1の半分は指数/対数の問題で、これらは他の分野と結合することが多い。平成26年の問題は整数の問題と結合している。

m,nは自然数。つまり、1,2,3,...という、1以上の正の整数とする。(0が入らないのがポイントで、それは対数の真数条件を満たすため。)与えられた式は
\[
\log_2m^3 + \log_3 n^2 \leqq 3
\]
という不等式で、これを満たす整数(m,n)を全部探してね、という問題だ。

最初の2つは具体例であり、こういう計算はこの問題に限らず、いつでもやってみる価値はある。具体的な計算を通して、見通しを明らかにするのである。現代数学でも、最初にコンピューターで数値計算してみて、公式や定理の傾向を掴んで定式化する方法論も取り入れられつつあると聞く。

(m,n)=(2,1)のときは、左辺が3になるので条件を満たす(等号の場合)。
(m,n)=(4,3)=(\(2^2,3\))のときは、 左辺=6+2=8なので条件を満たさない。

上の計算をやってみると、整数m,nのべきの数が不等式を成立を左右しているように見える。そこで、べきの部分を対数の中から引っ張り出してみたくなる。

\[
3\log_2 m + 2\log_3 n  \leqq 3
\]

真数条件より\(m,n > 0\)だし、そもそも\(m,n\)は自然数だから\(\log_2 m\)も\(\log_3 n\)も正数となる。したがって, \(x,y\geqq 0\)に対し、\[3x+2y \leqq 3\]のような関係式を考えるのと同じだ。

ただし、xは整数mによって決められるので、小さい順に並べると、m=1のときx=0, m=2のときx=1, m=3のとき\(x=\log_2 3\), m=4のとき, x=2,...といった感じである。しかし、3x+2y=3のx切片は1なので、m=1,2の場合のみを考えればよいことがわかる。

xと同様に、yの値も離散的になっている。小さい順にy=0(n=1), \(y=\log_3 2\)(n=2), y=1 (n=3),...となる。yが取りうる最大値は3x+2y = 3のグラフのy切片である3/2だが、y=3/2のときに対応するnはどのくらいの値になるだろうか?\(y=\log_3 n = 3/2\)をnについて整理すると\(n=3^{3/2}=3\sqrt{3}=3\cdot 1.73...\sim 5.19...< 6\)となる。つまり、nに関しては、n=1,2,3,4,5を考えることになる。

したがって、m=1,2の2通り、n=1-5の5通り、合計10通りについて不等式成立の有無を調べればよいことになる。

この問題の最初でやった具体的計算はy=0(つまりn=1)の場合に相当する。このとき不等式を満たすx軸の領域は\(0\leqq x \leqq 1\)である。\(x=\log_2 m\)だから、この領域は
\[
0 \leqq \log_2 m \leqq 1 \Longleftrightarrow \log_2 1 \leqq \log_2 m \leqq \log_2 2
\]
と表せるが、対数関数は一様増加な関数だから
\[
1 \leqq m \leqq 2
\]
と同じこととなり、mは自然数だからm=1,2となる。つまり、y=0(n=1)のときは、(m,n)=(1,1),(2,1)が不等式を満たす組み合わせである。

次にn=2の場合について考えてみたいのだが、このとき\(x=\log_3 2\)となるが、この値を記憶している人はそうはいないだろう。もしかすると\(\log_{10} 2=0.301, \log_{10} 3 = 0.4771\)を覚えている稀有な人が若干はいて、底の変換を用いて
\[
\log_3 2 = \frac{\log_10 3}{\log_10 2} = \frac{0.4771}{0.3010} \sim 1.58...
\]
と計算できる人がいるかもしれない。が、これは面倒だ。しかも、nを走らせて、対応するmを探すのは場合分けが増えてしまって手間がかかる。したがって、nの代わりにmを走らせて、つまりm=1とm=2の場合についてnを動かしながら考察する方が効率的に思える。

m=1の時、つまりx=0のとき、条件式は\(y\leqq \frac{3}{2}\)となる。 これを満たすyは上ですでに考察している。つまりm=1,2,3,4,5の5通りである。

次にm=2の時、つまりx=1のとき、条件式は\(y\leqq 0\)となるから、y=0、つまりn=1の場合に限られる。

したがって、不等式を満たすm,nの組みは(m,n)=(1,1),(1,2),(1,3),(1,4),(1,5), (2,1) の6通りとなる。

対数関数は実数関数ので取りうる値は実数全体となる。しかし、対数の引数(真数)が整数に限られる時、対数が取りうる値は離散的になり、制限が加わる。こういうタイプの計算は量子力学で見かけるので、楽しんで解いておくとよいだろう。

センター試験の数学II:指数と対数の問題

数IIの大問1は伝統的に、三角関数と対数/指数に関する問題となっている。大学の先生が一番嫌うのは、「パターン化した解法」で次々と問題を「処理」されてしまうことだ。ところが、センター試験の受験時間は短い上に、「パターン化した解法」を身につけていないと解き難い問題が時折含まれていて、受験生はこの矛盾に非常に悩まされる。時間切れの恐怖を感じずに、正々堂々と問題に取り掛かる精神力を身につけるのは並大抵ではない。

そういう面から見ると、数IIの最初の問題に出てくる「対数/指数」の問題は、純粋な対数/指数の内容だけに限って問題を作れば「易問」となる傾向がある。たとえば、平成29年の問題だ。しかし、逆に考えれば、単体で問題をつくるのは難しいので、いろいろな分野と組み合わせることが多く、「難しくなる」ことも多い。例えば、整数の問題と組み合わせたのが平成26年の問題。不等式と組み合わせたのが平成30年。グラフの対称性や逆関数の関係を問題としたのが平成28年。

したがって、数IIの対数/指数問題は、見たことのあるパターン問題ならば、最初にやりきってしまい、見たことない場合は、ちょっと解いてみて行けそうなら行く、時間がかかりそうだったら後に回して先を急ぐ、というやり方がいいのかもしれない。

まずは、対数/指数の典型的な「易問」である平成29年をみてみよう。これは底の変換を題材にした問題で、対数の中だけで問題が閉じていて、他の分野と組み合わせてはいない。ただ、底の変換の公式を忘れてしまうと手も足も出ないので、そうならないように、その場で公式を再導出できるようにしておくと安心だ。

\[
c=\log_b(a)
\]
とする。逆関数の関係を使って、指数の関係に戻すと、上の関係式は
\[
b^c = a
\]
となる。両辺を、底\(k\)の対数をとると
\[
\log_k(b^c) = \log_k(a)
\]
となるが、左辺は\(c\log_k(b)\)となるから、
\[
 c = \frac{\log_k(a)}{\log_k(b)}
\]
となって、底の変換の関係式を得る。 ■


さて、平成29年の問題I(2)を見てみよう。


A(0,3/2)があたえられ、さらに関数\(f(x)=\log_2(x)\)に対して、B(p,f(p)), C(q,f(q))が定義される。ABを1:2に内分する点がCになっているとき、p,qを決めてくれ、という問題。

内分点の座標を出す公式というのはあるはずだが、そんなのいちいち覚えてられないという人はベクトルの代数で再導出するとよい。

内分点は\(\vec{AB}\)の上にあり、点Aから見て1/3の場所だというから、\(\frac{1}{3}\vec{AB}\)である。ただし、これは点Aから見た場合であって、座標というのは原点Oから見た場合の位置ベクトルなので、\(\vec{OC}\)を計算する必要がある。Aから見た場合とOから見た場合は、\(\vec{OA}\)だけのズレがあるので、
\[
\vec{OC} = \vec{OA} + \frac{1}{3}\vec{AB}
\]
である。\(\vec{AB}=\vec{OB}-\vec{OA}\)なので、内分点の公式が手に入るというわけだ。物理では力の合成などの計算でこの手の計算はよく出てくる。

この計算により\(\vec{OC} = (\frac{1}{3}p, \frac{1}{3}\log_2 p + 1)=(q,\log_2 q)\)という結果はすぐにわかる。qとpに関する2つの関係式が、これにより手に入ったので、連立方程式を解いてp,qを決めることができる。対数や指数の問題を、連立方程式にするタイプの問題は結構よく出題される(たとえば平成27年もそう)。

通常の一次式の連立方程式は、足し算、引き算が問題となるが、対数や指数では、足し算が掛け算に、引き算が割り算へと変換される、という特性がある。たとえば、\(e^x e^y = e^{x+y}\)とか、\(\log(x/y) = \log x - \log y\)とかいう性質である。

今回は対数から真数への対応を考えるので、足し算/引き算から掛け算/割り算への変換を考えることになる。 たとえば、y座標に関する条件は
\[
\frac{1}{3}\log_2 p + 1 = \log_2 q
\]
だが、足し算/引き算→掛け算/割り算の関係を用いて、上式を単項式にすることができる。そのとき、真数は「掛け算/割り算」でまとまっていくことに注意。
\[
\log_2\left(\frac{p^{1/3}\cdot 2}{q}\right) = 0
\]
となる。この条件式と、x座標の条件式を組み合わせると答えが出てくるが、最後の最後にいやらしい計算問題が待ち構えている。数値計算である...

この問題のいやらしい点は、底の変換をやらせるところである。ここまでの計算は2を底とした対数でやらせておいて、最後は常用対数で計算させるというのである。こういう計算は、関数電卓が存在する現代ではもうやる必要はないはずだが、有効数字を理解させるとか、そういう目的で入っているのかもしれない。にしても、データが小数以下4桁の制度まで書いてあって、計算は小数以下2桁で行えというのは、つじつまがあわない。センター試験でこういう問題を出すのはもう時代遅れではないか?

物理では、対数ー対数グラフとか、片対数グラフというのを、実験の分析などでよく利用したものだ。(gnuplotではset logで利用できるし、PCやmacのソフトを使って実験データを整理すれば、対数グラフのノートはもう必要ないのかもしれないが、もしかすると大学の生協にはまだ売っているかもしれない。)

物理量として非常に大きな値が観測値として出てくるものに関しては、対数に変換してから相関を見るという手法は物理でよく用いる。最初に思いつくのは、磁気ボーデの法則だ。惑星の自転による角運動量と、惑星の磁場の強さについて、それぞれの対数をとってプロットすると、火星と金星を除いて直線上に乗るという相関が見られる。(どうして「火星と金星を除き」なのかという問題は、現代の天文学にとって大きな問題であり、まだ完全には解明されていない。実際、昨年末に火星に着陸したNASAのInSightは、この特異性を解明するために派遣された。)

2019年1月19日土曜日

センター試験の数学II:相加相乗平均

センター試験の時期となった。今年も面白い問題がいろいろと出てくることを期待したい。

まずは、センター試験で時々出題される「相加相乗平均」の関係式
\[
 \frac{a+b}{2} \geqq \sqrt{ab}
\]
について復習しておこう。例えば、平成27年に出題されている。

等号が成立する条件、すなわち相加平均の最小値、も合わせて記憶しておかねばならないが、それは\(a=b\)の時である。どうして\(a=b\)のときに等号が成り立つかというと、それは証明をみれば明らかとなる。

[よくある証明]

\(a,b>0\)に対し、
\[ \left(\sqrt{a}- \sqrt{b}\right)^2 \geqq 0 \] は常に成立する。当然、等号が成り立つのは\(a=b\)の時に限られる。左辺を展開すると\(a+b-2\sqrt{ab}\)となるが、最後の項を右辺に移項して両辺を2で割れば、相加相乗平均の式となる。■

正の数が3つに増えた場合、すなわち
\[
\frac{a+b+c}{3} \geqq \left(abc\right)^{1/3}
\]
も成り立ち、等号はこの場合も\(a=b=c\)のとき成り立つ。

さらに、\(n\)この場合にも成立し、等号はこのときも\(a_1=a_2=\cdots = a_n\)のとき成り立つ。
\[
\frac{1}{n}\sum_{i=1}^n a_i \geqq \left(\prod_{i=1}^n a_i\right)^{1/n}
\]

\(n=3\)の場合の証明、さらには帰納法を使った一般の場合の証明の例は、こちらの論文で確認できる。

さて、平成27年の問題において、相加相乗平均の公式を忘れてしまったとしても、普通に微分すれば答えは出ることを確認しておこう。

\(x=2^{-3}a^{-2}, y=2^2a^2\)の場合、\(a>0\)を動かした時に、\(x+y=f(a)\)の最小値を見つける問題だ。相加相乗平均の公式を適用するときは、\(xy=2^{-1}\)を計算しておけばよい。積を計算すると、\(a\)に依存する部分が相殺するのがこの問題の「うまい」ところだ。これにより計算は簡単となって、\(x+y\)の最小値は\(2/\sqrt{2}=\sqrt{2}\)とあっという間に求まる。最小値となるのは\(x=y\)のときなので、
\[
 2^{-3}a^{-2} = 2^2a^2
\]
を\(a\)について解けば、\(a=2^{-5/4}\)を得る。

この問題を解くだけなら、こういう「幸運」にすがってもよいのだろうが、実際の研究においてこんなうまいことばかりが起きるとは限らない。
\[
f(a) = x + y = 2^{-3}a^{-2} + 2^2a^2
\]
を\(a\)の関数だと思って、\(a>0\)の領域で\(f(a)\)の最小値を計算してみる。まず微分すると、
\[
\frac{df(a)}{da} = -2^{-1}a^{-3}+ 2^3a
\]
となる。したがって、\(df(a)/da=0\)の解を求めると\(a=\pm 2^{-5/4}\)を得る。増減表を丁寧に作れば、\(a=2^{5/4}\)のときに極小値を得る。最小値かどうかは\(a\rightarrow 0\)の時の\(f(a)\)の振る舞いで決まるが、
\[
\lim_{a\rightarrow 0} f(a) = +\infty
\]
なので、極小値は最小値であることがわかる。したがって、\(x+y\)の最小値\(f(2^{5/4})=\sqrt{2}\)を得る。

上で見たように、掛けると指数部分が相殺して0となるようにしておけば、微分積分をするよりも、相加相乗平均の公式の方が簡単に求まる。とすると、次のようなタイプの関数の最小値は相加相乗平均で求まるということだろう。

\[
f(x)= c_0 x^{n} + c_1x^{-n}
\]

ただし、相加相乗平均の公式を使うときは、初項と第二項が正値のときに限られることには注意しないといけないので、例えば\(x>0, c_0, c_1>0\)のとき、最小値は
\[
x_0=\left(\frac{c_1}{c_0}\right)^{\frac{1}{2n}}
\]
のときで、\(f(x_0) = 2\sqrt{c_0c_1}\)となるが、この結果は微分しても、相加相乗平均でやっても同じ結果だ。

指数関数の場合もいけるだろう。

\[
g(x) = d_0 \exp(x) + d_1\exp(-x),
\]
 ただし\(d_0, d_1 > 0\)とする。

こういうタイプの関数は(1次元の)量子力学の計算で出てきそうな感じがする。実例はいまのところ思い浮かばないが、出くわしたら追記に書いておこう。

面白いのは、正負のべきが対称的に含まれる多項式の最小値は、一般の相加相乗の公式で簡単に求まるはずだ。例えば、
\[
 f(x) = 2x^3 + 3x^2 + x + 3 + 2x^{-1} + x^{-2} + 2x^{-3}
\]
という関数の最小値は、相乗平均により\(2\cdot 3 \cdot 1\cdot 3 \cdot 2 \cdot 1 \cdot 2=2^3\cdot 3^2\)の7乗根に7を掛けたものとして求まるのだろうか?