バナナでもわかる話

開設当初は計量経済学・統計学が専門の大学院生でした。今はデータを扱うお仕事をしています。統計学・経済学・投資理論・マーケティング等々に関する勉強・解説ブログ。ときどき趣味も。極力数式は使わずイメージで説明出来るよう心掛けていますが、時々暴走します。

【初心者向け】2017年統計検定1級数理問5の解説

前回問4までやりました。
bananarian.hatenablog.com


今回で2017年の統計数理は最後ですね。
2017年 統計検定1級 統計数理 問5 対策用解説 を始めていきます。

スポンサーリンク


問5の概要

f:id:bananarian:20180921155941p:plain

標準正規分布に従う確率変数の二乗和はカイ二乗分布に従うという話について、確認したことはありますか?
という話ですね。ちなみに[2]はそこから更にF分布の導出を要求しており、[3]は多少マイナーですが、コーシー分布の密度関数の導出ですね。

こうしてみてみると、統計検定、各分布の導出が多い印象がありますね~。



問5[1]

f:id:bananarian:20180921160618p:plain

やはり、統計検定で変数変換は必須ですね~。この手の問題については問3でも問4でもやりましたね。
 V=Z^2

という形で変数変換をしていますので、今回使う変数 Z
 Z=V^{\frac{1}{2}}となります。

よって
 f(v)=\varphi(v^{\frac{1}{2}})\frac{dZ}{dv}.....!!

とすると間違いになります。何故なら、 v^{\frac{1}{2}}≧0であるわけですが、 \varphi(・) ・の範囲は -\inftyから \inftyです。よって、条件付分布で考えなければなりません。

ここで \varphi(x|x≧0)=\frac{Prob(x,(x≧0))}{Prob(x≧0)}であり

※これは直感的にわかりますかね。要は x≧0の範囲で全体の和が1にならなければならないので、標準化しています。

 Prob(x≧0)=(標準正規分布の丁度半分)=\frac{1}{2}

よって \varphi(x|x≧0)=2Prob(x,(x≧0))


以上より、
 f(v)=\varphi(v^{\frac{1}{2}}|x≧0)\frac{dZ}{dv}=2\varphi(v^{\frac{1}{2}})\frac{dZ}{dv}=\frac{1}{\sqrt{2\pi}}\frac{1}{\sqrt{v}}e^{-\frac{v}{2}}



問5[2]

次行きます。
f:id:bananarian:20180921181107p:plain

F分布ですね。もう方針は変数変換一本です。
 s=\frac{x}{y}
 u=x
とおくことにしましょう。

この時、
 x=u
 y=\frac{u}{s}

であるが、

 \frac{\partial x}{\partial u}=1
 \frac{\partial x}{\partial s}=0
 \frac{\partial y}{\partial u}=\frac{1}{s}
 \frac{\partial y}{\partial s}=-\frac{u}{s^2}

なので、

 g(s)=\int_{0}^{\infty}|-\frac{u}{s^2}|f(u)f(\frac{u}{s})du


はい。あとは頑張って積分するだけです。計算間違いに気を付けてください。
私も今回の記事を書くにあたって、積分ミスって結構詰まりました(笑)
一応計算プロセスを書いておきます。

 g(s)=\frac{1}{2\pi}\int_{0}^{\infty}\frac{\frac{u}{s^2}}{\frac{u}{\sqrt{s}}}exp(-\frac{1}{2}u(1+\frac{1}{s}))du
 =\frac{1}{\pi\sqrt{s}(1+s)}\int_{0}^{\infty}\frac{1+s}{2s}exp(-\frac{u}{2}(1+\frac{1}{s}))du
 =\frac{1}{\pi\sqrt{s}(1+s)}\int_{0}^{\infty}\frac{1}{2}(1+\frac{1}{s})exp(-\frac{u}{2}(1+\frac{1}{s}))du
 =\frac{1}{\pi\sqrt{s}(1+s)} [-exp(-\frac{u}{2}(1+\frac{1}{s}))]_{0}^{\infty}
 =\frac{1}{\pi\sqrt{s}(1+s)}(0-(-1))=\frac{1}{\pi\sqrt{s}(1+s)}


はい。出てきました。どうせたどり着くべき式がわかっているので、強引に外に出してしまえば、後は積分さえ間違わなければ1になって消えるよねって感じで出せます。

試験時間は短いので、当然こういうプロセスを経るべきです。



問5[3]

最後ですね。
f:id:bananarian:20180921190242p:plain

何やらヒントがあるので使っていきましょう。

 \frac{x}{y}=tan^2\theta=\frac{sin^2\theta}{cos^2\theta}

つまり
 x=sin^2\theta
 y=cos^2\theta
と置くことにします。

ここで
 x-y=sin^2\theta-cos^2\theta=-cos 2\theta
 xy=(cos^2\theta)(sin^2\theta)=(cos\theta sin\theta)^2=(\frac{1}{2}sin2\theta)^2

よって
 t= \frac{cos2\theta}{sin2\theta}=-\frac{1}{tan2\theta}

ここで[2]より、sは g(s)に従うので変数変換で....と行こうとすると出来ません!!やってみたらわかりますが、うまく変形できません。

そこで次のようなものを考えることにします。

 g(s)ds

これは、要はsが微小に変化した部分と密度部分の積で、要は面積を出す形になり、微小な確率を表します。

密度関数は1点を取ってくると0ですが、微小に変化させた部分の面積を取ってくることで確率を求めることができるわけでしたね。

これを変形していきます。

 g(s)ds=g(s)\frac{ds}{d\theta}d\theta=\frac{2}{\pi}\frac{d\theta}{dt}dt=h(t)dt
これで、tが微小に変化した場合の式に変換できたので、 h(t)さえわかればそれがtの確率密度になります。

というわけで、ここで知りたいのは \frac{d\theta}{dt}です。


 t=-\frac{1}{tan2\theta}であったので、
 \frac{dt}{d2\theta}=\frac{1}{(cos^22\theta)(tan^22\theta)}=\frac{1}{sin^2 2\theta}ですね。

更にこれを利用すると
 \frac{dt}{d\theta}=\frac{dt}{2\theta}\frac{2\theta}{d\theta}=\frac{2}{sin^22\theta}

最後に逆数を取ってやれば
 \frac{d\theta}{dt}=\frac{sin^22\theta}{2}

つまり、
 g(s)ds=\frac{2}{\pi}\frac{d\theta}{dt}dt=\frac{2}{\pi}\frac{sin^22\theta}{2}dt=h(t)dt


よって h(t)=\frac{2}{\pi} \frac{sin^22\theta}{2}です。


あれ?求めたい答えにまだたどり着いていませんね。もし、この計算が間違っていなければ
頑張って計算してやれば \frac{sin^22\theta}{2} \frac{1}{2(1+t^2)}が同じになるはずですね。

 (1+t^2)=1+\frac{1}{tan^22\theta}=\frac{1+tan^22\theta}{tan^2 2\theta}=\frac{cos^22\theta}{tan^22\theta}=\frac{1}{sin^22\theta}

はい、求まりました。


以上より
 h(t)=\frac{1}{ \pi(1+t^2)}


これで2017年数理終わりですね~お疲れさまでした。
問5については、簡単そうに見えて意外と[3]辺りは初見だと詰まりそうですよね。
あと、一般化して証明しているばかりだと、このような具体的な計算で詰まる人も出てきそうですね。

具体的にこういう分布の時はどうやって導出するんだろう?といったことを疑問に思って訓練する必要がありそうです。