バナナでもわかる話

計量経済学・統計学が専門の大学院生です。統計学・経済学・投資理論・マーケティング等々に関する勉強・解説ブログ。ときどき趣味も。極力数式は使わずイメージで説明出来るよう心掛けていますが、時々暴走します。

【初心者向け】2017年統計検定1級数理問4の解説

前回までで問3までやりましたね。

bananarian.hatenablog.com


で、同じ要領で問4やっていきます。

そういうわけで今回も2017年 統計検定1級 統計数理 問4 対策用解説 を始めていきます。

問4の概要

今回のセットアップはこんな感じです。
f:id:bananarian:20180918101918p:plain

二種類の標準正規分布に従う確率変数を線形の形でくっつけてます。
変数変換からの分布の導出はやはり頻出ですね。

正規分布には面白い性質があって、多変量同時分布の条件付き分布は正規分布になるし、再生性もあるので、和をとってもやっぱり正規分布になるんです。今回の問題でそこまで証明するか、この辺の話は既知として問に答えるかは時間との相談ということになりそうです。

今回は面倒なのでその辺は既知のこととして話を進めていきます。
まあ別に既知としなくても、いうてそこまで手間ではないので、時間的な余裕があれば、再生性に関してはヤコビアン使って分布を求めてやって、条件付分布に関してはベイズルールに従って条件付き分布をうまく正規分布の形にもっていってください。


問4[1]

f:id:bananarian:20180918102447p:plain

これは正規分布の再生性に関する問ですね。サクっと解いていきましょう。

正規分布の再生性から、Zも正規分布に従う。更に期待値と分散は次のよう

 E[Z]=a+kE[X]+E[Y]=a
 V[Z]=k^2V[X]+V[Y]+Cov[X,Y]=k^2+1

よって期待値 a、分散 k^2+1正規分布に従う。


※もし時間があれば本当に正規分布に従うか分布を出してやった方が、安全かもしれません。



問4[2]

f:id:bananarian:20180918105218p:plain
相関係数は、共分散を標準化してやればよいので、とりあえず共分散を出しましょう。


 Cov(X,Z)=Cov(X,a+kX+Y)=kCov(X,X)=kV(X)=k

よって相関係数 \rho(X,Z)
 \rho(X,Z)=\frac{Cov(X,Z)}{\sqrt{V(X)V(Z)}}=\frac{k}{\sqrt{k^2+1}}


問4[3]

f:id:bananarian:20180918105231p:plain

正規分布の条件付き分布も正規分布っていうのはよく知られた事実なので、まあ時間が余るようなら証明を加えれば良いような気がします。

とりあえず条件付期待値と条件付分散を出してみますか。

 E[Z|X=x]=a+kx
 V[Z|X=x]=1

よって、期待値 a+kx、分散 1正規分布である。

※正直再生性は既知のものとしているのに、こっちは既知としないのはよくわからないわけですが、一応指定教科書には再生性に関する記述はあれど、条件付分布が正規分布になるとは書いていないので、心配ならば分布を求めてやればよいと思います。


問4[4]

f:id:bananarian:20180918105805p:plain

最後ですね。
 f(x|Z=z)f(z)=f(z|X=x)f(x)なので

 f(z|X=x)f(x)=N(a+kx,1)×N(0,1)
 f(x|Z=z)=\frac{N(a+kx,1)×N(0,1)}{N(a,k^2+1)}

ですね。なんか非常に投げやりなノーテーションですが、正規分布の式を一々書くのが記事上だととても面倒くさいので、まあ許してください(笑)

あとはゴリゴリ正規分布の形に直すだけです。

計算してやると

 f(x|Z=z)=\frac{1}{\sqrt{2\pi(\frac{1}{k^2+1})^2}}exp(-\frac{(x-\frac{k(z-a)}{(k^2+1)})^2}{2(\frac{1}{k^2+1})})

ということで、正直正規分布をイロイロ組み合わせて出来るものは正規分布であるということは、分かっているので、
正規分布の形になるように意識して変形していけば、問題なく計算できると思います。


以上から期待値 \frac{k(z-a)}{(k^2+1)}、分散 k^2+1正規分布に従うことが分かります。




以上です。次は問5ですね。

問4については、多変量正規分布の計算に慣れ親しんでいる人ならばすぐ解けるといった問題ですね。再生性に関しても証明を施すかどうかは迷いどころです。