バナナでもわかる話

開設当初は計量経済学・統計学が専門の大学院生でした。今はデータを扱うお仕事をしています。統計学・経済学・投資理論・マーケティング等々に関する勉強・解説ブログ。ときどき趣味も。極力数式は使わずイメージで説明出来るよう心掛けていますが、時々暴走します。

統計検定1級対策問題集~ポアソン分布編~

統計検定1級対策のために役立ちそうな計算問題をまとめるやつやっていきます。
統計検定前の最終チェックや、統計検定の勉強何をすれば分からないという場合に活用ください。


今回はポアソン分布関連。
統計検定1級は、割と分布の畳み込みと、モーメント関連の計算、近似計算が出来ればそこそこいけるので、その辺の計算問題を一通り用意しました。



スポンサーリンク


目次

ポアソン分布の特徴

 P(x) = \frac{e^{-\lambda} \lambda^x}{x!}

・離散値の分布
 x ≧0
 \lambdaは0以上の連続値


モーメント周りの計算

確率母関数の導出

確率母関数の定義は次の通りでした。
 E[t^x]

これを計算します。
 E[t^x]=\sum_{x=0}^{\infty} t^x \frac{e^{-\lambda} \lambda^x}{x!}

 = e^{-\lambda} \sum_{x=0}^{\infty} \frac{ (t \lambda)^x}{x!}

 =e^{-\lambda} e^{t \lambda}

 = e^{\lambda (t-1)}


積率母関数の導出

積率母関数の定義は次の通りでした。
 E[exp(tx)]

確率母関数の時と同様の計算で出来ます。
 E[e^{tx}]=\sum_{x=0}^{\infty} e^{tx} \frac{e^{-\lambda} \lambda^x}{x!}

 = e^{-\lambda} \sum_{x=0}^{\infty} \frac{ (e^t \lambda)^x}{x!}

 =e^{-\lambda} e^{e^t \lambda}

 = e^{\lambda (e^t-1)}

キュムラント母関数

後で使うのでついでにキュムラント母関数も定義しておきます。
これは、積率母関数に対して対数を取ったもので、次のように得られます。

積率母関数は e^{\lambda (e^t-1)}なので、

キュムラント母関数は \lambda (e^t-1)

期待値の導出

定義に従った計算

まず、定義に従って期待値を求めてみます。
 E[x]=\sum_{x=0}^{\infty} x \frac{e^{-\lambda} \lambda^x}{x!}

 = \sum_{x=1}^{\infty}  x \frac{e^{-\lambda} \lambda^x}{x!}

 =\lambda \sum_{x=1}^{\infty}  \frac{e^{-\lambda} \lambda^{x-1}}{(x-1)!}

 =\lambda e^{-\lambda} \sum_{x-1=0}^{\infty}  \frac{ \lambda^{x-1}}{(x-1)!}

 =\lambda e^{-\lambda} e^{\lambda}

 =\lambda

確率母関数を用いた導出

確率母関数は、微分して、tに1を代入することで、期待値が出ます。

ポアソン分布の確率母関数は
  e^{\lambda (t-1)}
でした。そこで、

 \frac{d e^{\lambda (t-1)}}{dt}=\lambda e^{\lambda (t-1)}

 t=1を代入すると期待値 \lambdaが得られる。

積率母関数を用いた導出

積率母関数は、微分して、tに0を代入することで、期待値が出ます。

ポアソン分布の積率母関数は、先ほど導出した通り
 e^{\lambda (e^t-1)}

そこで、
 \frac{d e^{\lambda (e^t-1)}}{dt} = \lambda  (e^t) e^{\lambda (e^t-1)}

 t=0を代入してやると期待値 \lambdaが得られる。

スポンサーリンク


分散の導出

定義に従った計算

 Var[x]=E[(x-E[x])^2]=E[x^2-2xE[x]+E[x]^2]=E[x^2]-E[x]^2

 E[x(x-1)]=\sum_{x=0}^{\infty} x(x-1) \frac{e^{-\lambda} \lambda^x}{x!}

 = \lambda^2 \sum_{x=2}^{\infty} \frac{e^{-\lambda} \lambda^{x-2}}{(x-2)!}=\lambda^2

以上より、

 Var[x]=\lambda^2 +\lambda -\lambda^2=\lambda

確率母関数を用いた導出

確率母関数は二回微分することで次のような形になります。

 \frac{d^2E[t^x]}{dt^2}=E[x(x-1)t^{x-2}]

例のごとく t=1を代入すると

 E[x(x-1)]=E[x^2]-E[x]

この性質を利用します。

 \frac{d^2 e^{\lambda (t-1)}}{dt^2}=\lambda^2 e^{\lambda (t-1)}

 t=1を代入すると、 E[x(x-1)] = \lambda^2

以上より
 Var[x]=\lambda^2 +\lambda -\lambda^2=\lambda


積率母関数を用いた導出

積率母関数は二回微分することで次のようになります。

 \frac{d^2E[exp(tx)]}{dt^2}=E[x^2 exp(tx)]

 t=0を代入すると、 E[x^2]になりますね。この性質を利用します。

ポアソン分布の積率母関数は、先ほど導出した通り
 e^{\lambda (e^t-1)}

そこで、
 \frac{d^2 e^{\lambda (e^t-1)}}{dt^2} = \lambda  (e^t) e^{\lambda (e^t-1)}+\lambda^2 (e^t)^2 e^{\lambda (e^t -1)}

 t=0を代入すると、

 E[x^2] =\lambda^2 +\lambda



歪度の導出

歪度あたりから、定義通り計算するのも面倒になってくるので、積率母関数を利用することにします。

 E[\frac{(x-E[x])^3}{\sigma^3}] = \frac{E[x^3]-3E[x^2]E[x]+2E[x]^3}{\sigma^3}

 E[x^3]さえ求めればよいことがわかりますね。
積率母関数を3回微分してやって、

 \lambda e^t e^{\lambda (e^t-1)}+\lambda^2 (e^t)^2 e^{\lambda (e^t-1)}+2\lambda^2 e^t e^{\lambda (e^t -1)} + \lambda^3 (e^t)^3 (e^{\lambda (e^t-1)})^2

 t=0を代入すると

 E[x^3]=\lambda+3 \lambda^2 + \lambda^3

よって、歪度は次のように得られる。

 \frac{\lambda^3+3\lambda^2+\lambda-3\lambda(\lambda^2+\lambda)+2\lambda^3}{\lambda^3}=\lambda^{-\frac{1}{2}}


スポンサーリンク


二項分布を用いたポアソン分布の導出

二項分布に対して次のような仮定を施すとき、ポアソン分布が得られます。

 n\to \infty
 
  \lim_{n \to \infty} np
 =\lambda

これを示します。

ここで、二項分布の確率分布関数は次のようでした。
 P(x) = \begin{eqnarray*}
  && {}_n C _x \\
\end{eqnarray*} p^x (1-p)^{n-x}


次のように変形していきます。
 P(x) = \frac{n!}{x!(n-x)!} p^x (1-p)^{n-x}

 =\frac{n \cdot (n-1) \cdots (n-x+1)}{x!} p^x (1-p)^{n-x}

 =\frac{np \cdot (n-1)p \cdots (n-x+1)p}{x!} \frac{ (1-p)^n}{(1-p)^x}

更に、
 
  \lim_{n \to \infty} np \cdot (n-1)p \cdots (n-x+1)p=\lambda^x

 
  \lim_{n \to \infty}  \frac{ (1-p)^n}{(1-p)^x} =  \lim_{n \to \infty} \frac{ (1-\frac{\lambda}{n})^n}{(1-\frac{\lambda}{n})^x} =e^{-\lambda}

よって

  \lim_{n \to \infty} P(x) = \frac{e^{-\lambda} \lambda^x}{x!}



ポアソン分布の再生性の証明

 Z_1がポアソン分布 Pois(\lambda_1) Z_2がポアソン分布 pois(\lambda_2)に従うとする。

この時、次のようにおく。

 u=Z_1+Z_2,v=Z_2

ここで、
 Z_1=u-v,Z_2=v

ヤコビアン |J|は1なので、

この時 u,vの同時分布 f_{u,v}は次のよう

 f_{u,v}=\frac{e^{-\lambda_1} \lambda_1^{u-v}}{(u-v)!} \frac{e^{-\lambda_2} \lambda_2^{v}}{v!}

よって、周辺分布 f_{u}は次のよう。

 f_{u} = \sum_{v=0}^{\infty} f_{u,v} = \sum_{v=0}^{\infty} \frac{ \begin{eqnarray*}
  && {}_u C _v \\
\end{eqnarray*} \lambda_1^{u-v} \lambda_2^{v}}{u!} e^{-(\lambda_1+\lambda_2)}

 = \frac{e^{-(\lambda_1+\lambda_2)} (\lambda_1+\lambda_2)^u}{u!} …(二項定理より)

これは、ポアソン分布。

ポアソン分布の正規近似

n→∞のケース

 n→\inftyでポアソン分布は正規分布に近似します。
これを示します。中心極限定理まで証明している時間は無いはずなので、中心極限定理の証明まではしません。

 Yがポアソン分布に従うとする。
ポアソン分布には再生性があることを先ほど示したので、

 X_1,\cdots ,X_nが独立同一にポアソン分布 Pois(\frac{\lambda}{n})に従うものとして、

 Y=\sum_{i=1}^{n} X_iと書ける。

ここで、 Yの分布関数 P(Y≦y)について

 P(Y≦y)=P(\sum_{i=1}^{n} X_i ≦y)=P(\frac{\sum_{i=1}^{n} (X_i-\frac{\lambda}{n})}{\sqrt{n} \sqrt{\frac{\lambda}{n}}} ≦\frac{y-\lambda}{\sqrt{\lambda}})=P(\frac{1}{\sqrt{n}} \sum_{i=1}^{n}  \frac{ (X_i-\frac{\lambda}{n})}{ \sqrt{\frac{\lambda}{n}}}  ≦\frac{y-\lambda}{\sqrt{\lambda}})

中心極限定理より、
 P(\frac{1}{\sqrt{n}} \sum_{i=1}^{n}  \frac{ (X_i-\frac{\lambda}{n})}{ \sqrt{\frac{\lambda}{n}}}  ≦\frac{y-\lambda}{\sqrt{\lambda}})≃\Phi(\frac{y-\lambda}{\sqrt{\lambda}})

λ→∞のケース

ポアソン分布はλを無限に飛ばしても正規近似します。これは、過去問でも出題されていましたね。

標準正規分布のキュムラント母関数は
 \frac{t^2}{2!}
です。

キュムラント母関数は分布と1対1対応するので、ポアソン分布のキュムラント母関数が、λを無限に飛ばすことで正規分布のものと一致することを示せばよいということになります。

 X がポアソン分布に従うとする。ここで、標準化したものを Zとおく。

 Z=\frac{X-\lambda}{\sqrt{\lambda}}

この時 Zのキュムラント母関数は

 log(E[e^{tZ}]=log(E[ e^{\frac{tX}{\sqrt{\lambda}}} e^{\frac{-t\lambda}{\sqrt{\lambda}}} ]) =-t \sqrt{\lambda} +\lambda(e^{\frac{t}{\sqrt{\lambda}}}-1)

ここで、tに関してマクローリン展開すると

 log(E[e^{tZ}]) = \frac{t^2}{2!}+\frac{1}{\sqrt{\lambda}}\frac{t^3}{3!}+o(\frac{1}{\sqrt{\lambda}})

 \lambda \to \inftyの時、 \frac{t^2}{2!}

これは、標準正規分布のキュムラント母関数。

リンク

統計学を勉強するためのオススメ本

www.bananarian.net

2017年数理1級の解説記事

www.bananarian.net

その他の問題記事

統計検定1級対策問題集~二項分布編~

www.bananarian.net

統計検定1級対策問題集~ポアソン分布編~

www.bananarian.net

統計検定1級対策問題集~負の二項分布編~

www.bananarian.net

統計検定1級対策問題集~正規分布編~

www.bananarian.net

統計検定1級対策問題集~指数分布編~

www.bananarian.net

統計検定1級対策問題集~ガンマ分布編~

www.bananarian.net