バナナでもわかる話

開設当初は計量経済学・統計学が専門の大学院生でした。今はデータを扱うお仕事をしています。統計学・経済学・投資理論・マーケティング等々に関する勉強・解説ブログ。ときどき趣味も。極力数式は使わずイメージで説明出来るよう心掛けていますが、時々暴走します。

ゼロ過剰ポアソン分布の尤度関数

今回は統計学中級者向けの記事です。
前に解説したゼロ過剰ポアソン分布ですが、その尤度を示します。
前記事はこちら
bananarian.hatenablog.com




まあゼロ過剰ポアソン分布の尤度の書き方は色々あるのですが、検定問題の話もしたいので、それに沿った書き方をしようと思います。



セットアップ

ゼロ過剰分布の密度関数 p(y;\lambda,\omega)ですが、次のように書けますね。


( y=0の時)
 p(y;\lambda,\omega)=\omega+(1-\omega)e^{-\lambda}

( y>0の時)
 p(y;\lambda,\omega)=(1-\omega)\frac{\lambda^ye^{-\lambda}}{y!}


書けますねと言われてもよくわからん!という方のために少し説明すると、

まず、 y=0になるのは二パターンあって、

①0しか出ない空間から確率1で0が出るパターン
②ポワソン分布から確率 e^{-\lambda}で0が出るパターン

 e^{-\lambda}は、ポワソン分布の密度関数に y=0を入れてみてください。出てきます。


更に、前回の記事の仮定から①が出る確率は \omega、②が出る確率は (1-\omega)でした。よって独立な確率の同時確率は掛け算で表せるので先ほどの式が出てきます。


で、更に後々の都合上 \theta=\frac{\omega}{1-\omega}としておきます。

そうするとこんな感じ。



( y=0の時)
 p(y;\lambda,\theta)=\frac{\theta}{1+\theta}+\frac{e^{-\lambda}}{1+\theta}

( y>0の時)
 p(y;\lambda,\theta)=\frac{\lambda^ye^{-\lambda}}{y!(1+\theta)}



尤度関数

じゃあ、 i=1,2,...nの標本 y_iが得られたものとして、尤度関数 L(\lambda,\theta)を出してみます。


ここで登場するのが指示関数と言う関数です。一瞬説明します。


指示関数

 1_{\{y_i=0\}}を指示関数と呼びます。これは何を表すかと言うと、 y_i=0を取るときは1を、そうじゃないときは0を取るような関数です。


例えば y_4=2だったとすると、指示関数は0を取ります。



この指示関数を利用して、先ほどの密度関数を一本にまとめてみましょう。


 L(\lambda,\theta)=\prod_{i=1}^{n}[1_{\{y_i=0\}}\{\frac{\theta}{1+\theta}+\frac{e^{-\lambda}}{1+\theta}\}+1_{\{y_i>0\}}\frac{\lambda^ye^{-\lambda}}{y!(1+\theta)}]

うまくあらわされていることがわかりますか? y_iの値に従って、密度関数がスイッチします。



以上です!この書き方をすることでスコア関数やフィッシャー情報行列を考えることも出来、スコア検定を行うことが出来ます。

次回はゼロ過剰ポアソン分布に関するスコア関数とフィッシャー情報行列の導出を行います。