バナナでもわかる話

開設当初は計量経済学・統計学が専門の大学院生でした。今はデータを扱うお仕事をしています。統計学・経済学・投資理論・マーケティング等々に関する勉強・解説ブログ。ときどき趣味も。極力数式は使わずイメージで説明出来るよう心掛けていますが、時々暴走します。

ベイズモデルの識別条件は非ベイズのそれとは違ったっぽい

前記事、疑問をなんとなく放り投げておしまいといった記事を書いたのですが
www.bananarian.net
わかったので補足記事書きます。

スポンサーリンク



前回までの疑問(噂)

非ベイズでは識別不可能なモデルでも、ベイズだと識別可能らしいという雑なタレコミがあって

「よくわからん???」

となって、試してみたという記事でした。

識別条件とは、任意のデータに対して尤度最大を取るパラメータが複数存在する場合にパラメータが定まらないという話だと理解していたため、ベイズとはいえど、尤度においては話は同じだし、まあ実際に使うのは事後分布だけど、識別条件は満たさんのではと考えていたわけです。


ベイズの識別条件

で、何となく察してはいたのですが、ベイズにおける識別条件は事後分布で見るようです。
事後分布は事前分布と尤度の積として定まるので、例えば非ベイズの文脈で識別不能なモデルを作ったとしても、この時点で問題なのは尤度部分なので、事前分布を変えてやれば任意のデータに対して事後分布が同じということは起こり得ないので、識別条件を満たすという話になるようです。


となると、事前分布の設定に客観性があるかどうかが問題になるはずですね。
事前分布の設定方法として、事前にパラメータに関する情報が無い場合に、無情報事前分布を設定するわけですけど、尤度サイドで非ベイズの文脈で識別不能なモデルだった場合、パラメータに対して同じ事前分布を設定してもMCMCが収束しなくなるので、特殊な事前分布を与える必要があるという話です。

で、分析はある種説得の道具でもあるので、オーディエンスが「その事前分布の設定は主観的すぎる」と思えば、あまり適当な分析とは言えません。

気になる点

非ベイズでは識別不可能なモデルでも、ベイズだと識別可能らしいというタレコミからこの話がスタートしているわけですけど、調べてみて、これは雑な言説だなと思っています。どちらかというと

ベイズだと事前分布を弄ることで識別条件を解決することも出来るが適当な気がします。だって、別に非ベイズでもパラメータに適当な制約をかけてやれば識別条件を解決できますし、同じようにベイズであっても事前分布で処理せずともパラメータに妥当な制約をかければいいわけです。