前回は大数法則について確認しました。
大数法則に従って、サンプルサイズを大きくしていった時に真の値に収束するような推定量を一致推定量と呼びます。
期待値の一致推定量
不偏推定量の話でやったは、前回の大数法則の記事で確認した通り一致推定量です。
普通の教科書ならここで終わる所ですが、
はどうでしょう。
大数法則の定義に従えば、の時に成り立てばよいわけなので
で割ってもで割っても同じですよね。
まあ厳密に考えるのであれば
一項目のは大数法則から期待値に収束しますね。
二項目ですが、
なので、
サンプルサイズを大きくするとまずがに収束するわけですが、
まだが小さくなり続けます。
故にを大きくしていけば、二項目はほとんど0となりますね。
つまり、こいつも結局一致推定量なわけです。
一般化してやると、結局も一致推定量ですよね?
ここでとは定数を表すことにします。(constantのc)
では、どの一致推定量が一番良いのでしょうか?平均二乗誤差が小さくなるような推定量が良いと思うのであれば、計算してみるとわかりますが、
は別に良い推定量でも何でもなくなります。
これが一致推定量の凄みです。
今の時代はビッグデータ時代と呼ばれ、いくらでもデータを取ってこれる時代になりました。
その結果、一致推定量が使えるようになり、以前まで持て囃されていた不偏推定量が必要のない場面が多くなってきたわけです。
※一昔前だと、サンプルサイズを100も用意できれば上等なんて時代があったわけですが、その時代において一致推定量は使えませんでした。だって高々サンプルサイズ100で、∞に近いとは言えませんよね。しかし10000,100000と取ってきたらどうでしょう。流石に大規模データと言って差し支えないですよね。