さて、今回は一様分布の上限の推定方法の比較を行います。
初めに簡単に問題設定から。
が独立に、範囲≦≦の一様分布に従うような状況を考えます。
この時、最尤推定法を用いて、の推定量を考えると、になるのでした。
ここまでの内容に関しては、既に以下の記事で触れていますので、初耳!という方は以下をご覧ください。
www.bananarian.net
今回は、の推定量は本当にで良いのか。もっとよりよい推定量は存在しないのかについて検討をします。
目次
スポンサーリンク
最大値の分布の導出
まず、は一体どんな分布をしていて、期待値や分散はいくらなのでしょうか。まずはそれらを計算します。
とします。この時の分布関数は定義から、以下のように書けますね。
ここで、とは、全てのが以下であることと同値であり、更には互いに独立であるため、
が成り立ちますね。は一様分布の密度関数です。
これを計算すると、となります。
よって、について微分を施すと、の密度関数が得られ、
とわかります。
最大値の期待値と分散の導出
密度関数がわかると、勿論期待値や分散を計算することが出来ます。
よって、分散は以下のようになります。
一様分布の上限値の不偏推定量
期待値を導出してみると、どうやらの期待値はではないということに気付くかと思います。
最尤推定量は必ずしも不偏性を持つわけではないので、このような状況は多々あります。
そこで不偏性を持たせるために以下のような修正を施してみます。
これは、先ほどの計算から明らかですが、以下のようになるため不偏推定量です。
分散に関しても先ほどの計算から簡単に計算することが出来ます。
一様分布の上限値の不偏推定量 part2
そもそもに縛られずとも、一様分布の期待値はですから、の推定量として次のようなものを考えることも出来ますね。
この推定量の期待値と分散を計算すると以下のようになります。
一様分布の上限値の不偏推定量まとめ
以上3種類の推定方法を紹介しました。まとめると以下のようになります。
さて、色々と出てきましたが、じゃあどれを使うべきかについて考えてみます。
n→∞のケース
nを無限に飛ばした場合、まず最尤推定量であるは一致性を持つので、真のパラメータへ収束します。
更に、も、nを無限に飛ばせばと等しいため、真のパラメータへ収束します。
も、大数法則から真のパラメータへ収束します。
では、分散はどうでしょう。
nを無限に飛ばした場合、とは分母にがあるので、分母がのよりもはやい速度で値が収束することが直感的に分かるかと思います。
よって、nがある程度大きい場合はとを使うのが良さそうです。
nが小サンプルのケース
さて、データの状況しだいではnを無限とみなしてよいほどnが大きくないということもあるかと思います。
その場合、まず最尤推定量であるを使うとバイアスが生じます。
また、であることを考えると、
分散の観点からもよりは、を使う方が良さそうです。
より良い推定量を考えるのだから、分散は小さい方が良いですよね。
では、はどうでしょう。
と を比較してみると、一概にどちらが大きいとはいえなさそうですが、
での分散が小さくなることが分かります。上記二つはどちらも不偏推定量ですので、
では
では
を使うのが良さそうです。
まとめ
以上まとめると、次のようになるかと思います。
n→∞と見なせる場合に使用可能。
n>10でよりよい推定が可能。よりも分散が小さい。
n≦10でよりも良い推定が可能。
今回、最尤推定量は惨敗でしたね。
最近はビッグデータ時代で兎にも角にも最尤法や最適化で推定を行いがちですが、小サンプル下ではもっと良い推定がたくさんありますよという話でした。
※コメント欄にて、どうやら小サンプルの所で計算間違いがありそうとのことでご指摘いただきました。今しっかり確認出来ない状況なのですが、後日確認し、修正させていただきます。