前回は推定量の話を簡単にした後に、不偏推定量についてやりました。
bananarian.hatenablog.com
不偏推定量の性質をより深く知るためには、誤差の概念を理解しなくてはなりません。
そこで今回は平均二乗誤差という誤差について説明します。
誤差
誤差というと、普通こんなのを思い浮かべるかなと思います。
当然これも誤差なんですけど、次のようなケースだと少々まずいことがおこります。
5回実験を行って、各実験で欲しいパラメータに対する推定値を求めた。すると次のようになった。
あるパラメータの真の値が1(実際には不明)
得られた推定値1.2 , 1.1 , 0.8 , 0.9 , 1
この場合誤差の合計はいくらになるかというと
さっきの式に従ってしまうと
誤差は0になってしまいます。
これは流石にマズいので、こういう場合は普通絶対値を取りますね。
これだと
誤差が出てきます。
でも、絶対値を扱ったことのある人ならわかると思うんですけど、絶対値って場合分けが発生して結構使いづらいんです。
そこで二乗を採用します。
これを二乗誤差と呼びます。
更に、平均的に誤差はどれくらいになるのか考えたいときだってありますよね。そういうときは、このようにしてやります。
これを推定量の平均二乗誤差(MSE)と呼びます。
推定量の平均二乗誤差の性質
いちいち推定量と書くのが面倒くさいのでとおきます。パラメータの真の値をとおくと、平均二乗誤差(MSE)は次のようになりますね。
これをちょっと変形してやります。
ここで最後の項は計算してやるとゼロになります。
よってMSEは次のようになります。
そういうわけで推定量のMSEは(推定量の期待値と真の値の二乗誤差)と推定量の分散の和で表せるわけです。
不偏推定量の平均二乗誤差の性質
でした。ここでがの不偏推定量であると仮定すると
が成り立つので
つまり、不偏推定量の場合、平均二乗誤差は分散さえ考えればよいということになります。
分散は結局、期待値を中心にどれくらいばらついているかを表す指標であり、不偏推定量は期待値と真の値が一致するので、分散が小さければ小さいほど優れた不偏推定量であるということになりますね。
ここで、前回の「不偏推定量って範囲広くない?」の話に繋がるわけです。
確かに、不偏推定量って探してみるといっぱいあるんですけど、
結局平均二乗誤差を小さくするような推定量を探したいなら、不偏推定量のクラスにしぼってしまうとバイアスが勝手にゼロになるからラクチン!
しかも、不偏推定量同士なら分散を比較するだけなので比較が簡単で明確!!
という利点があるわけですね。