ブログ記事何を書こうと思っていた際に、読者の方から
「もう少し統計学の基本的な話もやってほしい!」
というお話を受けました!
確かに、統計学って特に、勉強のとっかかりが一番難しい印象があって、
「確率変数???」「確率密度関数??」なんだなんだ??と混乱し、
混乱しながら読み進めていくと、今度は「推定量??」「推定値???」と訳が分からなくなり、
そうかと思えば、推定だー検定だーと色々言われてもう混乱の極み、
もう勉強やーめた!ってことがかなりあると思うんです。
というか僕がそうだったんですが。
そこで、統計学の基本的な部分で出てくる意味のわからん用語達のイメージを持てるような記事を書いていくということで、統計学を勉強する人の障壁を減らせるよう貢献していければなと考えています。
ということでこれからボチボチやっていきます。
というわけで第一回は確率変数です。
入門書のどのあたりに登場するか
確率変数は、恐らく統計学入門書のほぼほぼ1番最初のページから、以降至る所で登場してくる厄介者です。
この言葉を理解出来ないと、入門書通して「?」が頭に浮かんで終わるという事態に陥ってしまいます。
変数と確率変数の違いは
まず、最初に気が付くこととして、「確率」変数なんですね。
変数っていうのは中学校、高校と数学を勉強するたびにやってきたやつで、要は
(値が)変(わる)数
という意味で変数です。
例えばこんな感じで使います。
変数はからの範囲を動いて、実数値を取ります。この時のグラフはどうなりますかー。
だとか
変数は実数値全体を取ります。
だとか言うわけです。
じゃあ、確率変数って何だというと、
確率(的に)(値が)変(わる)数
だから確率変数です。
例えばこんなやつは確率変数です。
確率変数は、確率で1を、確率で2をとります。
だとか
確率変数は、からの範囲の実数値を同じ確率で取ります。
とかいう感じで使います。
まさに、確率が引っ付いているかどうかが問題で、色々な値を取りうるという点では変数も確率変数も変わりません。
背後にある確率の表現方法
確率変数は、値の取り方が確率で決まる変数だということがわかりましたか。
それでは、次に確率変数と確率密度関数(or確率質量関数)の関係について見ていきます。
要は、確率変数の値を決めている確率を表すのが確率密度関数(or確率質量関数)です。
次の例で考えてみます。
確率変数は、からの範囲の実数値を同じ確率で取るとします。
この時の確率密度関数は
...(がからの範囲を取るとき)
...(がより小さいか、より大きい値を取るとき)
ちゃんとからの範囲の値をとっていて、同じ確率になっていますね。
おまけ
何か私の教科書だと、確率変数がって書いてあってよくわからないんですが、何なんですか!という方もいらっしゃると思いますので、こちらについても説明しておきます。
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- -
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
【スポンサーリンク】
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- -
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
次の例を考えてみてください。
コインを投げて(表が出る)か(裏が出る)かを考えるとします。
コインが普通の形をしているなら、(表が出る)確率も(裏が出る)確率も同じなはずですよね。
でもここで先ほどの説明を思い出してみてください。
確率変数は、確率的に値が変わる数である。
今の例の、表が出るとか裏が出るって、数字じゃないんです。だから現状の説明では扱えません。
だからこのようにしてやります。
要は(表が出る)⇒1、(裏が出る)⇒0と値を割り振ったことになります。
実は難しい話をすると、確率変数って関数なんですね。っていう事象を放り込んだら、何らかの数字を返す関数なんです。
それを厳密に表現するとという形で書くことが出来て、まあ毎度毎度それを丁寧に書くのはダルいので、と省略して書いているわけです。
こうすることで、要は
かを同じ確率で取る確率変数だと考えていることになるわけですね。
初心者向け書籍紹介