バナナでもわかる話

開設当初は計量経済学・統計学が専門の大学院生でした。今はデータを扱うお仕事をしています。統計学・経済学・投資理論・マーケティング等々に関する勉強・解説ブログ。ときどき趣味も。極力数式は使わずイメージで説明出来るよう心掛けていますが、時々暴走します。

【初心者向け】雰囲気で理解するマルコフ連鎖

f:id:bananarian:20180825231305j:plain


マルコフ連鎖って、たまに聞くんだけど、数式で言われてもイメージが沸かない!よくわからない!という方も多いと思います。
今回はマルコフ連鎖とは何なのかについて説明したいと思います。

あなたはカエルです。今カエル一匹が乗れるくらいの大きさの石が二つ並んでいて、あなたはその片方に乗っています。別に乗り心地が悪いわけではないけれど、ずっと同じ場所にいるのも手持ち無沙汰なので、ある瞬間にもう片方の石に乗り移ります。この「もう片方の石に乗り移るかどうか」を1秒ごとに考えているあなたは1秒経つごとに50%の確率で片方の石に乗り移ります。カエルはあまり脳が発達していないので、今まで累計同じ石に何秒乗ったかとか、乗ったばかりだから今移るのはやめておこうとかそういったことは考えません。毎回今この瞬間のことだけを考えて、気まぐれに飛び移ります

 
これがマルコフ連鎖です。これを実際にシミュレーションしてみましょう。
f:id:bananarian:20180825121501p:plain


横軸が秒数、縦軸の0,1が2つの石を表しています。

 

 

少し状況を変えてみましょう。石に名前をつけてみます石1石2の2つの石があるとします。今は夏真っ盛り、気温は30度を超えています。石1は日陰にあってひんやり冷たくなっている一方、石2の方は日なたに落ちているため、とても熱い。あまり長居は出来ません。

その結果、あなたが行う意思決定に変化が起きました。冷たい石1にいて熱い石2に乗り移る確率が50%冷たい石1にいてそのまま石1に居続ける確率が50%とします(カエルは石2が熱かったことを覚えていない!)。また、熱い石2にいて冷たい石1に移る確率を80%熱い石2にいてそのまま石2に居続ける確率が20%とします。それをシミュレーションしてみると….
f:id:bananarian:20180825121656p:plain


これがマルコフ連鎖です。では、あらためて説明してみましょう。

マルコフ連鎖とは、一つ前の状態に関する情報だけが次の状態に関係するような時系列のことを指します。つまり、先ほどの例で言えば、カエルは頭が悪いので、昔のことを覚えていません。つまり今自分がどの石にいるかだけが次の意思決定に関係しています。

また、先ほどから描いている、カエルがどちらの石にいるかというシミュレーションはマルコフ連鎖の経路と呼びます。

 

ちなみに二つ目のカエルの例を数式で表すと次の通りです。


P(X_n=1|X_{n-1}=1)=0.5

P(X_n=2|X_{n-1}=1)=0.5

P(X_n=1|X_{n-1}=2)=0.8

P(X_n=2|X_{n-1}=2)=0.2



P(◇◇|〇〇)
条件付確率と呼びます。これは〇〇ということが起こった後に、◇◇が起こる確率という意味です。



また、マルコフグラフと呼ばれる頂点と矢印から成るグラフを描くことも重要です。マルコフグラフは次のようになります。
f:id:bananarian:20180825122847p:plain

マルコフグラフは直感的に状態の推移を確認できる便利グッズです。



マルコフ連鎖は、数式やマルコフグラフ、経路図を使って状況を整理して確認することがまず重要になってきます。
以降何回かマルコフ連鎖について説明して、マルコフ連鎖モンテカルロをまとめるところまで行く予定です。