バナナでもわかる話

開設当初は計量経済学・統計学が専門の大学院生でした。今はデータを扱うお仕事をしています。統計学・経済学・投資理論・マーケティング等々に関する勉強・解説ブログ。ときどき趣味も。極力数式は使わずイメージで説明出来るよう心掛けていますが、時々暴走します。

因子分析のクロンバックのアルファをどう解釈すべきか

今回は因子分析におけるクロンバックのアルファって何?っていう話をしようと思います。
因子分析自体よく知りませんという方はとりあえず、下リンクからどうぞ!
因子分析 カテゴリーの記事一覧 - バナナでもわかる話


スポンサーリンク



クロンバックのアルファ

実は前に書いた記事でも使ってます。この記事の信頼性係数ってやつが、クロンバックのアルファです。
【初心者向け】質問用紙から要因を分析する場合の項目の妥当性評価 - バナナでもわかる話

クロンバックのアルファは式としてはこのようになっています。
 \alpha = \frac{m}{m-1} \left(1 - 
\frac{\displaystyle \sum_{i = 1}^m{{\sigma_i}^2}}{{\sigma_x}^2} \right)

で、これどうやって使うかというと、因子分析(これは探索的でも検証的でもどちらであっても)において、要因(f)によって、どれくらい実得点(X)が説明出来ているかの指標として使うことが出来、1に近いほど良いとされています。


解釈

で、このクロンバックのアルファですが、形としては

 \left(1 - 
\frac{\displaystyle \sum_{i = 1}^m{{\sigma_i}^2}}{{\sigma_x}^2} \right)

 \frac{m}{m-1}


に分けられますね。

まず、 \left(1 - 
\frac{\displaystyle \sum_{i = 1}^m{{\sigma_i}^2}}{{\sigma_x}^2} \right)を見てみましょう。

 {\sigma_i}^2とは、因子分析における誤差項の分散です。

例えば得点 X_jを考える時に、因子 f_1を使って因子分析を行うとします。
その際因子分析では次のようなモデルを考えています。

 X_j = \beta_j f_1 +e_j

 e_jが誤差項です。要は因子では説明できない部分のことを指します。

つまり、  {\sigma_i}^2とは、因子では説明出来ていない部分の分散がどれくらい大きいかを表しているということですね。


次に {\sigma_x}^2ですが、こちらは実得点 Xの分散です。

よって、 \frac{\displaystyle \sum_{i = 1}^m{{\sigma_i}^2}}{{\sigma_x}^2}とは、実際の得点の分散に対して、因子では説明出来ていない部分の分散がどの程度かという割合を表していることになります。


つまり、因子では説明出来ていない部分の分散が大きくなればなるほど、 \frac{\displaystyle \sum_{i = 1}^m{{\sigma_i}^2}}{{\sigma_x}^2}が1に近づき、 \left(1 - 
\frac{\displaystyle \sum_{i = 1}^m{{\sigma_i}^2}}{{\sigma_x}^2} \right)が小さくなるわけですね。




次に、 \frac{m}{m-1}を見てみます。
mが質問項目数です。
mが極限に飛ぶと1になるので、この式の影響はなくなります。
つまり、これはmが小さい時に何か影響を与える部分です。

m=2の時は2
m=3の時は1.5
m=4の時は1.33
どんどん小さくなっていきますね。


これ、何かというと、調整項です。
質問項目が少ない時はどうしても因子によって説明できる部分が少ないので、簡単に誤差項の分散が大きくなります。
この質問項目数による影響を極力潰すために、この項があるわけです。



こういうわけでクロンバックのアルファという指標が、用いられるわけです。