最近大学の講義で因子分析について学んでいるので、そのノートもかねて説明していこうと思います。
まず、因子分析の最古典であるスピアマンの2因子説の話から説明します。
例
「国語」「英語」「日本史」「数学」「科学」「物理」についてテストを行ったとします。点数を記録して、その点数の相関係数をまとめてみたというものを考えます。この時、次のようになりました。
この時よくよく見てみると次のような事が分かります。
・の相関係数が高い。
・の相関係数が高い。
・全て相関係数が正
そこでスピアマンは次のように考えました。
全ての変数が強弱はあれど皆正の相関をしている、ということはこの変数達の背後には何かしら共通の要因が影響を与えているに違いない。
スピアマンの二因子説のイメージ図
イメージとしては次のようになります。
はそれぞれの変数に対する独自の因子です。また、は要因からどれくらいの大きさで影響を与えられているかを表します。
回帰分析との違い
ここで、この関係、どこか回帰分析と似てない?となるわけです。
というのもこれを式に直すと次のようになることがわかります。
などなど。。。
これは線形回帰分析に似てますね。線形回帰分析の形としてはこんな感じでした
似てますね。というか一緒ですね。
じゃあ回帰分析で良いじゃないかとなるわけですが、決定的に異なる点が一個あって、
回帰分析はYとXがわかっているけども、因子説のモデルの方はしかわかっていないという点です。
因子分析
しかしここで色々疑問が生じてきます。本当に共通要因は一個か??とか共通要因は全ての変数に影響を与えているのか??とか要因が複数あるならその要因同士の相関があるんじゃないか等々様々考えられます。
ここからこのモデルが発展し、因子分析なるものが発展していきます。