【初心者向け】因子分析とは何か

スピアマンの2因子説を使って因子の導入を行ったわけですが、因子分析とは何ですか？となると思うのでそれの説明もしておきます。

多変量データの背後に潜む相関関係を分析する手法が因子分析となります。
因子分析と言ってももう少し分けると２種類あり、

探索的因子分析法
検証的因子分析法

があります。

データの構造に対して特に仮定を置かずに、構造の分析を行うような方法を探索的因子分析法と呼びます。

基本的な手順としては

データを取る→仮説の無いモデルで解析（例では因子数の仮説はおいているが、因子数も変えて行う）→因子数の検討→因子の回転（解釈しやすい因子構造にする）、因子の解釈を行う

ただし、ここで注意点として、この仮説の無いモデルとは、仮説が全くないという状況はあまり指しておらず、少しは構造に対して仮説を与えてやります。仮説の無いモデルというより仮説がきつくないというべきでしょうか。

こちらは仮説を先に立ててやって、その仮説に基づいたモデルをデータにあてはめて、その当てはまり具合を見るという方法を取ります。

基本的な手順としては

データをとる→因子構造について仮説を置く→解析を行う→仮説が正しいか、適合度を見る

前回用いた図を再利用します

f:id:bananarian:20180901105914p:plain

まず、因子分析の文脈では
$F_1$ のことを共通因子
$e_i$ のことを独自因子
$λ_i$ のことを因子負荷量
と呼びます。回帰係数の文脈だと $λ_i$ は単なる回帰係数ですが、区別しています。

また、独自因子ですが、これ実際のデータにモデルをあてはめようとすると、本当の意味での独自の因子と単なる現実のデータにおける誤差がまざることになります。

伝統的な独自因子はこの誤差と本当の意味での独自の因子は区別して扱われますし、区別して分析する方法に関する論文もありますが、普通の分析においてはあまり区別していません。

区別した場合の誤差のことを誤差因子、本当の意味での独自の因子を特殊因子と呼んだりします。
つまりこういうことです。

独自因子＝誤差因子+特殊因子

詳しい因子分析に関する話はまた別の記事で。