バナナでもわかる話

計量経済学・統計学が専門の大学院生です。統計学・経済学・投資理論・マーケティング等々に関する勉強・解説ブログ。ときどき趣味も。極力数式は使わずイメージで説明出来るよう心掛けていますが、時々暴走します。

【初心者向け】因子分析とは何か

前記事
bananarian.hatenablog.com

スピアマンの2因子説を使って因子の導入を行ったわけですが、因子分析とは何ですか?となると思うのでそれの説明もしておきます。

因子分析とは

多変量データの背後に潜む相関関係を分析する手法が因子分析となります。
因子分析と言ってももう少し分けると2種類あり、

探索的因子分析法
検証的因子分析法

があります。

探索的因子分析法

データの構造に対して特に仮定を置かずに、構造の分析を行うような方法を探索的因子分析法と呼びます。

基本的な手順としては

データを取る→仮説の無いモデルで解析(例では因子数の仮説はおいているが、因子数も変えて行う)→因子数の検討→因子の回転(解釈しやすい因子構造にする)、因子の解釈を行う

ただし、ここで注意点として、この仮説の無いモデルとは、仮説が全くないという状況はあまり指しておらず、少しは構造に対して仮説を与えてやります。仮説の無いモデルというより仮説がきつくないというべきでしょうか。

検証的因子分析法

こちらは仮説を先に立ててやって、その仮説に基づいたモデルをデータにあてはめて、その当てはまり具合を見るという方法を取ります。

基本的な手順としては

データをとる→因子構造について仮説を置く→解析を行う→仮説が正しいか、適合度を見る


用語説明

前回用いた図を再利用します

f:id:bananarian:20180901105914p:plain

まず、因子分析の文脈では
 F_1のことを共通因子
 e_iのことを独自因子
 λ_iのことを因子負荷量
と呼びます。回帰係数の文脈だと λ_iは単なる回帰係数ですが、区別しています。

また、独自因子ですが、これ実際のデータにモデルをあてはめようとすると、本当の意味での独自の因子と単なる現実のデータにおける誤差がまざることになります。

伝統的な独自因子はこの誤差と本当の意味での独自の因子は区別して扱われますし、区別して分析する方法に関する論文もありますが、普通の分析においてはあまり区別していません。

区別した場合の誤差のことを誤差因子、本当の意味での独自の因子を特殊因子と呼んだりします。
つまりこういうことです。

独自因子=誤差因子+特殊因子



詳しい因子分析に関する話はまた別の記事で。