★SPSSで因子分析を行う

 

例によって因子分析とは何か、軽く触れてから実際のSPSSの操作法の解説に移ります。

 

因子分析は、いくつかの変量間にある相関関係を、少数の潜在的変量(=因子)で説明しようとするものです。図を見てみましょう。

 

 

青い丸の一つ一つが変量です。これではバラバラでお世辞にもわかりやすいとは言えません。
いくつかの塊に分けたいところです。


 

 

これで3つの塊になりました。13個から3つですから、だいぶすっきりまとまった感じです。
しかしこれはクラスターに分けただけですから、これに因子軸と呼ばれる“串”を刺します。


 

 

これで、13個の変量はf1〜f3までの3つの因子でまとめることができました。
この一連の作業を因子分析といいます。


 

因子分析には“軸の回転”という操作があります。ここでは同一のデータに基づき、直交回転と斜交回転の二つについて解説します。

 

まずは因子分析をしたいデータを入力します。ここでは国語・数学・英語・理科・社会の成績を因子分析してみることにします。

 

被験者 国語 数学 英語 理科 社会 被験者 国語 数学 英語 理科 社会
1 72 80 88 56 71 11 57 25 38 41 50
2 53 88 62 70 44 12 55 30 40 32 45
3 44 25 50 38 60 13 49 61 66 45 62
4 29 34 43 24 38 14 73 95 81 85 77
5 66 29 66 37 73 15 63 36 74 77 65
6 51 52 43 72 65 16 50 41 60 67 53
7 73 38 75 40 81 17 42 71 55 52 38
8 69 71 52 63 70 18 57 55 53 46 52
9 35 65 58 50 66 19 81 47 78 48 78
10 42 28 46 29 44 20 66 45 49 40 63
             (右上へ)

 

データは、間隔尺度以上であれば因子分析ができます。名義尺度や順序尺度の場合は、数量化V類を行ってください。

 

では手順です。

 

 

 

 

 “分析”→“データの分解”→“因子分析”です。
 次のようなダイアログボックスが表示されます。


 

 

 

  

 因子分析にかけたい変数を選び、右側のボックスに入れます。
 ボックスへの入れ方は一要因分散分析(対応なし)を参照してください。
 変数が全て入ったら、2.“因子の抽出”に進みます。


 

 

 ここで一つ注意。抽出方法で“主成分分析”を選んではいけません。
 因子分析と主成分分析は親戚みたいなものですが、本質は違います。
 デフォルトでは主成分分析になっているので、別のものにしましょう。
 “主因子法”や“最尤法”などを選択します。
 個人的に“最尤法”が好きなので、ここではこれにしておきます。
 ちなみに“さいゆうほう”と読みます。
 抽出の基準などは、とりあえず無視して3.“回転”に進みましょう。


 

 

 ここでは直交回転か斜交回転を選択します。
 直交回転ならば“バリマックス”、斜交回転ならば“プロマックス”です。
 チェックを入れると、“表示”や“最大反復回数”の電気(?)がつきますが、
 とりあえず無視して4.“オプション”に進みます。


 

 

 ここでは“サイズによる並び替え”にチェックを入れて“続行”です。
 次はいよいよ実行です。“OK”をクリックしましょう。


 

では、まず直交回転(バリマックス法)の結果から解説します。

 

まずは適合度です。これは有意だと困る値です。この場合、有意ではないので一安心です。
もし有意なら、このデータは使えません。


 次に、この表を見ましょう。表から読み取れることは、
 @このデータからは二つの因子が抽出された
 Aこのデータの72.369パーセントはこの二つの因子で説明ができる
 
 Aについて補足しましょう。下の図を見てください。
 

 

このデータは5教科のテストなので、500点満点です。
500点のうち、40%(200点)は第1因子が関わり、32%(160点)は第2因子が関わり、あとは別の要素であることを示します。
別の要素とは、すなわち特殊性のことです。


なお、回転後の因子の数が多すぎたり少なすぎたりした場合は、2.“因子の抽出”の固有値の数や因子の数を増減させてみてください。

 

次は因子行列を見ましょう。
第1因子は社会・国語・英語が固まっています。第2因子は数学と理科です。
このことから、第1因子は「文系能力」、第2因子は「理系能力」と名前をつけることができるでしょう。
(※ただし英語は第1因子・第2因子ともにある程度の値をとっていることに注意)
因子に名前をつけるのはあなた自身ですので、研究目的などにあった名前をつけてください。
こればかりは人に訊いてもわかりません。

なお、下のほうに『3回の反復で回転が収束しました』とありますが、
『○○回以上の反復が必要です』と出てくるときがあります。
その場合は、3.“回転”の最大反復回数を増やしてください。


 

では次に斜交回転(プロマックス法)の結果を説明します。大筋は直交回転(バリマックス法)と同じですが、注意点がいくつかあります。

 

これは直交回転と同じです。有意でなければ問題ありません。有意であれば大問題です。


 

次にこの表です。直交回転と異なり、
回転後の負荷量平方和の%が出ません。
抽出された因子がデータをどれくらい
説明しているかは、
回転後の負荷量平方和
をてがかりにするしかありません。


 

 

斜交回転では、直交回転より結果が多く産出されます。その一つがこのパターン行列です。
これは直交回転でいうところの因子行列にあたります。見方もそれに準じます。
注目すべきはここの数値です。直交回転よりも、その因子を主に構成する変数の値が大きくなっています。
ついでに言うと、直交回転ではこの因子負荷量は1を超えることは絶対にありません。
これは因子間に相関を仮定するかしないかの違いによります。
ただし、直交回転と斜交回転の結果が著しく異なることはあまりありません。


 

 

これも斜交回転ならではの結果です。この表は、各変数と各因子との相関係数を表します。
直交回転の場合、因子行列と因子との相関行列が一致するので出力がされないのです。
次の図で説明しましょう。


 

 

 

因子間に相関がない(因子同士が直交している)場合、
ある変数から因子軸におろす線は一種類のみです。
だから、因子負荷量と相関係数は一致します。


 

 

 

因子間に相関がある(因子同士が直交していない)場合、
ある変数から因子軸におろす線は二通りあります。
各因子軸に平行に引いた線(赤線)と、各因子軸に垂直に下ろした線(青線)です。
赤線が因子負荷量を表し、青線が因子との相関係数を表します。
だから、因子負荷量と相関係数の二種類が算出されます。


 

最後に出力されるのがこの表です。ここまで読んだ方にはもう想像がつくでしょう。
これは因子間の相関係数です。
この例でいけば、文系能力と理系能力の相関は.393ということになります。


 

最近では直交回転はあまり見られません。因子間にまったく相関がないことなど考えにくいし、因子間の相関が研究対象でもあるからです。

ただ、直交回転を全く使わないのではなく、斜交回転の結果を説明しやすくするために補足的に使うことは、もちろん可能です。

ではこれで因子分析の解説を終わります。

 

 

戻る