相関分析 - 研究所blog

　相関分析は、２つの測定値を対応させた組をグラフ上にプロットした散布図を描いてみる。通常その方法は、1)原因と思われるｘを横軸とし、結果と思われるｙを縦軸として、２つの測定値をグラフ上にプロットした散布図を描く。2)各データからその平均値を引き、ｘ、ｙ、(ｘi－ｘの平均)、（ｙi－ｙの平均）、(ｘi－ｘの平均、(ｙi－ｙの平均、(ｘi－ｘの平均)×(ｙi－ｙの平均）を表に記入する。

　3){ (ｘi－ｘの平均)×(ｙi－ｙの平均）｝/データ数、4) (ｘi－ｘの平均 /データ数、5) (ｙi－ｙの平均 /データ数を計算すると、相関係数＝ＸＹの偏差平方和/｛（Ｘの偏差平方和）×（Ｙの偏差平方和）｝の平方根となる。この式の値は－１と１の間の数値で、その意味するところは、１に近ければ、ｘとｙの相関が大きく、－１に近ければ負の相関が大きい。

　ただし、そうした数値がたまたま生じたのかを相関係数の検定表によって検定してみなければならない。つまり、検定表の5％の値より大きければ有意である（相関が大きい）といえることになる。複数の変数間の相関係数を計算するには、エクセルの機能を使えば即座に求められる。仮説を立てる前に、全体を俯瞰しておく必要がある場合には便利である。

　例えば、売上高と人件費の相関関係、流動比率と営業利益の相関関係、人件費比率と付加価値生産性の相関関係などに着目して、相関係数を眺めると、その背後にある経営方針が見えてくることがある。これを基にして、仮説を立てれば、次の分析方法も見えてくる。

　多変量解析を行う場合でも、まず、最初に計算するのは、平均、標準偏差、分散、共分散、相関係数などである。計算ソフトが充実している現在、計算過程や計算方法は必要ないかも知れないが、結果を解釈するには、やはり、最小限度の基礎知識が必要であり、これがないと、その結果を基に、あらたな仮説を構築するのに戸惑ってしまうことになる。

　逆に、これらの基礎知識がしっかりしていれば、多変量解析を実行しなくても、相当精度の高い仮説が立てられ、背後関係が見えてくるので、検証のための実行計画も無駄のないものになる。分析方法が解らないので、せっかく社内に蓄積されているデータをゴミの山のごとくもて余しているのは、これらの基礎知識が不足していることが多いことにある。