11/01/2021

Excel。データ同士に関係性があると出てるけど疑心暗鬼なんです。【correlation】

Excel。データ同士に関係性があると出てるけど疑心暗鬼なんです。

<SQRT関数とT.DIST.2T関数>

データがあれば、その関係性があるのかないのかをCORREL関数などをつかうだけで、相関係数を算出することができます。

その数値から、データに何らかの関係があるということがわかります。


例えば次の表でみてみます。


B列の来店数とC列の売上高の相関係数が、F1に算出されています。


F1の数式は、

=CORREL(B2:B11,C2:C11)

で、算出結果から、関係性は強いと判断することができます。


ただ、相関係数を鵜呑みにしていいのか、疑心暗鬼になるかもしれません。


そこで、根拠のある判断をするために検定を行うことができます。

この検定のことを「無相関の検定」と呼んだりします。


また、公式を使って、「検定統計量」を算出します。

検定統計量の公式は、

T=r√n-2 / √1-r^2

です。

検定統計量を算出しないと、T.DIST.2T関数をつかって、相関のあるなしを求めることができます。


F4に、検定統計量の公式に当てはめた、数式をつくってきます。


F4の数式は、

=(F1*SQRT(F3-2))/SQRT(1-F1^2)

SQRT関数(読み方:スクウェアルート)は、数値の平方根(√)を算出することができる関数です。SQRT(4)は√4なので、2を算出することができる関数です。


F5に、T.DIST.2T関数をつかって、無相関の検定を行っていきます。


F5の数式を確認しておきます。

=T.DIST.2T(F4,F3-2)


確率は、「0.0026」と確率が1%(0.01)以下なので、帰無仮説は棄却。

つまり、来店数と売上高には、なんらかの関係があることがいえるという結果がわかりました。


検定統計量の数式をつくるのが、結構面倒ではありますが、T.DIST.2T関数をつかうことで、F1で算出した相関係数の、ある種の裏付けができました。


今回使用した「T.DIST.2T関数」ですが、「ティー・ディスト・ツーテール」。

または、「ティー・ディストリビューション・ツー・テイルド」・「ティー・ディストリビューション・ツーテール」と読むそうです。


T.DIST.2T関数をはじめとして、Excelには、統計計算に関する関数もたくさん用意されているようなので、少しずつ、使える関数を増やして、日ごろ作成している資料にプラスしていくことが出来るといいですね。