11/12/2020

Excel。相関関係は散布図をつかったデータの並び方であるなしがわかります。【Correlation】

Excel。相関関係は散布図をつかったデータの並び方であるなしがわかります。

<CORREL関数・散布図>

二つの数値には、関係性があるのか、ないのか?知りたい場合があります。

たとえば、気温が上がると、冷たい飲み物が多く売れるのだろうか?


「相関係数」を算出することができるCORREL関数を使えば、数値としては算出することができます。


ただ、算出結果が、「1」に近ければ強い相関があり、「0」に近ければほぼ相関はないといわれています。

といわれても、なかなかわかりにくいので、グラフにしてみると、幾分わかりやすくなるかと思います。


今回は、次のデータをつかって、相関係数を算出したうえで、散布図はどのようになるのかを確認していきましょう。


B列の最高気温とC列の販売数には関係性があるのか?

その相関係数を算出しているのが、F1。

F1の数式は、

=CORREL(B2:B11,C2:C11)


とても簡単に設定できる関数なのですが、効果は絶大です。

このパターンでの相関係数は「1」。

1に近いので、0.8以上だと強い相関があるいえるそうですが、散布図にすることでよりイメージがわきやすいかと思います。


B1:C11を範囲選択します。

挿入タブの「散布図」から散布図をクリックします。


散布図が挿入されました。

散布図は何も加工していないプレーンの状態です。


相関係数が「1」ということは、気温が上がれば販売数も比例して増えていくということが、確実なわけです。

このグラフは、y=10xというグラフといえますね。


ただ、現実世界ではこのようなことは、まずありませんので、気温はそのままで、販売数を少し現実的に変えて、「0.6」ぐらいの相関係数をみてみましょう。


相関係数は、「0.653854」なので、弱い相関があるといえます。

この場合の散布図をみてみましょう。

先程の相関係数「1」の時とは異なり、マーカーが散らばっていることがわかります。

関係性が弱くなっていることがみてわかります。


さらに、相関関係を弱くしてみましょう。

見た感じですでに、データはバラバラで関係性は無いように見えます。


 

相関係数も「0.09291」とほぼゼロ。

すなわち、ほぼ相関がないといえます。


散布図はどうなったのでしょうか?

 

マーカーはバラバラで、まとまっていなことがわかりますね。


散布図をつかうと、2つのデータの間に関係性があるのか?ないのか?を視覚的判断することも出来ます。

CORREL関数で相関係数を算出するのは簡単ですが、イメージとして散布図を作って資料にプラスするなどしてみると、いいのかもしれませんね。