Excel。相関関係は散布図をつかったデータの並び方であるなしがわかります。
<CORREL関数・散布図>
二つの数値には、関係性があるのか、ないのか?知りたい場合があります。
たとえば、気温が上がると、冷たい飲み物が多く売れるのだろうか?
「相関係数」を算出することができるCORREL関数を使えば、数値としては算出することができます。
ただ、算出結果が、「1」に近ければ強い相関があり、「0」に近ければほぼ相関はないといわれています。
といわれても、なかなかわかりにくいので、グラフにしてみると、幾分わかりやすくなるかと思います。
今回は、次のデータをつかって、相関係数を算出したうえで、散布図はどのようになるのかを確認していきましょう。
B列の最高気温とC列の販売数には関係性があるのか?
その相関係数を算出しているのが、F1。
F1の数式は、
=CORREL(B2:B11,C2:C11)
とても簡単に設定できる関数なのですが、効果は絶大です。
このパターンでの相関係数は「1」。
1に近いので、0.8以上だと強い相関があるいえるそうですが、散布図にすることでよりイメージがわきやすいかと思います。
B1:C11を範囲選択します。
挿入タブの「散布図」から散布図をクリックします。
散布図が挿入されました。
散布図は何も加工していないプレーンの状態です。
相関係数が「1」ということは、気温が上がれば販売数も比例して増えていくということが、確実なわけです。
このグラフは、y=10xというグラフといえますね。
ただ、現実世界ではこのようなことは、まずありませんので、気温はそのままで、販売数を少し現実的に変えて、「0.6」ぐらいの相関係数をみてみましょう。
相関係数は、「0.653854」なので、弱い相関があるといえます。
この場合の散布図をみてみましょう。
先程の相関係数「1」の時とは異なり、マーカーが散らばっていることがわかります。
関係性が弱くなっていることがみてわかります。
さらに、相関関係を弱くしてみましょう。
見た感じですでに、データはバラバラで関係性は無いように見えます。
相関係数も「0.09291」とほぼゼロ。
すなわち、ほぼ相関がないといえます。
散布図はどうなったのでしょうか?
マーカーはバラバラで、まとまっていなことがわかりますね。
散布図をつかうと、2つのデータの間に関係性があるのか?ないのか?を視覚的判断することも出来ます。
CORREL関数で相関係数を算出するのは簡単ですが、イメージとして散布図を作って資料にプラスするなどしてみると、いいのかもしれませんね。