10/16/2020

Excel。二つのデータに関係性はあるのないの?それなら関数で確認しちゃいましょう。【regression analysis】

Excel。二つのデータに関係性はあるのないの?それなら関数で確認しちゃいましょう。

<CORREL関数・FORECAST.LINEAR関数・TREND関数とスピル機能>

データをまとめた表があります。

 

広告をしてみた結果、来店客数に影響があるのかないのか、例えば、広告代を増やしたら、もっとお客さん来てくれるのかなど、気になるわけですね。

当然のことながら、経営とか見た目などフィーリングで判断するわけにはいきません。


そこで、この二つのデータに「相関関係」はあるのかないのかを知るには、ある関数を使うことで比較的簡単に、確認することができます。


【相関関係の強弱を数値化(相関係数)】

相関係数を算出するには、「CORREL関数」という関数が用意されています。

今回は、広告代を「X」、来店客数を「Y」とします。


F1に次の数式を設定しました。

=CORREL(B2:B13,C2:C13)

二つのデータの範囲をそれぞれ引数に設定するだけで、算出することができます。


算出された数値は、何を意味するのかというと、相関係数「1」に近いほど、関係性が強く、「0」に近いほど、関係性が弱いので、今回は、「0.99」という算出結果から、「1」に近いことから、関係性が強いことがわかりました。


せっかく、関連性がわかったので、広告代を思い切って、奮発して、50000にしたら、来店客数はどのぐらいになるのか、予想することもできます。


【FORCAST.LINER関数で予測】

そこで使用する関数が、「FORECAST.LINEAR関数」。

FORECAST.LINEAR関数は、回帰直線による予測値を算出することができる関数です。

引数の設定が簡単なので、使わないのはもったいない関数の一つです。


なお、FORECAST.LINEAR関数は、Excel2016から登場した新しい関数です。


F4の数式は、

=FORECAST.LINEAR(F3,C2:C13,B2:B13)

2338と予測値を算出することができました。


【複数の予測値を算出したいなら、TREND関数】

FORECAST.LINEAR関数は簡単で便利ではあるのですが、欠点があって、複数の予測値を算出することができません。


広告代が30000だったら?35000だったら?と広告代の数値を入力し直すのは面倒です。


そこで、複数の予測値を算出したい場合は、「TREND関数」を使います。

F7の数式は、

=TREND(C2:C13,B2:B13,E7:E11)


F列に広告代別の予測来店客数が算出されました。

広告代が50000のときに、2338.711と算出されています。

先程の、FORECAST.LINEAR関数で算出した結果と同じ算出結果になっていますね。


ところでTREND関数は、配列数式で算出する必要があるので、Ctrl+Shift+Enterで確定する必要が、『かつて』はありましたが、Office365のExcelに新たに追加された『スピル機能』によって、そのままEnterキーで確定するだけで、連続するセルに数式を設定してくれます。


そのため、以前に比べて、配列数式が苦手だった人でも、使い勝手がよくなっています。