9/26/2021

Excel。いつもの資料にデータの特徴を把握する2つの関数を追加してみよう。【Data features】

Excel。いつもの資料にデータの特徴を把握する2つの関数を追加してみよう。

<AVERAGE・GEOMEAN・MEDIAN関数>

Excelをつかってデータから合計値や件数。

それに平均値を算出してみる。

なんてことをするわけが、それだけでは、そのデータ全体がみえてこないので、簡単な関数をつかって、把握するための数値を算出してみましょう。


次のデータを用意しました。


説明用なのでデータ数は少ないですが、算出したいものを確認していきます。


E1には、平均値が算出されています。


オートSUMボタン内にもある、お馴染みの、AVERAGE関数をつかっています。


E1の数式は、

=AVERAGE(B2:B11)

算出結果は、「18」


だけど、何かおかしいですよね。

「18」ってみた感じで大きいですよね。


原因は、B9の「72」という値。

とびぬけていますね。

いわゆる「外れ値」ですね。


このようにとびぬけた値があると、AVERAGE関数は、そのデータに引っ張られる特徴があります。


つまり、AVERAGE関数は、算数の世界で使用する「算術平均」だからです。


とびぬけたデータがあることを考慮すると、「幾何平均」を算出するといいわけですね。


幾何平均は、かけ離れた値の影響を受けにくい特性があります。


幾何平均を算出する関数は、GEOMEAN関数です。


E2の数式は、

=GEOMEAN(B2:B11)

算出結果は、13.21…と、外れ値の影響を受けてない印象の結果が算出できました。


AVERAGE関数だけをつかった資料よりも、GEOMEAN関数の結果も併記してあげると、いいですね。


次に、データ全体がだいたい同じ数値の幅ならばいいのですが、複数の塊で集まっていることもあります。

分布の偏りがあるかもしれません。

偏りがある場合には、平均値だけでは実際のデータとの印象に誤差が生じる恐れがありますので、「中央値」も算出したいところですね。


E3の数式は、

=MEDIAN(B2:B11)

MEDIAN関数をつかうことで、中央値を算出することができます。

中央値は、すべての値を昇順に並べて、ちょうど、真ん中にある値です。


単純に平均値を算出するとデータの偏りがみえてきませんが、中央値や幾何平均をつかうことで、分布の偏りがみえてきます。


あと、最頻値とかを算出ということも考えますが、データが極端に偏っている場合だとつかうのもいいかと思いますが、一般のデータでは、あまりつかわないように思われます。


ということで、オートSUMボタンにあるAVERAGE関数の平均だけではなく、幾何平均のGEOMEAN関数や、中央値のMEDIAN関数も合わせてつかってみると、よりデータを把握できます。