Excel。いつもの資料にデータの特徴を把握する2つの関数を追加してみよう。
<AVERAGE・GEOMEAN・MEDIAN関数>
Excelをつかってデータから合計値や件数。
それに平均値を算出してみる。
なんてことをするわけが、それだけでは、そのデータ全体がみえてこないので、簡単な関数をつかって、把握するための数値を算出してみましょう。
次のデータを用意しました。
説明用なのでデータ数は少ないですが、算出したいものを確認していきます。
E1には、平均値が算出されています。
オートSUMボタン内にもある、お馴染みの、AVERAGE関数をつかっています。
E1の数式は、
=AVERAGE(B2:B11)
算出結果は、「18」
だけど、何かおかしいですよね。
「18」ってみた感じで大きいですよね。
原因は、B9の「72」という値。
とびぬけていますね。
いわゆる「外れ値」ですね。
このようにとびぬけた値があると、AVERAGE関数は、そのデータに引っ張られる特徴があります。
つまり、AVERAGE関数は、算数の世界で使用する「算術平均」だからです。
とびぬけたデータがあることを考慮すると、「幾何平均」を算出するといいわけですね。
幾何平均は、かけ離れた値の影響を受けにくい特性があります。
幾何平均を算出する関数は、GEOMEAN関数です。
E2の数式は、
=GEOMEAN(B2:B11)
算出結果は、13.21…と、外れ値の影響を受けてない印象の結果が算出できました。
AVERAGE関数だけをつかった資料よりも、GEOMEAN関数の結果も併記してあげると、いいですね。
次に、データ全体がだいたい同じ数値の幅ならばいいのですが、複数の塊で集まっていることもあります。
分布の偏りがあるかもしれません。
偏りがある場合には、平均値だけでは実際のデータとの印象に誤差が生じる恐れがありますので、「中央値」も算出したいところですね。
E3の数式は、
=MEDIAN(B2:B11)
MEDIAN関数をつかうことで、中央値を算出することができます。
中央値は、すべての値を昇順に並べて、ちょうど、真ん中にある値です。
単純に平均値を算出するとデータの偏りがみえてきませんが、中央値や幾何平均をつかうことで、分布の偏りがみえてきます。
あと、最頻値とかを算出ということも考えますが、データが極端に偏っている場合だとつかうのもいいかと思いますが、一般のデータでは、あまりつかわないように思われます。
ということで、オートSUMボタンにあるAVERAGE関数の平均だけではなく、幾何平均のGEOMEAN関数や、中央値のMEDIAN関数も合わせてつかってみると、よりデータを把握できます。