Excel。データの全体像を知るには、平均値だけでは物足りない気がします。
<SKEW関数・KURT関数>
アンケート結果やサンプルデータなど、集計する時に「平均値」や「中央値」だけでは、全体像が把握できません。
次のデータで説明します。
説明の為極端な数値にしております。
データも少ないです。
サンプルAとサンプルB。
ともに、平均値は、「1.9」と算出されています。
中央値を算出したとしても、サンプルAの中央値は「1」。
サンプルBの中央値は「2」と算出されて、差はありません。
これらの数値からだけだと、サンプルAとサンプルBには差がないように感じてしまう恐れがあります。
平均値や中央値では、データの全体像がみえてこないわけです。
どのようにしたらデータの全体像を把握することができるのか、案として、データの分布状況を把握するだけでも、全体像が見えてきます。
ヒストグラムをつくってもいいのですが、手間暇を考えると、関数をつかってみる方法もあります。
Excelでは、分布の形を知るための歪度(わいど)を算出する関数。
SKEW関数。
尖度(せんど)を算出する関数。
KURT関数が用意されています。
使い方はとてもシンプルなので、日頃から使っている資料にプラスしてみるのもいいかもしれませんね。
まずは、SKEW関数・KURT関数をつかって、歪度と尖度を算出してみましょう。
F2の数式は、
=SKEW(B2:B11)
G2の数式は、
=SKEW(C2:C11)
F3の数式は、
=KURT(B2:B11)
G3の数式は、
=KURT(C2:C11)
どの数式の引数も、該当データ範囲を選択しただけです。
これだけの数式ですが、データの全体像を把握することができます。
ところ、そもそも、歪度・尖度とはなんなのかというと、歪度は、データの分布が平均値を中心としてどちらに偏っているかという値です。
尖度は、データの分布が平均値の近くにまとまっているかという値です。
では、算出結果は何を意味しているのか、歪度からみていきましょう。
SKEW関数の算出結果が「0(ゼロ)」に近ければ、平均値を中心として、データは、左右対称の分布状況ということがわかります。
また、算出結果が、「正数」ならば、平均値よりも左寄り。
「負数」ならば右寄りということがわかります。
サンプルAの歪度は、「3.16227766」。
サンプルBの歪度は、「0.165950431」なので、サンプルBの方が平均値を中心として、少し左側に寄っているデータということがわかります。
サンプルAは、サンプルBと比べて、左側に大きく寄っていることがわかります。
つづいて尖度を見てみましょう。
KURT関数の算出結果が「0(ゼロ)」に近ければ「正規分布」に近くなります。
算出結果が「正数」ならば、正規分布からみて、先端が尖った分布ということがわかり、「負数」ならば、正規分布からみて、頂点が低い、平べったい分布であることがわかります。
サンプルAは「10」。
サンプルBは「-0.733622895」サンプルAは極端なデータで、10件中9件が平均値に違いわけです。
サンプルAのほうが、サンプルBに比べて平均値の近くに集まっていることがわかります。
今回のように、平均値だけに頼っていると、判断が難しいケースもありますので、他の数値を算出して、全体像を確認できるようにすると、今までと違ったものが、資料から見えてくるかもしれませんね。