3/23/2020

Excel。分布の形を把握する、歪度と尖度を条件付きでは算出するには並び替える【Skewness and kurtosis】

Excel。分布の形を把握する、歪度と尖度を条件付きでは算出するには並び替える

<SKEW関数・KURT関数>

調査したデータがどのように、偏っているのか?平均値近くにあるのか?など分布の形をみる時に使う関数に、SKEW関数・KURT関数というのがExcelにはあります。

SKEW関数は、歪度(わいど)を算出する関数で、歪度とは分布が平均値を起点としてどちらに偏っているのかを確認することできます。

KURT関数は、尖度(せんど)を算出する関数で、尖度とは分布が平均値の近くに集中しているかどうかを確認することができます。

このSKEW関数・KURT関数は、算出させるには、とても簡単な関数なのですが、問題は、SUMIFS関数のように、条件付きで算出することができない関数なのです。

つまり次のような表の場合、ひと工夫しないと、算出することができないのです。


サンプルのAとBがどのように分布しているのかを確認するには、SKEW関数・KURT関数を使えば簡単に算出できるわけです。

G2のサンプルAの歪度を算出するには、
=SKEW(C2:C16)
という数式を設定するだけです。

またサンプルAの尖度を算出するには、
=KURT(C2:C16)
という数式を設定するだけです。

あとは、オートフィルで数式をコピーすればいいわけです。

それぞれの引数は範囲設定するだけなのですが、性別や商品名ごとなど、それぞれではどのように分布されているのかを算出するには、データをまとめる必要があります。

飛び地になっているセルをいちいち選択するのは面倒です。

データをまとめるのは、小計機能でも行いますよね。

このようにExcelでは、ちょくちょくデータをまとめないといけない処理というのがあります。

では、どのようにデータをまとめるのかというと、単純に【並び替え】をおこなえばいいわけです。

今回は、単純に性別のB列を昇順で並び替えを行いました。

このようにすれば、算出方法自体はかわりませんので、SKEW関数・KURT関数を使って算出することができます。

では、算出して確認してみましょう。

このように、男女での違いがわかるようになりましたね。

なお、歪度の結果、0に近ければ左右対称の分布になりますが、負数のときは、山の頂点が右側にある分布図となり、正数ならば逆に左側によった分布図で表現されます。

女性のBが0.84とAと比べると0から遠くなっているので、偏った分布になっていることがわかります。実際の数値で確認してみると、
2・3・4・10・3・10
と平均からみて偏ったデータになっていることからも、歪度で確認することができるわけです。

また、尖度の結果、0に近ければ正規分布に近く、負数ならば、平坦な分布図で表示され、正数ならば鋭角的な尖った分布図に表示されます。