Excel。事務職のデータ分析24。歪度と尖度を算出したけど、グラフ化するには?
<SKEW関数&KURT関数>
次のようなデータがあります。以前しましたが、Excelのアドインの「データ分析」を使うことで、
簡単に、基本統計量を算出することはできるのですが、
意味が分からないと、せっかく算出された数値も使うに使えません。
ということで、今回は、この中にある、
「歪度(わいど)」「尖度(せんど)」
に注目してご紹介していきます。
ちなみに、「歪度(わいど)」「尖度(せんど)」の意味を確認しておくと、
歪度(わいど)は、データの分布が平均値を中心として
どちらに偏っているかを表す値ですね。
SKEW(スキュー)関数を使うことで算出することができます。
尖度(せんど)は、データの分布が平均値の近くに
集中しているかどうかを表す値ですね。
KURT(カート)関数を使うことで算出することができます。
では、基本統計量を一度削除して、関数を使って、
12行目に平均値を、13行目に標準偏差を、
そして、14行目に歪度と15行目に尖度を算出していくことにしましょう。
それぞれの数式を確認しておきましょう。
12行目の平均は、お馴染みのAVERAGE関数ですね。
C12の数式は、
=AVERAGE(C2:C11)
13行目には、標準偏差を算出します。
今回の歪度尖度と関係ないと思うかもしれませんが、
尖度歪度の意味を確認するために、分布曲線グラフを作成するのですが、
その時に必要な値です。
標準偏差を算出する関数は、STDEV.S関数を使いますので、
C13をクリックして、
STDEV.S関数ダイアログボックスを表示しましょう。
数値1にはC2:C11として、OKボタンをクリックします。
C13の数式は、
=STDEV.S(C2:C11)
C14の歪度を算出するには、SKEW関数を使いますので、
SKEW関数ダイアログボックスを表示しましょう。
C14の数式は、
=SKEW(C2:C11)
15行目は、尖度を算出します。
使う関数は、KURT関数なので、C15をクリックして、
KURT関数ダイアログボックスを表示しましょう。
C15の数式は、
=KURT(C2:C11)
2回目のD列も同じように、どれも簡単に算出することが出来るのですが、
これらの数値だけでは何がなんだか、理解しにくいので、
グラフ化していくといいわけですね。
この数値だけでは、グラフ(正規分布曲線)を作ることが出来ないので、
次のような表を作成しましょう。
F列は、0点~100点の0~100を入力します。
G列は、NORM.DIST関数を使って、正規分布値を算出していますので、
NORM.DIST関数ダイアログボックスを表示しましょう。
Xには、点数が入力されているセルなので、$F2。
数式をオートフィルでコピーしますので、複合参照にしてあります。
平均には、平均を算出してある、C$12。
標準偏差には、先ほど、このために算出してあった、C$13の標準偏差。
関数形式には、FALSEを入力します。
G2の数式はこのようになっています。
=NORM.DIST($F2,C$12,C$13,FALSE)
この数式をコピーしたのが先ほどの表ですね。
次にグラフ化します。
F1:H12を範囲選択して、
散布図から「散布図(平滑線)」を選択しましょう。
横軸を100までにして、グラフタイトルを削除しておきましょう。
このようなグラフを作ることで、歪度と尖度の数値の意味がわかってきます。
数値的には、大差がないのですが、
尖度が-1.4の2回目の数値が散っていることがわかります。
このように、数値もグラフも簡単に算出することが出来ます。