Excel。正規分布グラフをつくってみよう
<正規分布グラフ>
正規分布とは、簡単にいうと、普通が多くて、とても良いととても悪いが少ないデータの集まりです。
普通というのが、平均になるわけですね。
平均あたりに多くデータが集まっているデータです。
正規分布では、重要なデータが2つあります。
平均と標準偏差です。
平均は、先ほど書いたように、データの中心にあたります。
標準偏差は、データの広がり具合です。
値が小さいと平均あたりにデータがまとまっていることを意味しますので、タワーみたいな放物線になります。
逆に、値が大きいと平均から遠ざかるので、低い丘のような放物線になります。
あと、正規とはなんですか?と聞かれますが、標準的ということなんですが、何が標準なの?と堂々巡りみたいになってきますので、代表的な、基本となる分布図ということです。
データを用意します。
平均はB1に0と設定します。
グラフの真ん中が0なので、0に揃えます。
そうしないと広がり具合がわかりにくいからです。
標準偏差はB2に1と設定します。
なぜ1なのかというと、同じ基準で比べやすくするためです。
平均を0で標準偏差を1にすることを、「標準化」といいます。
グラフの横軸を0.5刻みにしますので、A5に-3として、3まで入力します。
縦軸を求めます。縦軸には、正規分布の値を求めますので、NORM.DIST関数をつかいます。
B5の数式は、
=NORM.DIST(A5,$B$1,$B$2,FALSE)
と設定します。
引数を確認しましょう。
最初の引数は、x。
調べたい数です。A5を設定します。
2つ目の引数は、平均。
$B$1です。
絶対参照を忘れずに設定します。
3つ目の引数は、標準偏差。
$B$2です。
広がり具合のことです。
オートフィルで数式をコピーしますので、絶対参照を忘れないで設定します。
4つ目の引数は、関数形式で、FALSEの確率質量関数を設定します。
累積分布関数は、そこまでの合計を求めます。
今回は、その点の高さを求めるFALSEの確率質量関数をつかいます。
ただし、FALSEは「確率質量関数」と表示されていますが、誤訳で、本当は「確率密度関数」が正解なんですね。
なんでも、統計学的には誤りだけど、Excel のヘルプではそのまま残っているというわけです。困ったものです。
ちなみのちなみで、確率質量関数は、離散分布のことをいいます。
サイコロの6が出る目の確率とかでつかいます。
では、A4:B17を範囲選択して、挿入タブのグラフにある「散布図(平滑線)」を選択します。
グラフが挿入されます。
あとは、見栄えを整えて完成です。





