Excel。標本データ数が少ない場合は、t分布(スチューデントのt分布)を利用します。
<COUNT・AVERAGE・STDEV.S・T.INV.2T・SQRT関数>
データがどのようになっているのか確認したくても、母集団の標準偏差がわからない。
さらに、サンプルデータの件数も少ない場合は、「t分布」を利用して推測することができます。
t分布は、スチューデントのt分布の略称ですね。
次のデータを使って必要な値を算出してみましょう。
最初は、標本数を算出します。
データ件数を算出しますので、COUNT関数をつかいます。
E2の数式は、
=COUNT(B2:B11)
算出結果は、10
標本平均ですが、これは、お馴染みAVERAGE関数で算出しますので、
E3の数式は、
=AVERAGE(B2:B11)
算出結果は、141.9
標本標準偏差を算出するには、STDEV.S関数で算出することができます。
今回は、サンプルデータが少ないことと、母集団の標準偏差がわからないため、STDEV.S関数を使います。
E4の数式は、
=STDEV.S(B2:B11)
関数自体は馴染みが薄いのですが、範囲選択を設定するだけで、簡単に算出することができます。
STDEV.S関数とSTDEV.P関数がありますが、SはSamle=標本の頭文字で、PはPopulation=母集団を意味しています。
今回はサンプルデータの標本から算出させるので、STDEV.S関数をつかって算出させます。
算出結果は、34.13518875
これで、境界値である、t値を算出するための数値を算出することができました。
今回は、信頼度を95%とします。
自由度のE7は、
=E2-1
という数式を設定しています。
自由度は、独立して自由に選べる数値の数です。
t分布の場合は、標本数-1が自由度になります。算出結果は9ですね。
境界値(t値)を算出していきます。
t値も関数で簡単に算出することができます。
使う関数は、T.INV.2T関数です。
T.INV.2T関数は、t分布の両側の累積確率からt値を算出することができる関数です。
E8の数式は、
=T.INV.2T(1-E6,E7)
1-E6の引数である確率は、100%-95%で5%をつかいます。
算出された結果は、2.262157163
境界値(t値)まで算出できたので、上限信頼限界と下限信頼限界を算出しておきましょう。
上限信頼限界と下限信頼限界は、公式があります。
上限信頼限界は、
標本平均+t値×標準偏差÷√標本数
下限信頼限界は、
標本平均-t値×標準偏差÷√標本数
この公式にのっとって、計算式を設定していきましょう。
なお、√(ルート)は、SQRT関数で算出することができます。
よって、上限信頼限界のE9には、
=$E$3+$E$8*$E$4/SQRT(E2)
オートフィルで数式をコピーして、下限信頼限界の計算式を作るため、絶対参照を使っています。
下限信頼限界のE10には、
=$E$3-$E$8*$E$4/SQRT(E3)
という計算式を設定します。
計算式から、上限信頼限界は、
166.318843
下限信頼限界は、
135.417629
と算出することができました。
このことから、母平均の区間指定結果は、信頼度95%とした場合。
135.417629≦μ≦166.318843
ということがわかりました。
なので、4/17の204は、外れすぎというところでしょうか。
このようなことが、関数をつかうことで、比較的簡単に算出することができます。