6/24/2020

Excel。標本データ数が少ない場合は、t分布(スチューデントのt分布)を利用します。【Student's "t "distribution】

Excel。標本データ数が少ない場合は、t分布(スチューデントのt分布)を利用します。

<COUNT・AVERAGE・STDEV.S・T.INV.2T・SQRT関数>

データがどのようになっているのか確認したくても、母集団の標準偏差がわからない。

さらに、サンプルデータの件数も少ない場合は、「t分布」を利用して推測することができます。
t分布は、スチューデントのt分布の略称ですね。

次のデータを使って必要な値を算出してみましょう。
 
最初は、標本数を算出します。

データ件数を算出しますので、COUNT関数をつかいます。

E2の数式は、
=COUNT(B2:B11)
算出結果は、10

標本平均ですが、これは、お馴染みAVERAGE関数で算出しますので、
E3の数式は、
=AVERAGE(B2:B11)
算出結果は、141.9

標本標準偏差を算出するには、STDEV.S関数で算出することができます。

今回は、サンプルデータが少ないことと、母集団の標準偏差がわからないため、STDEV.S関数を使います。

E4の数式は、
=STDEV.S(B2:B11)
関数自体は馴染みが薄いのですが、範囲選択を設定するだけで、簡単に算出することができます。

STDEV.S関数とSTDEV.P関数がありますが、SはSamle=標本の頭文字で、PはPopulation=母集団を意味しています。

今回はサンプルデータの標本から算出させるので、STDEV.S関数をつかって算出させます。

算出結果は、34.13518875
 
これで、境界値である、t値を算出するための数値を算出することができました。

今回は、信頼度を95%とします。

自由度のE7は、
=E2-1
という数式を設定しています。

自由度は、独立して自由に選べる数値の数です。

t分布の場合は、標本数-1が自由度になります。算出結果は9ですね。

境界値(t値)を算出していきます。

t値も関数で簡単に算出することができます。

使う関数は、T.INV.2T関数です。

T.INV.2T関数は、t分布の両側の累積確率からt値を算出することができる関数です。

E8の数式は、
=T.INV.2T(1-E6,E7)
1-E6の引数である確率は、100%-95%で5%をつかいます。

算出された結果は、2.262157163
 
境界値(t値)まで算出できたので、上限信頼限界と下限信頼限界を算出しておきましょう。

上限信頼限界と下限信頼限界は、公式があります。

上限信頼限界は、
標本平均+t値×標準偏差÷√標本数
下限信頼限界は、
標本平均-t値×標準偏差÷√標本数

この公式にのっとって、計算式を設定していきましょう。

なお、√(ルート)は、SQRT関数で算出することができます。

よって、上限信頼限界のE9には、
=$E$3+$E$8*$E$4/SQRT(E2)
オートフィルで数式をコピーして、下限信頼限界の計算式を作るため、絶対参照を使っています。

下限信頼限界のE10には、
=$E$3-$E$8*$E$4/SQRT(E3)
という計算式を設定します。
 
計算式から、上限信頼限界は、
166.318843
下限信頼限界は、
135.417629
と算出することができました。

このことから、母平均の区間指定結果は、信頼度95%とした場合。

135.417629≦μ≦166.318843
ということがわかりました。

なので、4/17の204は、外れすぎというところでしょうか。

このようなことが、関数をつかうことで、比較的簡単に算出することができます。