Excel。手早く2つ評価データに平均値の差があるのかないのか検証したい
<T.TEST関数>
販売している「商品A」と、「商品A」をカスタマイズした「商品A改良」の評価値のデータ表があります。
見た目、「商品A改良」のほうが、評価値がいいようにみることができますし、商品Aの平均値と商品A改良の平均値の差はたった「6ポイント」程度しかありません。
差はあるのかを手早く検証したいわけです。
このような時には、「T.TEST関数」をつかうことで、データの差を検証することができます。
また、「商品A改良」のほうが「商品A」より良いハズという仮定で算出していきます。
なお、説明上データ数が少なくしていますが、本来データは多いに越したことはありません。
F1にT.TEST関数をつかった数式を設定しました。
=T.TEST(B2:B11,C2:C11,1,1)
この手の統計や分析の関数は、引数自体がとてもシンプルで算出してくれるのですが、引数の意味がわかりにくいので確認しておきましょう。
1番目の引数は、配列1。一つ目の範囲なので、B2:B11
2番目の引数は、配列2。比較したい範囲なので、C2:C11
3番目の引数は、「検定の指定」で尾部のことです。
片側分布なら「1」。
両側分布なら「2」とします。
配列1と配列2のどっちかが大きいかを調べたいなら「片側分布」の1。
配列1と配列2に差があるのかを調べたいなら「両側分布」の2。
つかいわけることができます。
「商品A」を改良したわけですから、「商品A改良」のほうが、きっと数値はいいだろうという想定したので、「1」を採用しています。
4番目の引数は、「検定の種類」
「対」は、対応のあるデータなら1を選択します。
今回は、同じ人が「商品A」と「商品A改良」をチェックしているとします。
同じ人が2回チェックした場合のデータならば「1」の対を採用するわけです。
「等分散の2標本」なら「2」を設定します。
等分散とは、母集団の分散が等しいと仮定できる場合という意味です。
なので、逆に仮定できない場合は、「3」の「非等分散の2標本」を設定します。
算出結果は、「0.0112873」
確率は0.05(5%)より0.01(1%)と小さいので、「差がある」といえることが数値的に検証できたというわけです。
5%よりも大きければ、「差はナイ」ということを意味します。
データと平均値だけの資料ではもったいないので、日頃使っているデータから違ったことが見えてくるかもしれませんね。