Excel。AとB。得点も平均も同じだけど、どっちのほうに価値があるのかしりたい
<STANDARDIZE・AVERAGE・STDEV.P関数>
同じ数字には、同じ価値があるはずですが、全体のデータの中でどのような位置にその数値があるのかによって、価値が変わってきます。
例えば、次の表を見てみましょう。
B列には、Leadingの得点。C列には、Writingの得点の表です。
LeadingとWritingは、当然テスト内容も異なりますので、難易度も異なっています。
それを踏まえたうえで、数式を確認します。
B13:C13には、それぞれの平均値が算出されています。
B13の数式は、
=AVERAGE(B3:B12)
B14:C14には、標本標準偏差を算出しています。
B14の数式は、
=STDEV.P(B3:B12)
標準偏差とは、データのバラツキ度合いを数値として算出したものです。
B列のLeadingのほうが、Writingよりも数値が大きいので、Leadingはバラツキが大きいということがわかるというわけです。
なお、STDEV.P関数は、全データをサンプル(母集団)として算出したものです。
一部のサンプルから全体とみなす場合は、STDEV.S関数をつかいます。
さて、ここからが本題。
番号2番は、両方とも、85点ですが、同じ価値なのでしょうか。
要するに、平均が90点なのに、85点は、平均以下になってしまいますが、逆に平均が30点ならば、圧倒的な数値です。
このように、データによって、価値が変動します。
では、2番の人は、どちらのほうが、価値があるのでしょうか。
そこで、使う関数が、「STANDARDIZE関数」です。
STANDARDIZE関数は、標準化得点であるZ得点を算出する関数です。
D3の数式を確認してみましょう。
=STANDARDIZE(B3,B$13,B$14)
最初の引数は、データの数値なので、B3。
2番目の引数は、平均なので、B13。
オートフィルで数式をコピーするので、行固定の複合参照にしますので、B$13としています。
最後の引数は、標準偏差なので、B14。こちらも、行固定の複合参照にしますから、B$14と設定します。
あとは、オートフィルで数式をコピーしたのが、上記の表です。
2番のデータを見てみましょう。
Leadingが、0.681で、Writingが、1.664 と算出されました。
この数値が大きいほど、価値があることがわかるので、Writingの85点の方が、価値が高いことが判明しました。
確かに、2番のWritingの85点は、全体でトップの成績です。
5番目データは、LeadingのほうがWritingよりも点数自体は78点と高いのですが、Writingの標準化得点が高いので、点数こそ71点と低いですが、価値が高いと判断できるわけです。
このように、単純にその数値が高い、低いだけではなく、周りから見て、どうなのかという判断できるデータも、日頃使っている資料に追加してみると、違ったことが見えてくるかもしれませんね。