2/26/2022

Excel。AとB。得点も平均も同じだけど、どっちのほうに価値があるのかしりたい【Standardization】

Excel。AとB。得点も平均も同じだけど、どっちのほうに価値があるのかしりたい

<STANDARDIZE・AVERAGE・STDEV.P関数>

同じ数字には、同じ価値があるはずですが、全体のデータの中でどのような位置にその数値があるのかによって、価値が変わってきます。


例えば、次の表を見てみましょう。


B列には、Leadingの得点。C列には、Writingの得点の表です。

LeadingとWritingは、当然テスト内容も異なりますので、難易度も異なっています。

それを踏まえたうえで、数式を確認します。


B13:C13には、それぞれの平均値が算出されています。

B13の数式は、

=AVERAGE(B3:B12)

B14:C14には、標本標準偏差を算出しています。


B14の数式は、

=STDEV.P(B3:B12)

標準偏差とは、データのバラツキ度合いを数値として算出したものです。

B列のLeadingのほうが、Writingよりも数値が大きいので、Leadingはバラツキが大きいということがわかるというわけです。


なお、STDEV.P関数は、全データをサンプル(母集団)として算出したものです。

一部のサンプルから全体とみなす場合は、STDEV.S関数をつかいます。


さて、ここからが本題。

番号2番は、両方とも、85点ですが、同じ価値なのでしょうか。


要するに、平均が90点なのに、85点は、平均以下になってしまいますが、逆に平均が30点ならば、圧倒的な数値です。


このように、データによって、価値が変動します。


では、2番の人は、どちらのほうが、価値があるのでしょうか。


そこで、使う関数が、「STANDARDIZE関数」です。

STANDARDIZE関数は、標準化得点であるZ得点を算出する関数です。


D3の数式を確認してみましょう。

=STANDARDIZE(B3,B$13,B$14)

最初の引数は、データの数値なので、B3。


2番目の引数は、平均なので、B13。

オートフィルで数式をコピーするので、行固定の複合参照にしますので、B$13としています。

最後の引数は、標準偏差なので、B14。こちらも、行固定の複合参照にしますから、B$14と設定します。


あとは、オートフィルで数式をコピーしたのが、上記の表です。


2番のデータを見てみましょう。

Leadingが、0.681で、Writingが、1.664 と算出されました。


この数値が大きいほど、価値があることがわかるので、Writingの85点の方が、価値が高いことが判明しました。


確かに、2番のWritingの85点は、全体でトップの成績です。


5番目データは、LeadingのほうがWritingよりも点数自体は78点と高いのですが、Writingの標準化得点が高いので、点数こそ71点と低いですが、価値が高いと判断できるわけです。


このように、単純にその数値が高い、低いだけではなく、周りから見て、どうなのかという判断できるデータも、日頃使っている資料に追加してみると、違ったことが見えてくるかもしれませんね。