Excel。条件付きで一部のデータをつかって分散(不偏分散)を算出するには
<DVAR関数>
データがどのぐらい、散らばっているのかを知るには分散を算出します。
そして、データ全てを使いたくでもデータ量が多い場合は、データの一部を使って分散を算出します。これを「不偏分散」といいます。
Excelには、不偏分散を算出することができる、VAR.S関数が用意されていますが、条件を付けて算出することができません。
使用する場合、わざわざ、該当するデータを抽出してから、VAR.S関数を使うという流れで算出します。
ただ、それでは、面倒なので、条件付き不偏分散を算出することができる「DVAR関数」をつかうことで、手早く算出することができます。
次の表をつかって不偏分散を算出していきます。
今回は、カテゴリーが「PN」の不偏分散を算出します。
「DVAR関数」をはじめとする「D系:データベース系」関数は、事前に条件を用意する必要があります。
B8:B9が条件に該当します。
D9にDVAR関数の数式を設定します。
=DVAR(A1:D6,D1,B8:B9)
これで、カテゴリーが「PN」の不偏分散を算出することができました。
DVAR関数の引数を確認しておきます。
最初の引数は、「データベース」。
見出し行も含めて表全体ですから、A1:D6を設定します。
2つ目の引数は、「フィールド」。
これは、算出対象になる列名です。在庫数の不偏分散を算出するわけですから、D1を設定ます。
最後の引数は、「条件」。
先程紹介したように、B8:B9を設定します。
これで、条件付きの不偏分散を算出することができました。
なお、算出結果の数値が0に近ければ、散らばっていないことを意味しています。