5/22/2023

Excel。条件付きで一部のデータをつかって分散(不偏分散)を算出するには【dispersion】

Excel。条件付きで一部のデータをつかって分散(不偏分散)を算出するには

<DVAR関数>

データがどのぐらい、散らばっているのかを知るには分散を算出します。


そして、データ全てを使いたくでもデータ量が多い場合は、データの一部を使って分散を算出します。これを「不偏分散」といいます。


Excelには、不偏分散を算出することができる、VAR.S関数が用意されていますが、条件を付けて算出することができません。


使用する場合、わざわざ、該当するデータを抽出してから、VAR.S関数を使うという流れで算出します。


ただ、それでは、面倒なので、条件付き不偏分散を算出することができる「DVAR関数」をつかうことで、手早く算出することができます。


次の表をつかって不偏分散を算出していきます。

DVAR関数

今回は、カテゴリーが「PN」の不偏分散を算出します。


「DVAR関数」をはじめとする「D系:データベース系」関数は、事前に条件を用意する必要があります。


B8:B9が条件に該当します。


D9にDVAR関数の数式を設定します。

=DVAR(A1:D6,D1,B8:B9)


これで、カテゴリーが「PN」の不偏分散を算出することができました。


DVAR関数の引数を確認しておきます。

最初の引数は、「データベース」。

見出し行も含めて表全体ですから、A1:D6を設定します。


2つ目の引数は、「フィールド」。

これは、算出対象になる列名です。在庫数の不偏分散を算出するわけですから、D1を設定ます。


最後の引数は、「条件」。

先程紹介したように、B8:B9を設定します。


これで、条件付きの不偏分散を算出することができました。


なお、算出結果の数値が0に近ければ、散らばっていないことを意味しています。