1/05/2018

Excel。事務職のデータ分析その15。視覚的に外れ値のデータを確認してみよう【Outliers】

Excel。事務職のデータ分析その15。視覚的に外れ値のデータを確認してみよう

<条件付き書式>

上位10位を抽出とした場合、ただ、10件をピックアップするだけなのですが、
大量のデータの場合には、全体の上位10%とか上位20%とか比率で、
抽出することがあります。

その場合、視覚的にまずは確認するには、
条件付き書式』を使う事をお勧めします。

条件付き書式を使うことで、
簡単に上位10%のデータを視覚的にわかるようになるだけではなく、
外れ値』も条件付き書式を使うことで、視覚的にわかるようになります。

【上位10%】

では、最初に上位10%のデータから確認してみましょう。
次の表があります。

10店舗あって、1-5月の売上金額のデータで、50件のデータを用意してあります。

上位10%のデータが視覚的にわかるように条件付き書式を
使っていくわけですが、50件の上位10%なので、5件が該当するはずですね。

このように、今回はわかりやすいデータ件数にしております。

B2:F11まで範囲選択をして、ホームタブの条件付き書式をクリックします。

上位/下位ルールから「上位10%」をクリックすると、
上位10%ダイアログボックスが表示されます。

今回は、10%なので、そのまま。

書式も、そのままでOKボタンをクリックします。

これだけで、この50件のデータの中から、
視覚的、上位10%を判断することができるようになりました。

このように「条件付き書式」を使うことで
簡単にデータの上位10%を判断することができましたね。

【外れ値】

外れ値(ほかのデータと比べて大きく乖離しているデータ)を算出するのも、
日ごろおこなっていなければ、どのようにしたらいいのかもわかりませんし、
通常、標準偏差を算出したりするのですが、
条件付き書式を使えば、外れ値を視覚的に確認することができます。

次のデータを使って確認してみましょう。

B2:F11を範囲選択して、ホームタブの条件付き書式をクリックして、
「新しいルール」を選択します。

新しい書式ルールダイアログボックスが表示されますので、
「ルールの種類を選択してください」は、
『平均より上または下の値だけを書式設定』を選択して、
「ルールの内容を編集してください」にある、
選択範囲の平均値を『より2標準偏差上』を選択して、
書式を設定したら、OKボタンをクリックしましょう。

表はこのようになりました。

同様に、今度は、選択範囲の平均値を『より2標準偏差下』を選択して、
条件付き書式を追加、設定していきましょう。

OKボタンをクリックすれば、
条件付き書式を使って外れ値を視覚的に確認することができましたね。

分析するための資料を作るのに、関数で算出するのもいいですが、
条件付き書式も合わせて資料作成をしてみるのもいいかもしれませんね。