Excel。事務職のデータ分析その2。中央値と最頻値は大事なデータの一つです。
<AVERAGE関数・MEDIAN関数・MODE.SNGL関数>
様々な分析手法はわからなくても、一般職や事務職でも、
会議資料の一つとして、データ分析用の資料作りをすることもあるようです。
そこで、事務職のデータ分析と題して、ご紹介していきたいと思っております。
そして、今回は、【中央値と最頻値】について改めてご紹介していきます。
前回は、平均値を紹介しましたが、
平均値ではイマイチ状況とマッチしていないケースがあるのです。
次の表をご覧ください。
この顧客の年齢の平均をC23に算出してみます。
42と算出されました。
C23の数式は、
=AVERAGE(C3:C22)
算出させること自体には、問題はありませんね。
単なる、AVERAGE関数で算出しております。
しかしながら、この表の年齢を眺めると、結構年齢が高い人が多いように感じます。
平均値はあくまでも、総和をその総和した数で除算した結果なので、
例えば突出した数値があったりすると、その影響を受けて、
平均値が大幅に変動してしまうことがあります。
これでは、分析としてのデータとしては、偏ったデータになってしまいます。
そこで、全体の中央の値を算出する事によって、
違った角度からデータを見ることが出来るわけです。
平均値も中央値も統計量としての定義は異なるだけで、
統計として正しいとは言い切れませんが、
平均値だけでなく、中央値を示すほうが分析用の資料としてはいいと考えられます。
【中央値を算出してみよう】
それでは、C24に中央値を求めて行きます。中央値を算出するには、MEDIAN関数を使います。
では、C24をクリックして、MEDIAN関数ダイアログボックスを表示しましょう。
数値1に、C3:C22と入力してOKボタンをクリックします。
C24には、45と算出されました。
なお、C24の数式は、
=MEDIAN(C3:C22)
算出自体は簡単なので、平均値だけじゃなくて、
中央値も資料によっては追記してあげるといいですね。
要するにデータの中央値が45ということで、
全体的に平均値の年齢よりも高い人が多いということがわかります。
【最頻値も求めてみよう】
そしてもう一つ数値を追加するとしたら、【最頻値】も算出するといいですね。最頻値は、データ内で最も頻繁に登場する値のことになります。
最頻値を算出するもの簡単でして、MODE.SNGL関数を使って算出させます。
C25をクリックして、MODE.SNGL関数ダイアログボックスを表示しましょう。
数値1に、C3:C22と入力してOKボタンをクリックします。
C25には、64と算出されました。
64歳の方が多いので、中央値が平均値よりも高くなっていたことが見えてきますね。
C25の数式は、
=MODE.SNGL(C3:C22)
もし、同率1位がある場合は、登場がいちばん早い値を最頻値としております。
平均値だけではなくて、
中央値とあわせて最頻値も算出することによって、
データを色んな角度から見ることがしやすくなる資料を作ることが出来ますので、
中央値と最頻値を日頃の資料に取り入れてみてはいかがでしょうか?