ラベル median関数 の投稿を表示しています。 すべての投稿を表示
ラベル median関数 の投稿を表示しています。 すべての投稿を表示

4/28/2025

Excel。MEDIAN関数は中央値を算出します【MEDIAN】

Excel。MEDIAN関数は中央値を算出します

<関数辞典:MEDIAN関数>

MEDIAN関数

読み方: メディアン

分類: 統計 

MEDIAN関数

MEDIAN(数値1,[数値2],…)

中央値を算出します

6/22/2023

Excel。分析ツールの基本統計量を関数で算出してみよう。【Basic statistics】

Excel。分析ツールの基本統計量を関数で算出してみよう。

<AVERAGE・STDEV.S・SQRT・COUNT・MEDIAN・MODE.SNGL・VAR.S・KURT・SKEW・MAX・MIN・SUM関数>

アドインでデータ分析にある基本統計量をつかうことで、データのステータスを手早く確認することができます。


G列とH列に表示されているのが、C列のListeningの基本統計量です。

基本統計量

H列の基本統計量の値は、関数でも算出できるので、確認しておきましょう。

基本統計量の関数

H2の平均は、AVERAGE関数です。

=AVERAGE(C2:C11)


標準誤差は、標準偏差をデータの件数の平方根で除算した値です。

=STDEV.S(C2:C11)/SQRT(COUNT(C2:C11))

で算出することができます。


STDEV.S関数は、「S」なので、数値をサンプルとした標準偏差を算出する関数です。


SQRT関数は、平方根を算出する関数です。


COUNT関数は、数値の件数を算出関数です。


中央値は、MEDIAN関数で算出できます。

=MEDIAN(C2:C11)


最頻値は、MODE.SNGL関数で算出できます。

最頻値は、データ内で一番多く登場した数値のことですね。

=MODE.SNGL(C2:C11)


標準偏差は、先程紹介した、STDEV.S関数で算出します。

=STDEV.S(C2:C11)


標準偏差は、データが平均値からどのぐらい外れているか(散っているのか)を表します。



分散は、VAR.S関数で算出します。

=VAR.S(C2:C11)


尖度(せんど)は、KURT関数で算出できます。

=KURT(C2:C11)

尖度は、正規分布を元に上下にどの程度偏っているかを表す値です。


歪度(わいど)は、SKEW関数で算出できます。

=SKEW(C2:C11)

歪度は、正規分布を元に左右にどの程度偏っているかを表す値です。


範囲は、最大値と最小値の範囲(レンジ)です。

最大値から最小値を減算すれば算出できます。

=MAX(C2:C11)-MIN(C2:C11)


最小は、MIN関数ですね。

=MIN(C2:C11)


最大は、MAX関数ですね。

=MAX(C2:C11)


合計は、SUM関数ですね。

=SUM(C2:C11)


最後は、データの個数なので、COUNT関数です。

=COUNT(C2:C11)


このように、基本統計量は様々な関数をつかって算出しています。

算出する項目が多いため、面倒なので、分析ツールをつかえるようならば、つかったほうが、楽なような気がします。

3/15/2023

Excel。平均値だけでなく中央値も算出すると、状況が見えてきます。【Median】

Excel。平均値だけでなく中央値も算出すると、状況が見えてきます。

<AVERAGE関数・MEDIAN関数>

Excelでは、平均値を算出するだけならば、ホームタブのオートSUMボタンの中にある平均をクリックするだけで、平均値を算出することができます。


ただ、そもそも、「平均値」だけでは、データ全体の状況を把握するには、ちょっと足らないわけですね。


次の表を用意しました。


B7には、

=AVERAGE(B2:B6)

という数式を設定してあります。

この数式をC7にオートフィルでコピーしました。


競技1と競技2の平均値ですが、同じ「50」と算出されています。


ただ、競技1と競技2の数値をみると、競技1よりも競技2のほうが、それぞれのデータは50近くにあります。


しかし、競技1のデータには、差があるようにみえます。


データとしては、バラバラだということです。

そして、平均値は、突出した数値があると、それに引っ張られる傾向にあります。


つまり、平均値だけだと、どうしても、データの全体像がわからないわけです。


そこで、データ全体の中央の値である、「中央値」を算出するだけで、データ全体がどのようになっているのか、把握しやすくなります。


B8には、中央値を算出することができる関数。


「MEDIAN関数」をつかった数式を設定してあります。


=MEDIAN(B2:B6)


C8には、オートフィルでコピーした数式が設定してあります。


その結果、競技1の中央値は、「30」であり、競技2の中央値は「49」ということがわかりました。


見た目に近い印象の数値が算出されました。


中央値は、平均値と異なり、一部の外れた値の影響を受けにくい傾向にあります。


中央値を算出するMEDIAN関数は、比較的わかりやすいので、いつも算出している平均値と合わせて中央値も算出してみるといいかもしれませんね。

9/29/2021

Excel。AVERAGE関数だけではもったいない。データの特徴を把握する2つの関数を追加してみよう。【Grasp】

Excel。AVERAGE関数だけではもったいない。データの特徴を把握する2つの関数を追加してみよう。

<AVERAGE・GEOMEAN・MEDIAN関数>

Excelをつかってデータから合計値や件数。

それに平均値を算出してみる。

なんてことをするわけが、それだけでは、そのデータ全体がみえてこないので、簡単な関数をつかって、把握するための数値を算出してみましょう。


次のデータを用意しました。


説明用なのでデータ数は少ないですが、算出したいものを確認していきます。


E1には、平均値が算出されています。

オートSUMボタン内にもある、お馴染みの、AVERAGE関数をつかっています。

E1の数式は、

=AVERAGE(B2:B11)

算出結果は、「18」

だけど、何かおかしいですよね。


「18」ってみた感じで大きいですよね。


原因は、B9の「72」という値。

とびぬけていますね。

いわゆる「外れ値」ですね。このようにとびぬけた値があると、AVERAGE関数は、そのデータに引っ張られる特徴があります。


つまり、AVERAGE関数は、算数の世界で使用する「算術平均」だからです。


とびぬけたデータがあることを考慮すると、「幾何平均」を算出するといいわけですね。


幾何平均は、かけ離れた値の影響を受けにくい特性があります。


幾何平均を算出する関数は、GEOMEAN関数です。

E2の数式は、

=GEOMEAN(B2:B11)

算出結果は、13.21…と、外れ値の影響を受けてない印象の結果が算出できました。


AVERAGE関数だけをつかった資料よりも、GEOMEAN関数の結果も併記してあげると、いいですね。


次に、データ全体がだいたい同じ数値の幅ならばいいのですが、複数の塊で集まっていることもあります。


分布の偏りがあるかもしれません。


偏りがある場合には、平均値だけでは実際のデータとの印象に誤差が生じる恐れがありますので、「中央値」も算出したいところですね。


E3の数式は、

=MEDIAN(B2:B11)

MEDIAN関数をつかうことで、中央値を算出することができます。

中央値は、すべての値を昇順に並べて、ちょうど、真ん中にある値です。


単純に平均値を算出するとデータの偏りがみえてきませんが、中央値や幾何平均をつかうことで、分布の偏りがみえてきます。


あと、最頻値とかを算出ということも考えますが、データが極端に偏っている場合だとつかうのもいいかと思いますが、一般のデータでは、あまりつかわないように思われます。


ということで、オートSUMボタンにあるAVERAGE関数の平均だけではなく、幾何平均のGEOMEAN関数や、中央値のMEDIAN関数も合わせてつかってみると、よりデータを把握できます。

9/26/2021

Excel。いつもの資料にデータの特徴を把握する2つの関数を追加してみよう。【Data features】

Excel。いつもの資料にデータの特徴を把握する2つの関数を追加してみよう。

<AVERAGE・GEOMEAN・MEDIAN関数>

Excelをつかってデータから合計値や件数。

それに平均値を算出してみる。

なんてことをするわけが、それだけでは、そのデータ全体がみえてこないので、簡単な関数をつかって、把握するための数値を算出してみましょう。


次のデータを用意しました。


説明用なのでデータ数は少ないですが、算出したいものを確認していきます。


E1には、平均値が算出されています。


オートSUMボタン内にもある、お馴染みの、AVERAGE関数をつかっています。


E1の数式は、

=AVERAGE(B2:B11)

算出結果は、「18」


だけど、何かおかしいですよね。

「18」ってみた感じで大きいですよね。


原因は、B9の「72」という値。

とびぬけていますね。

いわゆる「外れ値」ですね。


このようにとびぬけた値があると、AVERAGE関数は、そのデータに引っ張られる特徴があります。


つまり、AVERAGE関数は、算数の世界で使用する「算術平均」だからです。


とびぬけたデータがあることを考慮すると、「幾何平均」を算出するといいわけですね。


幾何平均は、かけ離れた値の影響を受けにくい特性があります。


幾何平均を算出する関数は、GEOMEAN関数です。


E2の数式は、

=GEOMEAN(B2:B11)

算出結果は、13.21…と、外れ値の影響を受けてない印象の結果が算出できました。


AVERAGE関数だけをつかった資料よりも、GEOMEAN関数の結果も併記してあげると、いいですね。


次に、データ全体がだいたい同じ数値の幅ならばいいのですが、複数の塊で集まっていることもあります。

分布の偏りがあるかもしれません。

偏りがある場合には、平均値だけでは実際のデータとの印象に誤差が生じる恐れがありますので、「中央値」も算出したいところですね。


E3の数式は、

=MEDIAN(B2:B11)

MEDIAN関数をつかうことで、中央値を算出することができます。

中央値は、すべての値を昇順に並べて、ちょうど、真ん中にある値です。


単純に平均値を算出するとデータの偏りがみえてきませんが、中央値や幾何平均をつかうことで、分布の偏りがみえてきます。


あと、最頻値とかを算出ということも考えますが、データが極端に偏っている場合だとつかうのもいいかと思いますが、一般のデータでは、あまりつかわないように思われます。


ということで、オートSUMボタンにあるAVERAGE関数の平均だけではなく、幾何平均のGEOMEAN関数や、中央値のMEDIAN関数も合わせてつかってみると、よりデータを把握できます。

6/30/2021

Excel関数辞典 VOL.49。MEDIAN関数~MINIFS関数【dictionary】

Excel関数辞典 VOL.49。MEDIAN関数~MINIFS関数

<Excel関数>

今回は、MEDIAN関数~MINIFS関数までをご紹介しております。

MEDIAN関数

メディアン

中央値を算出します。

MEDIAN(数値1,[数値2]…)



MID関数

ミッド

文字列の任意の位置から文字を取り出す

MID(文字列,開始位置,文字数)



MIDB関数

ミッドビー

文字列の任意の位置から指定バイト数の文字を返す

MIDB(文字列,開始位置,バイト数)



MIN関数

ミニマム

最小値を算出します。

MIN(数値1,[数値2]…)



MINA関数

ミニマムエー

数値・文字列・論理値を含む最小値を算出します。

MINA(値1,[値2]…)



MINIFS関数

ミニマムイフズ(ミニマムイフエス)

条件により指定した範囲内の最小値を算出

MINIFS(最小範囲,条件範囲1,条件1,…)

8/08/2020

Excel。データはあるので、いつもの資料にプラスしたい値アレコレ【Add to material】

Excel。データはあるので、いつもの資料にプラスしたい値アレコレ

<TRIMMEAN・MEDIAN・MODE.SNGL&MODE.MULT関数>

データはあるけど、マンネリの資料に何かプラスしたいという話を耳にしたので、次の表を使って、こんな値を追加したらどうかなぁ~という紹介をしていきます。
 
ほぼ毎日の参加人数を管理しています。

最低限、合計・平均・最大値・最小値・データの件数は、算出したいところですね。

この5種類の計算は、オートSUMボタンにすべて準備されているので、簡単に算出できます。
 
E1の合計は、=SUM(B2:B128)
SUM関数で算出します。

E2の平均は、=AVERAGE(B2:B128)
AVERAGE関数ですね。

E3の最大値は、=MAX(B2:B128)
MAX関数で、最大値を算出できますね。
MIN関数で最小値でした。

E4の最小値は、=MIN(B2:B128)
件数ですが、検索対象が数値なので、数値の個数。

すなわちCOUNT関数で算出できました。
=COUNT(B2:B128)

これだけでは、データあるのにもったいないですね。

プラスする値ですが、平均に着目したいですね。

AVERAGE関数は、算術平均、または相加平均と呼ばれています。

平均は算出しやすいのですが、対象の数値に幅があると、適切な平均値でない場合があります。

いわゆる、「異常値」が含まれているとおかしな数値になってしまうわけです。

そこで、異常値を除外して平均を算出した値も表示したいところです。
この時に使う関数が、TRIMMEAN関数です。
 
H1につくった数式は、
=TRIMMEAN(B2:B128,0.1)
TRIMMEAN関数の引数は、配列=範囲選択と割合で構成されていますが、割合はほぼ0.1だと思います。

異常値の上位5%下位5%を除くといいといわれています。
この5%+5%で10%なので、割合は、0.1として算出します。

結果は、48.2087。
AVERAGE関数で算出した結果とは変わりましたね。

次に追加したいのは、中央値です。

データを昇順にしたときに、ちょうど中央にある値が中央値です。

Excelでは、MEDIAN関数で簡単に算出できます。
 
H2の数式は、
=MEDIAN(B2:B128)
結果が31。最大値が209なので、全体的に、小さい数値が多いイメージがしますね。

もう少し追加したいですね。

追加するのは、最頻値と呼ばれている数値です。

データの中で一番多く登場する数値のことですね。
数値がどのあたりに、「群れているか?」を確認することができます。

Excelでは、MODE.SNGL関数で算出することができるのですが、この関数、ちょっと問題があって、一位が複数ある場合、最初に見つけた数値だけを表示しちゃう。

複数ある場合、ほかの一位がわからないので、まず、最頻値の件数を算出するといいですね。
 
H4の数式は、
=COUNT(MODE.MULT(B2:B128))
MODE.MULT関数は、複数の最頻値を算出する関数です。

その数を知りたいので、COUNT関数とネストして算出します。

今回は、1種類しかないので、最頻値はMODE.SNGL関数をつかって算出したのが、H5で、結果が8。

オートSUMボタンの関数以外でも、少しプラスするだけで、データを深くみることができるようになりますので、機会がありましたら追加してみませんか?

8/22/2019

Excel Technique_BLOG Categoryに追加しました。2019/08/22

Excel Technique_BLOG Categoryに追加しました。

<目次サイト>

このBLOGの記事を、
カテゴリー分けにした【Excel Technique_BLOG Category】に追加しました。

Excel。平均値ってこれでいいのか?よくないんじゃない その1 平均値と中央値

平均値というのは、あくまでも、総和をその個数で割った数でしかないわけですね。そうしますと、ビジネスではこのまま、オートSUMボタンの平均を使う訳にはいかないケースというのが、あるわけですね。

<続きはこちら>
Excel。平均値ってこれでいいのか?よくないんじゃない その1 平均値と中央値
https://infoyandssblog.blogspot.com/2014/10/excel.html


Excel。平均値とゼロの関係。ゼロを含める?含めない?平均アレコレ その2 AVERAGE関数とAVERAGEIF関数


平均値というのは、総和を総個数で割ったものなので、ゼロも加えて、その個数も加えて総個数とした場合、確かにその平均値では、よろしくないケースがあります。そこで、今回は、ゼロを除いて平均値を算出する方法をご紹介します。

<続きはこちら>
Excel。平均値とゼロの関係。ゼロを含める?含めない?平均アレコレ その2 AVERAGE関数とAVERAGEIF関数
https://infoyandssblog.blogspot.com/2014/10/excel_19.html


Excel。平均値。今回は文字列をゼロとして計算したい。平均アレコレ その3 AVERAGEA関数

欠席などの文字がデータに入っているときに、ゼロとして認識したい時に使う、VERAGEA関数をご紹介しましょう。

<続きはこちら>
Excel。平均値。今回は文字列をゼロとして計算したい。平均アレコレ その3 AVERAGEA関数
https://infoyandssblog.blogspot.com/2014/10/excel3.html


Excel。一定の上限と下限の数値を除外して平均値を求める方法をご紹介 TRIMMEAN関数


上限10%と下限10%に該当するものを除外するとした場合、上限10%と下限10%を算出するだけでも大変ですよね。

<続きはこちら>
Excel。一定の上限と下限の数値を除外して平均値を求める方法をご紹介 TRIMMEAN関数
https://infoyandssblog.blogspot.com/2014/10/excel-trimmean.html

7/03/2019

Excel。簡単に資料にプラス。会議資料は平均値だけでいいの?【Average】

Excel。簡単に資料にプラス。会議資料は平均値だけでいいの?

<AVERAGE・MEDIAN・GEOMEAN・MODE.SNGL関数>

会議でお馴染みの数値で構成された様々な資料。多くの資料には、合計値や平均値を算出しています。
平均値が曲者と何度か書いていますが、平均値だけではダメだったということケースも多々あります。

そこで、簡単に資料にプラスするといいものがありますので、確認していきましょう。

アンケート結果の表を用意しました。

最初に、サンプルAとサンプルBの平均値を算出してみましょう。

G2には、
=AVERAGE(C2:C16)
という数式を作っています。H列にオートフィルを使って数式をコピーします。

平均値もしっかり算出することができたので、資料としてはこれで十分といえば十分なのですが、サンプルBのデータをみると、なんか納得いかないというか…

【数字が偏っている場合】

サンプルの数値が、分散しているのならば、平均値は意味を成すのかもしれませんが、サンプルBのように、二極化しているように、(分布が)偏っている場合、平均値と実際のデータとの間に、「感覚の差」が出てしまうことがあります。

サンプルBは、1の件数が結構あるのに、平均値が高いイメージが生じています。

このように、データが偏ていることも想定しないといけませんので、資料にプラスしたい計算式があります。

【データの真ん中にある数値=中央値】

単純にデータを昇順に並べて、その中間地点の数値を、中央値と呼びます。

使用する関数は、MEDIAN関数です。
G9の数式は、
=MEDIAN(C2:C16)
と入力するだけで、中央値が算出することができます。

オートフィルを使って数式をコピーすると、サンプルBは、5と算出されています。
平均値と比べるとサンプルAもBも違っていることが確認できます。

中央値はあくまでも、データの中心地点でしかありませんので、1と10だけのデータだと、1か10が中央値になってしまうので、中央値も万全ではありません。

【数値が離れている時の平均は、幾何平均】

サンプルBのように、数値が偏っている場合や、一部に突出したデータ(外れ値)がある場合には、AVERAGE関数で平均を算出するよりも、幾何平均のGEOMEAN関数を使う方がいい場合もあります。

幾何平均は、相乗平均とも呼ばれています。なお、AVERAGE関数は、算術平均です。

G4には、
=GEOMEAN(C2:C16)
という数式を設定します。
オートフィルを使って数式をコピーしてみましょう。

サンプルBは、3.26…とデータの感覚に近いようになってきました。
なので、算術平均のAVERAGE関数だけではなくて、幾何平均のGEOMEAN関数も併記して使用してあげると資料としてプラスすることができます。

ちなみに、もう一つExcel関数には、平均があって、調和平均のHARMEAN関数があります。速度の平均を算出する時に使う関数ですね。

【データの登場回数を知るには、MODE.SNGL関数】

平均値とは別で、データの中でどの数値が一番多いのかがわかれば、データの偏りがわかります。そこで、使用する関数が、MODE.SNGL関数です。

G5の数式は、
=MODE.SNGL(C2:C16)
と設定するだけで、簡単に算出できます。

サンプルAはデータ内で一番多いのが9で、サンプルBは1が一番多く登場していることがわかりました。

このように、平均値だけにとらわれずに、ちょっとしたデータをプラスしてみるといいかもしれませんね。

8/24/2018

Excel。事務職のデータ分析27。最初は数値データの全体像を把握しましょう。【Numeric data】

Excel。事務職のデータ分析27。最初は数値データの全体像を把握しましょう。

<MAX・MIN・AVERAGE・TRIMMEAN・MEDIAN・MODE.SNGL・COUNT・MODE.MULT>

色々な統計分析についての書籍があって読むけど、
最初に何をしたらいいのかが、よくわからないと耳にしますので、
あまりExcelを使っていないけど、どのような数値を会議資料として、
分析用の資料として用意すればいいのかを改めて、簡単に説明していきましょう。

【全体像の特徴を知る】

数値データではわからないので、
全体像の特徴をはあくすることから始めるといいですね。

簡単に算出できるものが多いので、重要性を感じないかもしれませんが、
大切な数値だったりします。

次のデータがあります。

単に数値が並んでいるだけですが、最小値と最高値を知るところから始めます。

当然、MAX関数とMIN関数を使うわけですが、
この2つの項目を知るだけでも、重要です。

日々の日報だったら、なぜこの日だけ売上高がよくないのか?
ということがわかるわけですよね。

改善点を見つけることに繋がるかもしれませんよね。

なので、単純であっても、重要です。

E1の最大値の数式は、
=MAX(B2:B26)
E2の最小値の数式は、
=MIN(B2:B26)

続いて、算出したのは、平均値です。

E4の平均値の数式は、
=AVERAGE(B2:B26)
この平均値ですが、ちょっと難しくいうと、
算術平均とか相加平均といったりします。

相加とは、すべての数値の合計をその数値の個数で除算したもののことですね。

ところが、おおむね平均値に数値があるわけではなく、
異常時というケースが含まれていることが多いので、
それを取り除いた平均値も算出したほうがいいわけですね。

例えば、急にブームになった食品とかがあって、
瞬間的にバカ売れしたりすると、平均値に影響を与えてしまうからです。

では、Excelで異常値を取り除いて算出する場合には、
TRIMMEAN関数を使います。

E5の数式は、
=TRIMMEAN(B2:B26,0.1)
割合を0.1=10%としましたが、
これは、上限0.05%・下限0.05%を意味しますので、注意が必要です。

平均値では、把握できないケースがあります。

そこで、全体の数値を並べてみて、
その中心の値を求める中央値というものを算出することも多くあります。

登場する関数は、MEDIAN関数です。

E7の数式は、
=MEDIAN(B2:B26)
金額が全体平均よりも小さいので、
販売金額は、安いほうに比重が大きいようですね。

【データ量が多くなると最頻値がほしくなる】

大量のデータから特徴を見つけ出すのに、
一番多く登場している数値を知ることができれば、
その数値に何かしらの理由。

すなわち購入しやすい価格なのか?などが見えてきます。

データの中で登場回数を算出するために使用する関数は、
MODE.SNGL関数です。

登場する回数が多い数値は、3200だそうですが、
よくみると、29600もデータが2つありますので、最頻値のはずですよね。

このMODE.SNGL関数。欠点があって、
データの最初に登場するほうを算出しちゃうのです。

これでは、会議の資料としては使えません。

そこで、同率一位が、いくつのあるのかを算出して、
該当する数値も算出するといいですよね。

では、同率一位がいくつあるのかを算出してきます。

E10の数式は、
=COUNT(MODE.MULT(B2:B26))

いくつのあるかということなので、COUNT関数。

そして、複数の最頻値を算出することができる、
MODE.MULT関数をネストすると算出することができます。

算出された結果は2なので、2件あるということがわかりました。

E11に、MODE.MULT関数ですが、
{}がついていますが、配列関数にしています。

そこで、この数式の作り方ですが、
最初に、E11:E12を範囲選択します。

先ほどの同率一位の数が5だったら、5つのセルを範囲選択します。

今回は、2と算出されたので、2つのセルを範囲選択しているわけです。

=MODE.MULT(B2:B26)

と入力したら、Enterキーを押さずに、
Ctrl+Shift+Enterキーで配列関数にして完成です。

これで、2つの最頻値を算出することができました。

まずは、このような数値を用意するだけでも
日ごろの資料がグレードアップします。

3/20/2017

Excel。MEDIAN。事務職のデータ分析その2。中央値と最頻値は大事なデータの一つです。

Excel。事務職のデータ分析その2。中央値と最頻値は大事なデータの一つです。

<AVERAGE関数・MEDIAN関数・MODE.SNGL関数>


様々な分析手法はわからなくても、一般職や事務職でも、
会議資料の一つとして、データ分析用の資料作りをすることもあるようです。

そこで、事務職のデータ分析と題して、ご紹介していきたいと思っております。

そして、今回は、【中央値と最頻値】について改めてご紹介していきます。

前回は、平均値を紹介しましたが、
平均値ではイマイチ状況とマッチしていないケースがあるのです。

次の表をご覧ください。

この顧客の年齢の平均をC23に算出してみます。

42と算出されました。
C23の数式は、
=AVERAGE(C3:C22)

算出させること自体には、問題はありませんね。

単なる、AVERAGE関数で算出しております。

しかしながら、この表の年齢を眺めると、結構年齢が高い人が多いように感じます。
平均値はあくまでも、総和をその総和した数で除算した結果なので、
例えば突出した数値があったりすると、その影響を受けて、
平均値が大幅に変動してしまうことがあります。

これでは、分析としてのデータとしては、偏ったデータになってしまいます。

そこで、全体の中央の値を算出する事によって、
違った角度からデータを見ることが出来るわけです。

平均値も中央値も統計量としての定義は異なるだけで、
統計として正しいとは言い切れませんが、
平均値だけでなく、中央値を示すほうが分析用の資料としてはいいと考えられます。

【中央値を算出してみよう】

それでは、C24に中央値を求めて行きます。

中央値を算出するには、MEDIAN関数を使います。

では、C24をクリックして、MEDIAN関数ダイアログボックスを表示しましょう。

数値1に、C3:C22と入力してOKボタンをクリックします。

C24には、45と算出されました。

なお、C24の数式は、
=MEDIAN(C3:C22)

算出自体は簡単なので、平均値だけじゃなくて、
中央値も資料によっては追記してあげるといいですね。

要するにデータの中央値が45ということで、
全体的に平均値の年齢よりも高い人が多いということがわかります。

【最頻値も求めてみよう】

そしてもう一つ数値を追加するとしたら、【最頻値】も算出するといいですね。
最頻値は、データ内で最も頻繁に登場する値のことになります。

最頻値を算出するもの簡単でして、MODE.SNGL関数を使って算出させます。

C25をクリックして、MODE.SNGL関数ダイアログボックスを表示しましょう。

数値1に、C3:C22と入力してOKボタンをクリックします。

C25には、64と算出されました。

64歳の方が多いので、中央値が平均値よりも高くなっていたことが見えてきますね。

C25の数式は、
=MODE.SNGL(C3:C22)

もし、同率1位がある場合は、登場がいちばん早い値を最頻値としております。

平均値だけではなくて、
中央値とあわせて最頻値も算出することによって、
データを色んな角度から見ることがしやすくなる資料を作ることが出来ますので、
中央値と最頻値を日頃の資料に取り入れてみてはいかがでしょうか?

10/15/2014

Excel。平均値ってこれでいいのか?よくないんじゃない その1 平均値と中央値


Excel。平均値ってこれでいいのか?よくないんじゃない 
その1

平均値と中央値


どんな講座でも必ず、オートSUMボタンをご紹介する中で、合計だけでなくて平均とか最大値、最小値なども合わせて紹介しますが、この中の平均に関して、これでもいいんですかね?とお話しするケースがありますので、ちょっとそのケースをご紹介しましょう。

そのケースというのは、下記の表をご覧になっていただけると、なるほど~と、気づくと思います。

黄色のケースの平均値は55です。
そして、
緑色のケースの平均値も55です。
そうなんで、両方とも平均値は55と同じなんですね。念のため、それぞれのC9とF9の数式を見てみましょう。
C9には、
=AVERAGE(C3:C8)
F9には、
=AVERAGE(F3:F8)
と、数式も間違っていませんが、これで同じ平均値というのは、なかなか納得がいきませんよね。
黄色の方は、見た目、30ぐらいが平均値のような感じがしますよね。
緑色の方は、平均値とそれぞれのデータも近いイメージですよね。

このように、平均値というのは、あくまでも、総和をその個数で割った数でしかないわけですね。そうしますと、ビジネスではこのまま、オートSUMボタンの平均を使う訳にはいかないケースというのが、あるわけですね。

そこで、どうしたらいいのかということで、今回は、中央値を使用することで解決してみたいと思います。その関数は、MEDIAN関数。
この関数を使うと中央値を算出することができるのです。
平均値は、AVERAGE関数ですね。
では、早速、黄色の方で、MEDIAN関数を使って、中央値を算出してみましょう。

C10をクリックして、fxボタンからMEDIAN関数のダイアログボックスを表示しましょう。

数値1には、内藤さんから上野さんまでの範囲、すなわち、C3:C8を入力します。
あとは、OKボタンをクリックしましょう。
すると、36となりましたね。

36の中央値の方が、平均値の55よりも、イメージに合致しますよね。
では、今度は、緑の方のF10も同じように算出させてみましょう。
まずは、fxボタンからMEDIAN関数のダイアログボックスを表示して、数値1の範囲はf3:f8ですね。

結果は、平均値と同じ中央値も55になりましたね。

このように、イレギュラーな数値が含まれている場合がありますので、オートSUMボタンの平均のAVERAGE関数で簡単に算出するのではなくて、中央値を算出するMEDIAN関数を使って算出してみることを併記したほうが、データによってはいい場合がありますので、このMEDIAN関数を覚えておくのもExcelのスキルアップの中では大切なのかもしれませんね。

5/17/2013

Excel。AVERAGE関数とMEDIAN関数


Excel。AVERAGE関数とMEDIAN関数

平均値と中央値?
平均を算出することは、結構あっても、
中央値を算出するというのはなかなかないようでして。
これ、意外と使っていない人が多いですね。

数字というのは、面白いもので、見た目のイメージで、いい悪いを判断しちゃうことが多い。

例えば、下記のような採点結果がある場合、
平均だと、62.14点になり、川崎さんと蒲田さん以外は平均値以下となる。
しかし、
川崎さんと蒲田さんを除いたら、おおむね50点が平均になるのでは?

12点も算出方法で異なる

そこで、登場するのが、中央値という考え方。
中央値を算出する関数=MEDIAN関数

MEDIAN関数をつかって算出してみると、50ポイント。

今回の英語のテストは50点が中心で、
川崎さんと蒲田さんは英語が得意なのか、高得点だったので、
イレギュラーなわけですね。

12点も違う訳です。これは、大きい。

仮に、平均より下は、追試なんてことになってら、5名が追試なわけですね。
けど、中央値という角度から見ると、鶴見さんと桜木さんが追試なわけですね。

まぁ、使用する用途によっては、中央値のほうがすぐれていることがあるわけです。

数字をただ、羅列した表というのは、そろそろ卒業して、
色んな角度からみて、推測と仮定を繰り返し、
分析していくというPowerが備わるといいですよね。
今後、ちょっと、覚えておくといい関数ですね。

そうそう、関数の見つけ方ですが、
関数ダイアログボックスで、中央値で検索すると早く見つかりますよ。
MEDIANって覚えにくい場合は、是非。

検索で、中央値と入力すると見つけやすいですよ。