アンケート再入門 
「第13回 閑話休題 ~平均の話し(後編)」

前回は、“平均”というものを考える際に、「外れ値」についても考慮しなければならないということを書きました。

例として挙げたのは、下記のような7人の年収データでしたね。今回も、このデータを使って話しを進めてまいります。

Aさん   550万
Bさん   700万
Cさん   185万
Dさん   280万
Eさん   590万
Fさん   510万
Gさん  2,645万

7人の年収の「平均値」は780万円でず。

さて、例えば、あなたが政治家や官僚だとして、この平均780万円という年収額を“最大公約数”として、政策を考えていってもよいでしょうか?

どうですか、皆さん。
平均値が780万円というのは事実なのですが、しかし、それを最大公約数”とした政策では、国民の理解、納得は得られないような気がしますねぇ~。

ものごとを考える時に、その集団の“代表値”をどこ設定すべきか、まずは、よく検討する必要があります。

統計でよく使われる“代表値”には、「平均値」「メディアン(分位点)」「モード(最頻値)」という3つがあります。

「メディアン」というのは、データを値の小さなものから、大きなものへ並べ直した時の、真ん中の値のことです。

7名のデータを、金額順に並べ直してみます。

1 Cさん   185万
2 Dさん   280万
3 Fさん   510万
4 Aさん   550万 ←ここが真ん中
5 Eさん   590万
6 Bさん   700万
7 Gさん  2,645万

この場合は、7人の中で真中は4番目のAさんなので、メディアンは550万円ということになります。

では、「モード(最頻値)」とはどんなものかというと、年収を何段階かの階級に分けたときに、その階級に何人いるかということです。

100万円以下    0人
101万~200万円  1人
201万~300万円  1人
301万~400万円  0人
401万~500万円  0人
501万~600万円  3人 ←ここが多い
601万~700万円  1人
701万~800万円  0人
・・・(中略)・・・
2,601万以上    1人

ということになり、「501万~600万円」という階級に含まれる(属する)人が最も多いことが分かります。モードの値は、最も多い階級の下限(501万円)と上限(600万円)の平均、つまり(501万円+600万円)÷ 2 ≒ 551万円ということになります。

いかがですか?
「平均値 780万円」「メディアン 550万円」「モード 551万円」のうち、どの値が、この7人の集団の年収を“代表”するのに相応しいと思われるでしょうか。

上記の例は、極端な外れ値を含むものなので、メディアンかモードのどちらかを採用することになると思います。

このような極端な例は、現実では少ないと思われるかもしれませんが、格差社会になればなるほど、外れ値の度合いは大きくなってくるわけで、決して笑い 話ではございません。
マスコミの報道などで、“平均”という言葉出てきた時は、外れ値や格差のことを意識しながら、情報を読みとるようにしたいものですね。

いずれにしても、アンケートなどで集計・分析を行う際には、平均値だけでなく、メディアン、モードも併せて確認し、その集団の“代表値”をどこに見定めるべきか、よく検討する必要があるということだけ覚えておいてください。

次回は、元々の話に戻り、アンケートの設問の組み立てについて検討していきたいと思います。

<“アンケートメーカー”ご案内サイト>
http://enqmaker.jp/

(by インディーロム 渡邉修也)