アンケート再入門
「第13回 閑話休題 ~平均の話し(後編)」
前回は、“平均”というものを考える際に、「外れ値」についても考慮しなければならないということを書きました。
例として挙げたのは、下記のような7人の年収データでしたね。今回も、このデータを使って話しを進めてまいります。
Aさん 550万
Bさん 700万
Cさん 185万
Dさん 280万
Eさん 590万
Fさん 510万
Gさん 2,645万
7人の年収の「平均値」は780万円でず。
さて、例えば、あなたが政治家や官僚だとして、この平均780万円という年収額を“最大公約数”として、政策を考えていってもよいでしょうか?
どうですか、皆さん。
平均値が780万円というのは事実なのですが、しかし、それを最大公約数”とした政策では、国民の理解、納得は得られないような気がしますねぇ~。
ものごとを考える時に、その集団の“代表値”をどこ設定すべきか、まずは、よく検討する必要があります。
統計でよく使われる“代表値”には、「平均値」「メディアン(分位点)」「モード(最頻値)」という3つがあります。
「メディアン」というのは、データを値の小さなものから、大きなものへ並べ直した時の、真ん中の値のことです。
7名のデータを、金額順に並べ直してみます。
1 Cさん 185万
2 Dさん 280万
3 Fさん 510万
4 Aさん 550万 ←ここが真ん中
5 Eさん 590万
6 Bさん 700万
7 Gさん 2,645万
この場合は、7人の中で真中は4番目のAさんなので、メディアンは550万円ということになります。
では、「モード(最頻値)」とはどんなものかというと、年収を何段階かの階級に分けたときに、その階級に何人いるかということです。
100万円以下 0人
101万~200万円 1人
201万~300万円 1人
301万~400万円 0人
401万~500万円 0人
501万~600万円 3人 ←ここが多い
601万~700万円 1人
701万~800万円 0人
・・・(中略)・・・
2,601万以上 1人
ということになり、「501万~600万円」という階級に含まれる(属する)人が最も多いことが分かります。モードの値は、最も多い階級の下限(501万円)と上限(600万円)の平均、つまり(501万円+600万円)÷ 2 ≒ 551万円ということになります。
いかがですか?
「平均値 780万円」「メディアン 550万円」「モード 551万円」のうち、どの値が、この7人の集団の年収を“代表”するのに相応しいと思われるでしょうか。
上記の例は、極端な外れ値を含むものなので、メディアンかモードのどちらかを採用することになると思います。
このような極端な例は、現実では少ないと思われるかもしれませんが、格差社会になればなるほど、外れ値の度合いは大きくなってくるわけで、決して笑い
話ではございません。
マスコミの報道などで、“平均”という言葉出てきた時は、外れ値や格差のことを意識しながら、情報を読みとるようにしたいものですね。
いずれにしても、アンケートなどで集計・分析を行う際には、平均値だけでなく、メディアン、モードも併せて確認し、その集団の“代表値”をどこに見定めるべきか、よく検討する必要があるということだけ覚えておいてください。
次回は、元々の話に戻り、アンケートの設問の組み立てについて検討していきたいと思います。
<“アンケートメーカー”ご案内サイト>
http://enqmaker.jp/
(by インディーロム 渡邉修也)