アンケート再入門
「第12回 閑話休題 ~平均の話し(前編)」
今回は「アンケートの本問」について考察する予定でしたが、予定を変更し、“平均”について、おさらいしてみたいと思います。
先日、日本数学会から「大学数学基本調査」の結果が発表されました。
その中で「大学生の24%が平均について正しく理解していない」という驚くべきというか、なさけない実態が明らかになり、皆さんもびっくりされたことと思います。
“平均”というのは、アンケート結果を集計・分析していく際に、最も基本となる分析手法です。
「大学数学基本調査」では、「生徒100人の平均身長が163.5センチ」から分かることについて、「○」「×」を付けるという問題で、次のような誤答が多かったそうです。
「平均値付近の生徒数が最も多い」
「平均身長より高い生徒と低い生徒は同数」
どうですか、皆さん、分かりますか?
答えは、両方とも「×」です。
これは、学生たちが、平均を正しく理解していないということもありますが、統計的な視点を持っていない(=学んでいない)ということだと思われます。
おおよそ、統計の教科書の第1章におかれているのは、“外れ値”の問題と、“代表値”をどのように決定すべきかということです。
まずは、外れ値の例を見てみましょう。
例えば、次のような7人の年収データがあったとします。
Aさん 550万
Bさん 700万
Cさん 185万
Dさん 280万
Eさん 590万
Fさん 510万
Gさん 2,645万
上記の7人の年収の平均値(この場合は算術平均)は、780万円となります。
すでに、皆さんお気づきの通り、Gさんの年収が頭抜けて高いことが、全体の平均値を押し上げています。
統計では、このような、他よりも突出した数値を「外れ値」と呼んでいます。
外れ値が大きい場合に、平均値が、実態からどんどん離れていくであろうことは、容易に想像できると思います。
学生たちの脳裏に、この「外れ値」のことが少しでもかすめていたら、「平均値付近の生徒数が最も多い」「平均身長より高い生徒と低い生徒は同数」とは、必ずしもそうとはいえないと気づき、誤答することもなかったはずです。
余談になりますが、よく日本の国民の平均貯蓄額というものが、新聞などで発表され、「ええっ、皆、こんなに持ってるの?」と驚かされることがあります。
世の中には、少数ながら、桁違いに大きな資産を持っている人もいるわけで、そうした人たちが、全体の平均を引き上げているだけの話なわけです。
皆が皆、平均値に近い預金を保有しているわけではないということです。
次回は、「平均の話し(後編)」として、統計において、平均値と並んで“代表値”として利用されることの多い、「メディアン(分位点)」と「モード(最頻値)」について紹介したいと思います。
<“アンケートメーカー”ご案内サイト>
http://enqmaker.jp/
(by インディーロム 渡邉修也)