アンケート再入門 
「第24回(第1部最終回)データ解析を軽ーく」

この連載も気がつけばはや24回目。月2回ペースでメルマガを配信しておりますので、かれこれ1年間連載してきたことになります。

私の場当たり的で計画性のない構想によると、この後、データ解析の一環として、「相関関係」「回帰分析」へと突き進んでいく予定でしたが、皆様から「話が長い」「だんだん難しくなってきた」とお叱りを受けることもしばしばありまして、この辺で、軽ーく目先を変えてみようとかと思います。

というわけで、今回は、突然ですが第1部(再入門編)の最終回とさせていただき、次回からは「第2部 実践編」に突入しようと思います!(なんだ、実践編って?)

で、最終回は、上にあげたキーワードを軽ーく、一瞥する程度に流したいと思います。

「相関関係」とは、統計データなどで、Aの数値が変化すると、Bの数値も変化するような関係が明らかに見られるようなものを言います。
例えば、時給の高い人は、年収も多い(←当たり前ですね)、気温が上がるとビールの販売量が増加する、などといった関係です。

相関関係には、Aが上がれば、Bも上がるというプラスの相関関係と、Aが上がるに従って、Bは下がるというマイナスの相関関係もあります。2つの数値をグラフにした時に、直線的に上がるか、直線的に下がるものを、2つの要素間になんらの相関関係があると言います。

ちなみに、年収850万を超えると、急に外車のオーナーが増えるとか、年収2500万を超えるとフェラーリのオーナーが増えるとか、そういうのは、相関関係とはいいません。

また、米国がくしゃみをすると、日本が風邪をひくという、景気の話なども、諸々の事例から、なんらかの「因果関係」がある言えば、確かにあると思いますが、こうしたことも、因果関係であっても、相関関係とは言いません。

「回帰分析」というのは、午後18時の気温が30度だった場合に、過去のデータから生ビールが何リットル売れるか、ということを「予測」するものです。

もちろん、気温のほかに、曜日や天候、お店の冷房の設定温度、生ビール以外の飲料メニューの品揃え、地域のイベントの有無など、様々な要素によって生ビールの売り上げは影響されますから、あくまでも、気温以外の条件が、同じだと仮定した場合の予測になります。

ちなみに気温以外の複数要素を加えて分析するのを「重回帰分析」と言います。
「多変量解析」なんて用語を使うこともあります。

分析する要素が増えれば、より正確な分析ができそうな感じがしますが、一概にそうとも言えません。曜日や天候は、直線的なグラフにはならないでしょうし、そうした要素を掛け合わせても、かえって不正確なデータになることもあるわけです。

この連載で対象としている、「とりあえずアンケートをやってみよう」という段階では、データ量も少ないでしょうから、なんらかの因果関係がありそうだ、AとBではどうやらプラスの相関関係があるようだ、という関係が見えてくるだけでも充分です。アンケートを実施した甲斐があったというべきでしょう。

一方、回帰分析の方は、アンケートというよりも、POSデータなどのデータを解析していく際に強い味方になってくれると思います。予測データに基づき、例えば、商品・原材料の理詰めの在庫調整が可能になれば、余剰在庫の圧縮や欠品による販売機会の損失などが最小限に抑えることが出来、利益の増大が期待できます。そうしたデータを扱う機会があったら、是非チャレンジしてみてください。

さて、最終回はここまでです。ここから先は、次回からはじまる第2部 実践編の前振りになります。

実践編では、アンケートを実際にやってみながら、その結果をこのメルマガの中でご報告しつつ、データの見方、考え方について、検討していきたいと思います。

というわけで、早速ですが、皆さま、下記のアンケートにご協力をお願い致します!(※個人情報の入力項目はありませんので、ご安心を。)

「第1回お題目『SNSのご利用状況に関するお伺い』」
http://enqmaker.jp/member/?id=67968568
(受付期間:本日より、2012年9月13日(木)23:59まで)

この連載、皆さまのアンケートが命です。ご協力のほど、よろしくお願い致します!

(by インディーロム 渡邉修也)