大学教員がめっちゃ簡単に統計学をレクチャーするよ

私が担当していた中堅私大の文系学部1年配当「統計学」のレクチャーノートを元にして、めちゃくちゃ簡単に統計学を説明していきたいと思います。
過半数が高校で数学1Aしかやっておらず、数学に強い苦手意識を持っているような世界でした。
 

 

統計学
「役立つんだろうけどむずかしそう…」
そんな印象ですかね?
ところであなたは面倒くさがりやですか?
面倒くさがりやであれば、統計学を知らないのはもったいないです。
なぜなら統計学は、最高の省エネの学問だからです。めんどくさがりやに最適すぎなのです。

 

あー○○ってどれくらいの人がやってるんかな~調べたいな~
ってことないでしょうか。
「冬のボーナスってみんなどれくらいもらってるんかな~」
「こういうサービスってどれくらいの人がほしいと思ってるんかな~」
「この広告ってどのくらいの人が知ってるんかな~」
みたいなことです。

 

では調べてみましょう。
どうやって調べますか?
たとえば「日本人の平均所得」を知りたい場合、日本にいる人全員にアンケートを答えてもらわなければなりませんね。
……
めっっっっちゃめんどくさくない???
調査会社に死ぬほどお金払って、死ぬほど時間かけて死ぬほど準備して……
やりたくない……やりたくなさすぎる……無理です。
もっと楽に「全体」を知る方法を考えましょう。
「全体」を調べることなく「全体」を知る方法……
「全体」からランダムにいくつか選んで調べて、その情報をもとに「全体」を推測する。
これでどうでしょう?
いけそうな感じしませんか? まぁこれでいくんですけど。
この「ランダムに選んだいくつか」のことを「標本」と呼びます。
この「標本」を使って「全体」を調べる方法を「標本調査」といいます。
いくつか標本を取るだけでいいので、全体を調べる必要はありません!素敵だ!

 

最初に紹介した、想像だけで死んでしまうようなやり方を「全数調査」と言います。全部を調査するので全数調査、そのままです。
小中学生の身体測定は全数調査です。
5年に一度の国勢調査も全数調査です(なので調査員があれほどしつこく訪問してくるのです)。*1
全数調査するのではなく、「標本調査」で「全体」を知ろうとする省エネ発想。これが統計学の第一歩です。

よく紹介されてる、立川志の輔さんの落語のマクラの例があります。

「開票率5%で当確が出るのはおかしい」と数学者・秋山仁さんに話したら
「あなたね、味噌汁作って味見するのに丼鉢でグーッと飲む?」
「……小皿ですよね」
「それが5%よ」

というやつ。*2

味噌汁を全部飲むのが「全数調査」。
小皿(=標本)の情報から全体の様子を推測するのが「標本調査」です。

 

さて、手に入れた「標本」は、好き放題調べ倒すことができます。
例えば「30代男性の平均所得が知りたい」と思って1000人の30代男性にアンケートを取った場合、このアンケート調査の実際の回答1000枚が「標本」です。でも本当に知りたい「全体」は30代男性全員です。
この標本の情報から「全体」を推測するときに使うのが統計学のテクニックです。具体的にどんな「推測」をするかによって、使うテクニックが変わってきます。具体的には今後説明します。

標本のポイントは、ランダムに選ばれていることです。
ランダムに選ばれていないと、正しく全体を推測することができません。
たとえばある博物館が次の企画展の入場料をいくらにするかで悩んでいて、来場者の許容価格を知りたいと思ったとします。
それでは今日から始まった企画展でアンケートをとることにしましょう。
このとき、来た順番に10人アンケートに答えてもらって、その結果から「全体」を推測する……これでいいでしょうか?
あまりよくなさそうですよね。その理由は、この「標本」が偏っているからです。
初日に来るお客さんは熱意があるので、たくさんお金を払ってもよいと思っているかもしれません。朝一に来る人は年齢が高く、たくさんお金を持っているかもしれません。

ランダムに選んでいない標本を使っていては、正しく全体を推測することができません。手がかりが間違っていたら、正しい犯人を推理できないのと同じです。

 

ところでずっと「全体」と書いてきましたが、統計学ではこれを「母集団」と呼びます。
私たちが本当に興味があるのは、母集団の情報です。
アンケート調査を自分でやり出すと、目の前にある「回答」(=標本)がすごく大事なものに思えて、その後ろにある「母集団」のことを忘れてしまいがちです。
私たちが知りたいのは母集団のようすです。標本はそのための手がかりであり、標本それ自体の様子には興味はありません。
これは統計学の根底にある考え方なので、常に意識しておいてください。
学習が進んでも統計学をいまいち理解できていない人は、これをわかっていない印象があります。
興味があるのは母集団のようす!!標本は手がかり!!

 

というわけで、今日の話は「標本調査」でした。

 

*1:この例からわかるように、全数調査が必要な場面・全数調査でなければならない場面は勿論あります。

*2:原典を見つけられなかったので、ご存知の方いたら出典を教えてほしいです