FO
コロナウイルスの流行が本格化しはじめたころに、緊急事態宣言を出すべきかを問う世論調査が行われました。ネットで公開されたところでは宣言を出すべきだと答えた人が80%にも達したとのことです。集団催眠を疑わせる80%という見事な数値と、社民党までもが賛成に回ってしまったインフル特措法を並べると、私は背筋が凍りつくほどの危険を感じました。
最大の危険は、80%の人々が自分とは異なる陣営に属していることから自分があきらめムードになることです。これにはとりあえず自戒で対応します。
次の危険は80%という数値の正確さです。統計数値が不正確になる要因はたくさんありますが、まず問題となるのが調査対象の選び方です。このTBS/JNNの調査では表示されていません。「宣言を出すべき」と答えそうな層をうまく選んで質問すれば、80%でも99%でも自由な数字を得られます。
自由な数字を作るための調査ではなく、本当に世論なるものを調べたいのであれば、やはり調査対象を、正しい意味でうまく選ぶ必要があります。もし世論の持ち主である1億人以上の人を全数調査できるのなら調査対象を選ぶ必要などなくて話は簡単です。でも大規模調査はいろいろな要因で非常に困難なためサンプリング調査が普通です。つまりごく少数の、たとえば数百人を選び出してその人たちに答えてもらい、数百人から集まった答えをもとに1億人による答えを想像するという手法です。このときに数百人をどうやって選ぶのかが大問題です。先の世論調査ではサンプリング手段が隠蔽されていました。
サンプルの選び方やその他の要素によって、1億人の答えを想像した時のハズレ度合いが違います。しかしハズレ度合いは普通は例えば「プラスマイナス3パーセンテージポイント」といった数値で表されます。先の世論調査ではこれも隠蔽されていました。
ハズレ度合いをひどくする要因のひとつに、質問の方法があります。「賛成ですか」と尋ねるのと「どうお感じですか」と尋ねるのでは答えが変わります。「どう感じるか」への回答を調査員が判断して賛成や反対に分類すること自体は正当ですが、数字を見る上では注意が必要です。
他にもこの世論調査の不備はいくつかありますが、ここではあと一つだけ指摘します。
緊急事態宣言への質問で、現政権によるそのような宣言の危険性を説明しただろうか、説明しないとしたら回答者が危険性を認識している程度を問う質問が調査に含まれていただろうか。私の予想ではどちらもノーです。回答者が危険性を認識しないように「何らかの形の緊急事態宣言のようなものが必要だと思われますか」といった設問なら安易に「どちらかといえばそう思う」と答える人はかなり多いことでしょう。「そう思う」と「どちらかといえば」を足してしまう手法はよく見られます。もっと賢い手口をいろいろ活用して統計調査では望みの数値を作れるのです。
信頼区間
数百人のサンプルから1億人の世論を予想するときのハズレ具合を表す数字は、海外メディアではよく見られるのに、日本での調査ではなぜかほとんど公表されません。
アメリカの大統領選挙などで支持率が近接している時にはハズレ具合の数値がとても重要です。例えば2人の候補者への支持率がそれぞれ43%と41%だったとき、サンプリング誤差が±3ポイントだったら「ほとんど互角で、43%の候補の支持がわずかに多いかな」と見るべきです。もし誤差が±1ポイントだったら、43%の候補が確実に有利」といえます。
(投票行動や選挙制度のために、支持が確実に多数であっても当選が確実とは言えません。これはまったく別の課題です。)
ところで、サンプリング誤差はどうやったらわかるのでしょうか。
もっとも安全なサンプリングは無作為抽出(ランダム)です。ランダムなので、サイコロを振るときのように計算を進めることができます。ここからはサイコロを想像しながら考えていきます。
サイコロを振って1の目が出る確率は1/6です。この数字を疑ってみるのはとてもよいことですが、ここではとりあえず1/6を受け入れましょう。
確率とは「起こりやすさ」の程度を数値化したものです。そう言われてもまるで意味がわかりません。でも、もしサイコロを6000回も振ったらそのうち1000回ぐらいは1の目が出るだろう、という想像ならできます。6万回振れば1万回ぐらいかな、6億回振れば1億回ぐらいかな、それを頭の中で想像したうえで、確率は1/6という数値を納得することにします。
ところで、サイコロを6億回振ったときにどのくらい手が痛くなるか気になって仕方がないというあなたは科学者の素質があります。
さて、手が痛くならないように6回だけ振ったら、そのうち1回ぐらいは1の目が出るのでしょうか。直感的には「ビミョーだな」ぐらいしか言えないのではないでしょうか。ここで無理やり視点を変えてみると、6回全部が1の目になる確率が1/46656もあります。ゼロよりもはるかに大きい。決して想定外ではありえませんね。「6回振る」ことを1セットと数えて47億セットほど繰り返せばストレート・ワンに10万回以上もお目にかかれるはずです。
6回では「ビミョー」でしたが、もっと極端に1回だけ振ったら「1/6回ぐらい」は1の目が出るでしょうか。「1/6回」などというモノは地球上にありえない、などと拒否らずに「1回振る」を1セットと数えて600セットも実験すれば、そのうち100セット「ぐらい」は1の目に会えるような気がしませんか。
ここまでの話では1度も実物のサイコロを振らず、完全に想像の世界でした。想像の世界で作り上げた確率という製品も、正しく使いさえすれば人間の役に立ちます。また間違って使えば騙されてしまいます。騙されやすい例をひとつ。「1/6回ぐらい」という代わりなのか「6回に1回」という表現があります。確率であればどちらも同じようなことを言っているのですが、確率以外の話であれば前者は地球上にありえない話でナンセンス、後者は順序を述べているのでまったくの別物です。
危険率
サイコロの確率を納得していただいた上で、確率の確率を考えていきます。どちらも確率では紛らわしいので、2番めの方はその使い道から危険率と呼ぶことにしましょう。予想がハズレるなど、ヤバいことが起きる確率の計算を考えます。
1の目が出る確率は1/6でしたが、サイコロを6回振って1の目が1回だけ出る確率は0.4程度です。6回を1セットとして100セットを実行すると、1の目が1回だけ出るのは40セットほどしかありません。あとの60セットほどは1の目が0回だったり2回だったり3回だったり…なのです。6回の1セットだけ振った結果からは、1/6ではないという間違った「確率」が導かれてしまう危険率が60%もあることになります。100セットの実験で600回もサイコロを振ったのに6割が間違った答えだったとは、なんたることでしょう!
1セットが6回では足りないかもしれないので思い切って1セットを6000回にしてみましょうか。残念なことに1セット6000回のうち1の目がちょうど1000回出る確率はさらに下がって1%ほどになってしまいます。危険率(間違い率)が99%ではとても使い物になりません。
そこで、どんぴしゃの正確な確率(1/6)はあきらめて、近ければいいことにしたらどうでしょうか。大らかに1割ぐらい違ってもいいことにして、1の目が出る回数が6000のうち900回から1100回ならば正解と認めることにします。そうすると「正解」になる確率は0.95ほどになり、この範囲からハズレる危険率は5%ぐらいになります。これは、ほとんどの場合にだいたい正しい数値になり、まったくのウソとなる割合は5%しかないということです。危険率が5%ではひどい、0.5%にするべきだという意見もありますが、ハズレる危険率として5%はよく使われる値です。
世論調査で1億人の全数調査はまずありえないのでサンプリング調査のはずです。「○○党の支持率は30%だった」などと言われるとき、たまたまそのサンプルでは30%だっただけで、1億人の実態はその数字から少しハズレている可能性を思い出すべきです。もし「危険率5%で支持率は27%から33%である」などと表示されていればその数字(の範囲)を信用できる度合いが大きい。この例で27%から33%の範囲を95%信頼区間といいます。海外の世論調査ではこのような範囲を30%±3ポイントと表示しているのを見かけますが、残念なことにそこでも危険率はほとんど書かれていません。
支持率と確率は別物ですが、数字の利用方法は似ています。
ここでの信頼区間の説明は雰囲気を重視したので、実はまやかしが含まれています。騙されたと感じた方はぜひまじめな情報源で調べてみてください。嘘をピンポイントできた方はぜひそれを教えてください。どちらでもない方は漢字4文字だけでも覚えてくだされば人類の未来がずっと明るくなるでしょう。