統計モデルの画面

測れない数値を測る

世論調査の統計的モデリング

政党支持率を探る世論調査は、何を食べたいかを客に尋ねる食堂の店主に似ている。売り上げならば前日の伝票を見ればわかる。知りたいのは明日の注文だ。聞かれた方も「いつもの」と即答できる人もいれば、同じメニューを毎日にらむ人もいる。明日の注文、つまり、次の選挙の得票率はどのように予測すればよいのだろうか。

報道機関が世論調査で調べている政党支持率は、無作為に選んだ有権者に「支持している政党はどれですか」と尋ねた結果をそのまま集計したものだ。当人の望むと望まざるに関わらずすべての有権者を同じ確率で選ぶという、いささか乱暴な手法を使っているのは、その方法でしか偏り(バイアス)のないデータが得られないからだ。その新聞の購読者やテレビ局の視聴者でない人をも巻き込む性質から、調査結果は公開されている。

政党支持率は、選挙の予測得票率ではない。自民党の支持率は選挙で一度もとったことがない高い水準を維持しているし、公明党や共産党は常に実際の得票率の半分程度しか示さない。そもそも、回答の4割を占める「わからない」という選択肢は選挙にはない。

とはいえ、調査の質問リストの上座に指定席を与えられている政党支持率が、選挙を念頭に置いていないという建て前はだれも信じないだろう。「もし今日が投票日だとしたら、どの党に投票しますか」と直截に尋ねる新聞もあるし、「わからない」と答えた人に「あえてどれかを選ぶとしたら」と重ね聞きする新聞もある。本音を隠し切れないのだ。

建て前を捨てて、選挙の予測をしているのだと開き直ることもできない。高い費用のかかる無作為抽出によってやっと得られたデータに、その努力を無にしてしまうほどの強力な補正をかけないと、もっともらしい結果が得られないからだ。

だれもが知りたい、選挙の予測としての政党支持率(予測得票率)を求めるにはどうしたらいいのだろうか。欧米のメディアが採用しているのが、統計的モデリングと呼ばれる手法だ。

統計的モデリングとは

統計的モデリングとは、確率的な現象を表現する数学的なモデルを想定し、すでに知られている情報や構造をそこに組み入れることを通じて、推定を洗練させる手法だ。

例えば、双六すごろくでサイコロを3回振った後、どのコマに進んでいるかを推定するとしよう。中学の数学で出合う問題だ。1から6までのサイコロの目を3回分、すべての組み合わせを数えあげれば、推定値の分布(散らばり)が分かる。3回とも1が出た場合が最小の3で、最大は18。下図のように、10、11コマ目に進んでいる確率が最も高いことになる。

ところが、この参加者がその後、5回目のサイコロで25コマ目のゴールに届き、「上がり」になっていたことを知ったとすると、話は変わってくる。一番高い確率だった10、11コマ目にいたとすると、残り2回のサイコロでは25に届かない。すべての組み合わせを計算し直すと、3回目を振った時点で15、16コマ目にいた確率が最も高いことになる。新しい情報が推定値の分布を変えたのだ。

別の例として、レーダーで飛行物体の位置を測定し、5つのデータを得たとしよう。測定に誤差はつきものだから、飛行物体の位置は、下図のように、測定値を中心としたぼんやりとした丸い領域にあると考えるのが自然だ。

ところが、この5つのデータが同じ人工衛星を捉えたものだったと判明したとすると、同様に話が変わる。各点の測定誤差はお互い無関係に生じたはずだが、真っ直ぐな軌道を描くという制約を満たすように、狭い範囲に収束する。この場合も、新情報が推定値の分布を修正したことになる。現実の問題はもっと複雑だが、統計的モデリングはコンピューターの力を借りて推定問題を解く。

従来の世論調査は、無作為で選んだデータを集めれば集めるほど「真の値」に近づくことができるという、素朴だが基本的な理論に基づいて実施されてきた。測定データさえ多ければ、レーダーの影が直線飛行していることは自ずと分かる。統計的モデリングは、答えを見ながら問題を解いているように思われ、あまり利用されなかった。

そのような古き良き時代は終わりに近づいている。

オートコールの洪水

日常の出来事を短い文章で投稿するネットサービス、ツイッターで「世論調査の電話が来た」という趣旨の投稿を数え上げると、報道機関の世論調査がさまざまな「電話調査の洪水」に埋もれている様子がわかる。

2021年4-5月のデータを見る限り、人々が世論調査を受けたと認識している頻度と、新聞・テレビの世論調査が行われた日程にはほとんど関連がない。

主要な報道機関の世論調査は、媒体名を名乗り、調査員が口頭で質問を説明する形式だが、投稿の文面から分かる調査形式の大半は、コンピューターを使ったオートコール(自動応答電話調査)によるものだ。その質問内容から、政党や候補者による調査(特定の政党・候補を強調し、宣伝を兼ねているもの)や、世論調査をかたった個人情報収集(番号非通知で、電話の契約会社や郵便番号を尋ねるもの)だと思われる。

報道機関の調査規模は1社あたり二千件前後なので、投稿数から単純推計すると、毎日数万から数十万件のオートコール調査が行われていることになる。報道機関はそのような環境で調査対象の有権者にたどりつかなければならない。

日本のマスメディアに本格的な世論調査が導入された75年前、回答率は9割を超えるほど高かった。戦時総動員体制の余韻と民主化への高い期待が混じりあって、訪問した調査員にはお茶が出たと言われている。現在、電話調査の回答率は4割から6割と報告されているが、この数値は「電話がつながったうち回答を得られた比率」で、現実にはもっと低い。欧米では1件の回答を得るために100件の電話をかける必要があると報告されている。もはや素朴な手法は使えなくなったのだ。

世論調査の合成

統計的モデリングを世論調査に応用した例で広く知られているのは、世論調査の合成だ。

モデルの中に、もしその瞬間に選挙が行われたら実現するであろう得票率(潜在得票率)を想定し、これと密接な関係がある参考データとして世論調査の支持率を参照する。質問の言葉使いや形式が異なる世論調査の結果が一致しないのは当然だと認めるのだ。

潜在得票率は調査担当者がモデルの中に作り上げた幻影にすぎないが、選挙の当日だけ、現実の得票率として姿を表す。この情報が推定値の分布を修正することになる。

この手法を使って最近の自民党の潜在得票率を計算すると、以下のようになる。

この計算によれば、消費税の増税は潜在得票率に全く影響を与えていないこと、コロナ禍の影響がじわじわと進行し、もし2020年夏に解散総選挙を行っていたら、自民党は議席数を維持できなかったであろうことが分かる。

潜在得票率を一度受け入れてしまえば、逆に世論調査の方を分析することも可能だ。潜在得票率を基準にして、世論調査との差を「バイアス」とみなすと、各社の世論調査の傾向が分かる。なお、中日新聞は共同通信世論調査に参加している。

このバイアスの値は精度を表すものではない。しかし、微妙に異なる調査形式の相対的な影響が数値化されている。

支持政党で違う回答率

選挙運動を取材したことがある記者なら、誰もが気づくことがある。演説会に参加した人に話を聞こうとして断られる比率が政党によってはっきり違う。

世論調査に回答する人の比率も、政党によって異なる傾向があるという統計モデルを使って、主な政党の潜在得票率を同時に計算すると、以下のようになる。

この計算によれば、自民党支持の振幅ははるかに大きく、菅内閣発足時には50%に近かったことになる。

また、野党支持者の回答比率の推計値が、自民党支持者の半分から4分の1程度と非常に低いこともわかる。自民党以外の支持を率直に公言できないという意味で、日本の政治風土はアメリカよりも中国に近い。

統計的モデリングで使われる仮想的な数値は、いまや専門家だけが使う特殊な道具ではない。新型コロナウイルスの拡大の兆しを察知するために使われる実効再生産数Rt(1人の感染者が平均何人を感染させるかを示す値)も、モデルの中だけに存在する数値だ。直接測定できる数値ではないが、コロナ対策の重要な羅針盤になっている。

ただ、モデル次第で推計値が大きく変動するこの手法は、調査担当者の『数式をまとった思い込み』ともいえ、選挙報道に相応しいかどうかは議論が分かれるだろう。

これからの世論調査

欧米のメディアや世論調査機関で最近採用されている手法が、MRP(マルチレベル回帰事後層化シミュレーション)と呼ばれる統計的モデリングだ。

このモデルでは、全国の有権者を性別、年齢、学歴、職業、選挙区別に数千から十数万のグループに分け、それぞれの投票確率を推定する。その後、国勢調査のデータなどを使って、選挙区に各グループの有権者が何人いるかを計算し、大規模なコンピューターシミュレーションを行う。

このモデルの革新性は、性別や年齢の影響が足し算で投票確率に表れると想定することだ。静岡の20代大卒女性がだれに投票するかについて、静岡であること、大卒であること、20代であること、女性であることがそれぞれ個別に作用するとみなす。10万人規模の世論調査で十数万のグループの投票先を個別に推定する魔法のタネだ。これまでの社会調査の教科書を一顧だにしない横紙破りともいえ、世論調査で有名な米ギャラップ社は2012年を最後に当落予測競争から降りてしまった。

アメリカの大統領選挙やイギリスのEU脱退国民投票で報道された世論調査は、このような統計モデルで補正された結果だ。予測を志向する限り、日本でも早晩同じ手法を使わざるを得なくなるだろう。

「時価」としか書かれていないメニューよりも、不正確でも値段が書いてあるメニューの方がありがたい。だから、調査がどれほど困難になっても、選挙予測はなくならない。未来予測には、商品の人気ランキングのように、人々を同じ行動にいざなうことによって自己実現するタイプと、コロナの感染拡大予想のように、人々に予測が外れるように行動を促すタイプがある。選挙予測がどちらになるかは、社会の状況次第だ。

明日の昼何を食べたいか、自分でメモに書き留め、翌日見比べてみれば、予測の難しさがわかる。何のために世論調査があるのかの見直しが進むにつれ、予想の当たり外れという意味での精度は問われなくなるだろう。

データについて 自民党の潜在投票率の計算では、共同通信、NHK、読売新聞、朝日新聞、日本経済新聞、JNN(TBS系)の各社が毎月実施している政党支持率を利用した。

世論調査の合成の状態空間モデル1は、豪州のサイモン・ジャックマン米国研究センター教授が提案したものを参考にしたもので、潜在得票率をr、日付をt、世論調査結果をs、調査機関iの固有バイアスをhとすると、

を主なモデル構造とした。

状態空間モデル2は、主な政党の潜在得票率をとし、調査機関iに対する政党別回答率を、世論調査結果をとすると、

を主なモデル構造とした。