2016年11月18日金曜日

平成28年7月都知事選の市民出口調査とマスコミ出口調査の比較

本稿では、選択バイアスに着目することにより、今夏の都知事選におけるマスコミの出口調査と「市民調査」(以下、括弧を省略する)との間に明白な齟齬が存在していたことを示す。以前(2016年9月30日)、選挙における情勢調査・出口調査では、選択バイアスを考慮する必要がある旨を述べたが、本稿はその続報である。公表時期が遅いという声が聞こえてきそうであるが、わが国の大マスコミや米国の(選挙予想における)有名人がおしなべて米大統領選の予測を外した現時点であるからこそ、ここでの検討の価値が増すというものである。

なお、選択バイアスとは、理念上の「調査対象集団」と具体的な調査における「母集団」との差から生じる推定値のずれを指す(2016年10月14日2016年10月24日)。本事例では、調査対象集団は都知事選の全投票者であり、母集団は各出口調査の対象となる投票者集団である。母集団の設計によって選択バイアスが生じるという場合の一例を、私が指定されている投票所を例に説明する。その投票所では、マスコミの出口調査のほとんどは、朝一番の1時間のみ行われるようである。この結果、三世代ファミリー層も独身者も多く居住するこの地域において、高齢者の回答者が自然と多くなるという構図である。マスコミの手抜きの結果、年齢層や性別に偏りがないことは、この投票所から引き出される結論においては、保証されないのである。

以前(2016年9月30日)に紹介した「修(@osamu9912)」氏による市民調査(当該ツイート削除)の結果は、鳥越俊太郎氏の支持率が圧倒的であった。これに対しては、「市民団体」に対して(だけ)は嘘を吐く、マスコミの出口調査には過去の蓄積がある、調査の基本が分かっていないといった指摘が『2ちゃんねる』では相次いだ[1]。その大半は、表層的な勉強だけしていたら出てきそうな、数字に対するセンスのない答えである。手を動かすと、全く異なる様相が現れてくるからである。(私もセンスのない方ではあるが、本稿の作成を通じて手を動かしたから、自信を持って指摘できる。)

もっとも、「修」氏の調査に対して辛辣な2ちゃんねらーの意見[1]のうち、コメントの2・19・24などのように、回答者が嘘を吐くというものは、良い所を突いた批判であるかのように見える。リチャード・アーミテージ氏の米大統領選に対するインタビューについて、私は、辛辣な検討結果を提示しており(2016年7月25日)、2ちゃんねらーたちのように、ひねくれた物の見方を有しているといえよう。しかしながら、回答を拒否する代わりに小さな嘘を吐くことのできる人物が小池氏支持者に多く見られるという結論は、小池氏の支持者にとって、収まりの悪いものであるはずである。この結論の不具合に、意見を書き込んだ当の本人らが気付いているか否かは、私の知るところではない。ただ、嘘を吐く者がいるという指摘は、泥縄シミュレーション向きの指摘ではあることだけは、確かである。この点は、本稿では検討せず、次稿以降の課題としておく。本稿では「回答する」か「拒否する」かの二択で考える。

朝日・読売の両新聞の出口調査には、支持政党別(自民・民進・公明・共産)の投票先が示されているが、これらマスコミによる出口調査に示されていた共産党支持者の投票先は、シミュレーションに転用可能である。最も鳥越氏への支持率が高かった共産党支持者しか回答しないと仮定して、いったいどれほどの人たちが回答拒否したのかを推定するのである。この仮定は、野党支持者を揶揄した2ちゃんねらーたちによる複数の書込みを、そのまま利用したものである。コメント42の「アンケートに答えるのはお仲間臭がする人種だけだろうからな」[1]は、その一例である。

マスコミの共産党支持者に対する出口調査から、市民調査を再現できるか否かの検討にあたっては、三点の仮定が必要となった。一つ目は、マスコミの出口調査における共産党支持者の投票先の割合を点推定値で求めたことである。これは、あくまで仮定の置き方の一つであり、マスコミの出口調査の支持率を幅を持たせて求め直して、市民調査の再現に最も都合の良い値を採用するという方法も考えられる。二つ目は、鳥越氏への投票者が市民調査に回答拒否した真の確率を決定しておくことである。これは、分析者の自由裁量に係る部分であるため、50%から95%まで、1%刻みでスライドさせている。三つ目は、主要三候補とその他の候補の四種に投票先を再分類したことである。これは、マスコミの出口調査の枠組を準用したものである。

より具体的なシミュレーションの方法は、下記図1に示した。まず、マスコミの出口調査を利用して、回答者の並びを(データフレームとして)再現した。その並びに対して、市民調査が順番に声をかけ、個人に割り振られた回答率を満足する値を有する回答者だけが回答する、という流れを模してみた。鳥越氏を支持する市民調査への回答者が(市民調査に示された)196人に達したところで回答者の並びを(データフレームのサブセットとして)切り出した。このデータの中には、個人毎に、①誰に投票したか、②市民調査に回答したか、の別が保存されている。このデータを集計すると、各候補者別に、市民調査への回答率を計算することができる。より具体的な作業過程は、朝日新聞の記事を例に取ったものをRファイル(「w20160909_市民調査を再現_朝日_upload.R」)としてアップロードした。シミュレーション上の回答者は、100万人分を作成したので、回答率を求める作業の回数は、各回答率につき、1000回以上になる。本稿以上の作業の詳細は、前掲ファイルを参照されたい。なお、本作業過程のうち、ggplot2パッケージによる密度推定には、一部のデータが利用されていないが、グラフ描画上の大きな問題にはならないものと考え、作業を強行している。

結果は、アニメーションgifに直して、図2と図3に示した。この結果は、マスコミ出口調査における共産党支持者集団と市民調査への回答者集団とが明らかに異なるものであることを示すものである。市民調査に対する回答率は、どの候補についてであれ、鳥越氏の真値の周りにばらつくはずであるが、そうはなっていない。鳥越氏については、適切な形で再現されている。しかし、増田氏・その他の候補については、一貫して回答率が鳥越氏よりも高く出ており、しばしば、1を上回るものともなっている(ただし、シミュレーションの方法上、あり得ないことではない)。その一方で、小池氏支持者の回答率は、一貫して低く出ており、共産党支持者のデータを元にしているにもかかわらず、半分程度となっている。

図2・図3に示された結果は、「修」氏の提示した結果を信用したとき、小池氏支持者の回答拒否率だけが異様に高く、また、増田氏・その他の候補の支持者の回答率もおかしいという事実を突きつけるものである。この結果は、マスコミの出口調査に対する重大な疑義を突きつけるものになる。幸い、現在は、2016年米大統領選後である。マスコミの正しさに対する社会上の制約は存在しないから、自由な心証を元に、マスコミ報道の事実に関する正確性に対して、疑問を呈しても問題ないであろう。実のところ、マスコミの出口調査の正しさは、「修」氏の提示する結果と同程度にしか、追跡可能ではない。つまり、記事として書かれたことくらいしか、検討の材料がないのである。今時の政治学研究者の全員が社会調査の手続を熟知している訳でもないし、カネと名誉に転ばない訳でもないから、出口調査の過程と結果に対して誰もがアクセス可能ではない限り、マスコミの出口調査が捏造ではないと信じることは、およそナイーブに過ぎる。しかも、今夏の都知事選の結果は、事前の読売新聞による情勢調査を参照する限り、偶然、小池氏の勝利を確実なものとする上での最大見込み票数であった(2016年8月21日)。これに対して懐疑の目が向けられないとすれば、その社会はおよそ健全とは呼べないものであろう。

本稿のシミュレーションは、「修」氏が全く関知しない形で行われたものであるが、彼(女)の提示した市民調査が、マスコミの出口調査の怪しさを指摘する力を十分に有することを示すものである。「修」氏は、マスコミの出口調査の結果が揃わない時点で、市民調査の結果を提示している。このため、答えを調整している可能性がゼロではないが、100パーセントでもない。また、市民調査が支持政党を聞いている訳でもなさそうであるから、ここで示したようなヒネた検証方法を想定してもいないであろう。ただ、提示された情報には大きな力があっただけに、元のツイートが削除されていて、そのままであるという経緯の不明さは、懸念を抱かせるものとなっている。エスタブリッシュメントの外にいる存在が出口調査を行うことに対しては、権力側が色々な難癖を付けられる余地があるから、具体的な危険を感じて取り下げたということも考えられる。まとめサイト経由で個人攻撃が激しくなったという場合も考えられよう。


図1 シミュレーションの方法
図1 シミュレーションの方法

図2 朝日新聞出口調査に基づく「市民調査」への回答率の推定シミュレーション結果
図2 朝日新聞出口調査に基づく「市民調査」への回答率の推定シミュレーション結果
(説明は図1と本文を参照)

図3 読売新聞出口調査に基づく「市民調査」への回答率の推定シミュレーション結果
図3 読売新聞出口調査に基づく「市民調査」への回答率の推定シミュレーション結果
(説明は図1と本文を参照)

[1] 【不正選挙】鳥越俊太郎支持者「出口調査だと70%で圧勝だった 不正選挙ではないか?」 実は…… [無断転載禁止]©2ch.net
(2016年11月13日閲覧、2016年8月2日開始のスレッド)
http://hayabusa8.2ch.net/test/read.cgi/news/1470129099/




2021(令和3)年7月28日修正

グーグル・ドライブのファイルにセキュリティアップデートとやらが適用され、リンクにアクセス不能となる可能性があるとの通知を受け、当該リンクを修正した。内容は変更していない。

0 件のコメント:

コメントを投稿

コメントありがとうございます。お返事にはお時間いただくかもしれません。気長にお待ちいただけると幸いです。