2016年2月8日月曜日

平成28(2016)年1月24日宜野湾市長選挙における当日出口調査への回答拒否率の比較

 本稿では、平成28(2016)年1月24日宜野湾市長選挙の結果を前提として、それぞれの当日出口調査の回答拒否率を変えてみることで、それぞれの当日出口調査がどのように変動するのかを図示する。本ブログでは、琉球新報等による出口調査結果と選挙結果とが整合しないことから検討を始めた(その1その2その3)。加えて、以前の記事では、調査拒否が出口調査に大きな影響を与えるのではないかという見込みを述べた。これらの検討作業、また今回の検討作業は、いずれも、選挙結果と三種の出口調査とが同時に成立するための要件を探るという共通の理由に基づき実施されたものである。

 回収率が支持率の点推定値に大きな影響を及ぼすことは、最近では、鈴木督久(2011)氏により指摘されている※1※2。このことは、社会調査の根幹をなす部分である。回収率を高く保つためことの大切さは、逆説的な形ではあるが、国会においても、世論調査の受託企業の不正行為を通じて取り上げられたことがあるほどである※3。不正は、回収率を高く維持することの重要性が指摘されているからこそ、行われたものと見ることが可能なのである。

 鈴木督久(2011)氏の前掲論文は、回収率に応じた真の支持率(計画標本の支持率)と回収標本の支持率の関係式を掲載している。変数は、次のように定義されているが、同時に、本記事での読み替えを掲載する。(つまり、変数とその定義は正しいであろうが、本記事で読み替えた部分については、私の解釈だけが正しさを保証する点に注意して欲しい。)

変数定義本記事での読み替え
$p$計画標本の支持率選挙結果における佐喜真氏の得票率
本記事では固定された値とみなす
$p_1$回収標本の支持率出口調査における佐喜真氏の得票率
本記事では固定された値とみなす
$p_2$非回収標本の支持率出口調査への回答拒否者が佐喜真氏へと投票した確率
$p, p_1, r_2$(後述)を固定すると算出可能となる
図3を参照
$e$非回収誤差$p, p_1, r_2$(後述)を固定すると算出可能となる
図4を参照
$r$回収率同上。ここでは回答拒否率ともいう
図2を参照

計画標本の支持率、非回収誤差の式は次のように表される。

\begin{gather} p = p_1 + e\\ e = (1 -r)(p_2 - p_1) \end{gather}
(1)と(2)式から、$p$は次のようにも表される。

\begin{equation} p = p_1 + (1 - r)(p_2 - p_1) \end{equation}
(3)式から、$r = 1$か$p_1 = p_2$のとき、$p = p_1$となり、回収率$r$が低いほど、回収・非回収標本の支持率の差$p_2 - p_1$が大きいほど非回収誤差が拡大することが分かる。

 本記事では、琉球新報等、沖縄タイムス等の二種の出口調査における佐喜真候補の得票率が異常に低いことに興味を抱いている。そこで、これら二種の出口調査に対する回答拒否率が小さいと目される、志村候補への投票者の回答拒否率を可変のパラメータ$r_2 (0 \leq r_2 \leq 1)$と置くことにする。$p, p_1, r_2$を決定すると、佐喜真候補への投票者の出口調査への回答拒否率$r_1$が求まり、それにつれて、$p_2$も求まる。

 $p, p_1$を固定したとき、$r_2$につれて$r_1$が変化する様子を示したのが下図1である。$r_1$の方が$r_2$よりも高くなることがよく分かる。自民党支持者の回答拒否率は、他の調査でも全般的に高いようであり(前記事)、今回の結果も整合的である。NHKの出口調査は、ほぼ実際の得票率と同様の推定値を得ていたために、関数の形状は、$(0, 0)$から$(1, 1)$へと至る45度の直線状となっている。

図1:当日出口調査における支持者別の回答拒否率の関係($r_1| p, p_1, r_2$)

 各社の当日出口調査に対して回答者が回答する確率、つまり回収率は、次の図2のようになる。$p, p_1$を固定した後に$r_2$を設定すれば、図1で示したように$r_1$が求まり、その結果、合成の関数である$r$が求まる。NHKの回収率は、志村候補への投票者の回収率がゼロであれば、ほぼ1に近い。
図2:当日出口調査の回収率($r | p, p_1, r_2$)

 出口調査への回答拒否者が佐喜真候補へと投票した確率、つまり非回収標本の支持率$p_2$は、下図3のとおりとなる。志村候補への投票者の回答拒否確率が高まるにつれ、投票結果に近づくことが分かる。

図3:出口調査への回答拒否者が佐喜真候補へと投票した確率
(非回収標本の支持率$p_2 | p, p_1, r_2$)

 ここまでに計算した数値によって、非回収誤差$e$、つまり出口調査への回答拒否者により出口調査において推定された佐喜真候補への投票率と実際の投票結果との誤差を計算することができるようになる。それを図示したのが図4である。志村候補への投票者で、かつ出口調査を拒否した者の割合が20%を超えれば、琉球新報等では6.4%、沖縄タイムス等では5.7%程度の非回収誤差が生じるが、NHKでは、0.5%程度でしかない。志村候補への投票者で、かつ出口調査を拒否した者の割合が40%であれば、琉球新報等では8.4%、沖縄タイムス等では7.4%程度の非回収誤差が生じている。この程度にまで非回収誤差が達していれば、志村候補への投票者がNHKへの出口調査を二社のものに比べて忌避する確率が高いという仮定を追加で必要とするものの、今回の各社の出口調査すべてと実際の投票結果とを整合的に見ることが、初めて可能となるのである。

図4:回答拒否者の存在により出口調査に生じた非回収誤差
(非回収標本の支持率$e | p, p_1, r_2$)

 最後の下図5は、志村候補への投票者が出口調査に回答拒否した確率と、それにつれて、当日の各社の出口調査におけるサンプリング間隔(何名のうち1名に調査協力を依頼するのか)を示したものである。志村候補への投票者の出口調査拒否率が0.4となると、琉球新報では、都合15名につき1名程度のサンプル調査を実施したことになる。

図5:当日出口調査におけるサンプリング間隔の推定結果

 この事実と琉球新報等による出口調査のサンプル数が1412名となっていることは、過去の出口調査に遡り、考察を進める必要があることを示唆する。その理由の一つとして、次のような場合が考えられる:同グループでは、過去の投票率を鑑みてサンプリング間隔を設定したところ、予想に反して高い投票率となったために、以前より多数のサンプルを得ることとなった。あるいは、出口調査前半において、接戦である可能性が認められたために、サンプル数を積み増した。これらのいずれの場合も、必然的に、サンプル数の増加に帰結することになる。ただし、サンプル数を無理に増加させた結果、回答拒否者の割合が高まったという場合も考えられなくもない。

 読者にとって、今回の記事も尻切れトンボ気味に見えるかもしれないが、一通りの情報を提供したことになっているので、ここまでにしたい。作成に使用したファイルは、後日のアップデートに併せて公開する予定ではある。

 なお、今回、初めてMathJax(リンク)を導入してみた。JavaScriptをオンにすると、数式がLaTeX風でちょっと格好良く見えるはずである。導入にあたっては、巻末に記すサイトを参照した※4~※7


※1 鈴木督久, (2011). 「回収率について」, 『道標』637, 9-10.
http://www.nikkei-r.co.jp/lecture/dohyo2011-4.pdf

※2 株式会社日経リサーチ 講演・論文情報(2011年)
http://www.nikkei-r.co.jp/lecture/2011.html

※3 第166回 参議院 総務委員会 平成19年5月15日 第15号|国会会議録検索システム - 16605150002015.pdf
http://kokkai.ndl.go.jp/SENTAKU/sangiin/166/0002/16605150002015.pdf

※4 BloggerでMathJaxを使ってTeXっぽく数式を入れる方法 - Ichiro Maruta Homepage
http://ichiro-maruta.blogspot.jp/2012/01/bloggermathjaxtex.html

※5 Irreducible representation: MathJax in Blogger (II)
http://irrep.blogspot.jp/2011/07/mathjax-in-blogger-ii.html

※6 MathJax Equation Numbering
https://www.tuhh.de/MathJax/test/sample-eqnum.html

※7 MathJax
https://www.mathjax.org/

0 件のコメント:

コメントを投稿

コメントありがとうございます。お返事にはお時間いただくかもしれません。気長にお待ちいただけると幸いです。