2016年8月16日火曜日

都知事選の主要三候補の得票率が斉一的であるという指摘は前提が怪しい(2)

 前稿(リンク)では、先月都知事選の主要三候補の得票率が斉一的に過ぎるという指摘が三種類の点、(1)記述統計的手法の誤り、(2)統計モデルの不在、(3)地域統計、を見落としていると指摘した。前稿では、(1)つまりグラフの書き方がおかしいという点を指摘したが、これは、形式的な誤りでしかなく、指摘そのものの正しさを否定する材料とはならない。ただ、誤ったグラフから正しい仮説や正しい結論が導かれることがあるとすれば、そのことは、むしろ僥倖というべきであろう。

 本稿では、不正選挙を指摘する複数の論者による、「小池氏の得票率を鳥越氏の得票率へと近付けるための係数を乗じた結果、小池氏の基礎的自治体ごとの得票率は、鳥越氏の得票率に一致する」(以下、「比例説」)という主張が、個人の投票モデルのうち、最もシンプルなものとなる二項分布によって否定されることを確認する。本稿の指摘は、先の三点の指摘のうち、第二点目に係るものである。個人の投票モデルが二項分布に従う(のみである)という仮定は、先の三点の指摘のうち、第三点目に起因する特徴を無視したものとなっているが、第三点目の地域統計であるという特徴を乗り越える作業は、生半可にはいかないので、本稿以後も扱わない方針であることをあらかじめお断りしておく。

 また、本稿では、「宇都宮健児氏の得票率が鳥越氏の得票率へと流用されている」という趣旨の主張もまた、個人の得票行動に二項分布を仮定した場合、誤りとなることを示す。ただし、この主張は、小池氏の得票率に一定の係数を乗じた場合よりも成立しそうなものでもある。宇都宮氏への投票者の支持政党、鳥越氏への投票者の支持政党は、いずれも野党側のものである一方、前回都知事選における与党候補とは異なり、今回の都知事選は、与党系の候補が2名となったものであるためである。

 計算方法は、次のとおりである。各時点の各基礎的自治体の全有権者に対する、今回の小池氏への投票率$P_1$と、前回の宇都宮氏への投票率$P_2$を、いずれも二項分布における真値とみなした。それらの投票率を鳥越氏への投票率へと変換するための係数$(k_1, k_2)$を、作成した。係数$(k_1, k_2)$を、$P_1$及び$P_2$のそれぞれに乗じ、修正後の投票率を得た。今回の全有権者数を試行回数として、修正後の投票率、たとえば$k_1P_1$を成功確率とする二項分布の実現値は、仮に、現時点の不正選挙を糾弾する論者の主張が正しければ、今回の鳥越氏の得票数にきわめて近い数値となるはずである。そこで、それぞれの得票率と実際の鳥越氏の得票数を利用して、各自治体について、二項検定を実施した。各自治体について二項検定を実施することは、多重比較となるので、判定の有意水準は、0.01を基礎的自治体数62で除した(ボンフェローニ修正)。

 結果、小池氏の得票率を利用した場合には46の基礎的自治体において、前回の宇都宮氏の得票率を利用した場合には43の基礎的自治体において、鳥越氏の得票数は、これらの得票率から生まれたとは認められないという結果を得た。つまり、鳥越氏の得票率がほかの候補の得票率に比例するように見えたとしても、その比例関係は、大半の場合、厳密には成立していないのである。グラフ上で線が重なるほどに近い差であっても、二項モデルを仮定した場合には、その差は、何らかの違いを示すほどに大きなものと言えるのである。

 地域別得票率の「比例説」は、二項分布から大量に生起する現象についての数的感覚が欠如していることから生じたものと認められる。20世紀中葉までに成立した現代的な統計学の学習や訓練がなければ、誰でも、同様の誤りに陥ることになる。「大量(マス、mass)現象」に二項分布を仮定したときのばらつき方は、統計学が専門ではなくとも、社会現象を分析する人物であれば、抑えておくべき基本であろう。この素養は、何が異常で何が正常でないかの判定能力に直結するためである。

 実際の分析作業は、すべて『R』上で実施したので、計算結果は.Rファイルにすべて譲る。ファイルをアップロードした(リンク)ので、そちらをご覧いただきたい。

 「比例説」自体は、その主張が含む厳密さによって否定された訳であるが、しかし、「比例説」が否定されたことは、今回の得票結果を説明する説の中から、不正選挙の可能性という説を除外する理由にはならない。 むしろ、「比例説」に何らかの副次的要因を追加することによって、今回の状況をうまく説明できるとする、不正選挙を支持する説が提起されたとき、おそらく、われわれは、その説を否定するだけの材料を持たないであろう。多数がお互いを監視するというオムニプティコン社会に生きるわれわれは、その説の出現を予期できるだけのリアルな材料を、すでに手中に収めているのである。それに、異常と正常の境目の判定能力の欠如は、何も、(私を含む)陰謀論者だけに見られる現象ではないのである。

平成28(2016)年8月16日12時追記・修正

今回の検定におけるファミリーワイズの第一種過誤を5%から1%に変更した。

 また、「2012年猪瀬氏→2014年桝添氏」と「2014年桝添氏→2016年小池氏」に係る比例説も検討した。「2012年猪瀬氏→2014年桝添氏」については53の基礎的自治体が、また「2014年桝添氏→2016年小池氏」については48の基礎的自治体が二項分布から外れる形であるという結果を得た。アップロードしたファイル(リンク)は、この結果に係る作業も含む。

 本文のパラフレーズとなるが、各候補の得票の形状は、二項分布というシンプルなモデルでは説明できないものの、追加の仮定を措くことによって、うまく説明できる可能性が残るものである。現時点で考えられる要素のうち、不正とは一応切り離すことのできるものを挙げれば、自動票読取機が梱包する票数(500票)、地元議員の応援、公務員や宗教団体など、斉一的な投票行動をとる居住者が集住する宿舎の所在、などが考えられる。


0 件のコメント:

コメントを投稿

コメントありがとうございます。お返事にはお時間いただくかもしれません。気長にお待ちいただけると幸いです。