2016年8月14日日曜日

都知事選の主要三候補の得票率が斉一的であるという指摘は前提が怪しい(1)

#本記事も、先月の東京都知事選挙に係る分析の一部である。いずれはリンクページを作成したいが、下調べすべき要素が多く、なかなか形にならない。

 先月末(平成28年7月31日執行)の東京都知事選挙については、支持政党や候補者が異なるにもかかわらず、自治体ごとの得票率が斉一的過ぎる、という指摘がなされている。この主張は、Ghost Ripon氏(筆名)のブログ(リンク)で精力的に示されてきたものである。これ以上、厳密な起源を追うことはしないものの、この主張は、陰謀論者というラベルを貼られている人たちの中でも、とりわけ理性的と見なされている人たちにも広く受け入れられている。たとえば、「れんだいこ」氏は、ウェブサイト(リンク)に記された内容による限り、決して盲目的に陰謀論と呼ばれる分野の諸説を受け入れているものとは読めず、多くの論考は批判的に執筆されているように見えるのであるが、本件に限れば、同氏の5日までのツイートは、この説をほとんど直感で受け入れているように見える。

 今回の都知事選挙に対する疑いは、過去の都知事選挙に対する疑いの延長上にある。つまり、従来の都知事選挙についても、支持政党や候補者が異なるにもかかわらず、自治体ごとの得票率が斉一的過ぎる、という指摘がなされてきた。別の一例として、孫崎享氏のツイートライン(後段で紹介)を挙げることができる。孫崎氏は、今回の都知事選については不正を断定できないとしながらも、過去の都知事選に対しては、同様の方法によって、不正が示されていると考えているようである。

 他方、統計学を高校三年以降の課程で学習し(て、二項分布を知っ)た人にとって、この指摘は、かなり怪しげに響くものである。なぜなら、各区における特定候補の得票率が同一であると仮定し、その投票率を成功確率とする二項分布を想定した場合、各区の結果は、この二項分布から生成されたものにならないことの方がむしろ多いことを予測できるからである。このとき、不正選挙を指弾する側の人々は、自らの前提に裏切られる格好となるのである。各自治体における得票率は、同一確率の当選者への投票率(候補者にとっては得票率)からは、およそあり得ない形で期待される票数から外れるためである。

 従来の都知事選に対する不正選挙疑惑を論じた人々の陥穽は、いわゆる記述統計的手法を適切に利用せず、また、何らの統計モデルを念頭に置かないまま、地域別の集計データを分析可能であると考えたことにある。(1)記述統計的手法の誤り、(2)統計モデルの不在、(3)地域統計、という三点それぞれに検討の必要がある。本稿では、最初の誤りを検討しよう。最初の誤りは、グラフの書き方が誤り、というものである。

 グラフの書き方は、分析の方向性を歪めることがある。その実例として、下記OMP氏のツイートのグラフを挙げる。OMP氏は、このグラフを通じて、おそらく、東京都内の特別区が多様な特性を有しており、住民の特性も異なり、よって支持政党や候補者も異なるにもかかわらず、結果が斉一的過ぎる、と主張したいのであろう。しかし、このグラフは、3D棒グラフとして描かれており、各候補を表す円柱の底面同士の高さが同じような高さのものに見えてしまうという問題を含むものである。グラフは、自身の仮説に逆らうように作成するのが基本である。そうしておかないと、自身の仮説に対して批判的に接することができなくなるという副作用にやられてしまうこと、請け合いである。

https://twitter.com/ompfarm/status/759949306983964673


 他方、たか@地球氏のグラフは、的確である。たか@地球氏は、OMP氏へのリプライとしてグラフを提示しているので、読者は、これらを通して読んでいたとすれば、正確な理解にたどり着くことができよう。それ(こそ)がSNSの長所というものであろう。(ただ、本記事は、いろいろと差し障りもあろうから、このブログのみで留めておく。また、このブログは、あえて訴求力低めで運営しているつもりである。何かご意見のある場合には、分かりやすくご指摘いただけると幸いである。)

https://twitter.com/taka_telluria/status/760351648149450752

 言いっ放しでは不公平というものであろうから、私も、グラフを下に提示した。『Excel』で作成したものであるが、「カラー画面で自分が見るだけ」なら、この程度で十分であるということを示すためである。細かいことであるが、x軸の目盛りを付けなかったのは、位置が各項目(市区町村等)の真ん中に来るよう調整するのが面倒だったからである。x軸の目盛りの位置は、『Excel』が表計算ソフトウェアのデファクト・スタンダードとなって以来、それほどとやかく言われることがなくなったようにも思う。長いものには巻かれろ、ということなのであろうか。なお、『Excel』なら4色以上のグラフについて、また『R』ライブラリの『ggplot2』なら3色以上のグラフについて、デフォルト状態から配色を変えるという工夫が必要そうである。今更ながら、このことに気が付いた次第である。本ブログにおいて、多くのグラフを公開しておいて手遅れ感があるのだが、本来、系統的な作業が必要ということである。


平成28年7月31日執行東京都知事選挙 主要三候補の得票率
図:平成28年7月31日執行東京都知事選挙 主要三候補の得票率


 なお、本グラフでは、折れ線グラフを使うべきではない。なぜなら、本グラフは、地方公共団体コードで基礎的自治体等を並べており、隣り合う項目同士が連続するものではないためである。各候補の得票率に係る時系列の推移であれば、横軸に時間をとる限りは、折れ線グラフで良いであろう。この点、Ghost Ripon氏の努力は、このような(小学生で学習するはずの)グラフの書き方だけ取っても、十分に突っ込む余地のあるものとして、斥けられてしまうのである。分析そのものの誤りについては、本人が理解した上で相関係数等(#実は、単回帰直線の決定係数であって、相関係数ではない)を利用していないという可能性が多分に認められるために、本ブログでは次稿以降で、私自身の見立てを検討する中で、ゆる~く触れる程度にしておきたい。

【不正選挙】都知事選 投票者数にも人為的な操作|Ghost Riponの屋形(やかた)
http://ameblo.jp/ghostripon/entry-12187553452.html



平成28年8月13日追記

孫崎享氏による今回都議選に係るツイートは、以下の2種に要約される。孫崎氏が2番目のツイートでいう「相関性」は、おそらく、下記ブログの引用部分等にあるようなグラフを指すのであろう。この「相関性」は、先に挙げた要素のうち、(2)統計モデル(の不在)、(3)地域統計、の二点を考慮しないものであり、「各区の当選候補の得票率が共通する」という二項モデルを仮定して確認することによって、否定されることになる。次回以降の記事のいずれかで紹介する。



不正選挙!衆議院選挙は操作されていた!!「日刊ゲンダイ」がとんでもないことを暴き出している - 愛詩tel by shig
http://blog.goo.ne.jp/1shig/e/6f9515ba174f5dff1e7f84c7e613f916
◎2011年都知事選、12年都知事選、14年都知事選。
そこで当選した、石原慎太郎氏、猪瀬直樹氏、舛添要一氏の
全51選挙区の区毎の得票分布が、同じであることが判明した。

 上掲の51選挙区とは、特別区及び市、西多摩郡、島部である。また、このブログの出典は、『週刊事実報道』という出版物のサイトの記事である(ように読める)。最も上流のソースは、Ghost Ripon氏のブログ(リンク)であると思われるが、いずれにしても、何を仮定して斉一的であると判定しているのか、という点が不明瞭であるために、信憑性に疑問を持たれても仕方のない状況にある。

週刊事実報道 『東京都知事選でまさかの不正疑惑』
http://www.jhoudou.com/#!news11/csv8


0 件のコメント:

コメントを投稿

コメントありがとうございます。お返事にはお時間いただくかもしれません。気長にお待ちいただけると幸いです。