2016年9月30日金曜日

選挙の情勢調査におけるサンプリングの拙い事例は左右を問わない

 今年7月の記事(2016年7月25日)では、ドナルド・トランプ氏への共和党員の反対率が3分の2に達するというリチャード・アーミテージ氏へのインタビュー記事について、同氏に票読みの感覚が欠如していることを指摘し、その原因として、多くの共和党員に欺かれた・彼が記者に嘘を吐いた・彼が統計調査のリテラシーに欠けている、の3点が考えられると指摘した。事実が第3点目であるとすれば、アーミテージ氏は、自分と親しい者だけから意見を聴取したために、共和党員全体の動向をうまく集約できていなかったことになる。この誤りを避けるためには、社会調査における設計段階が重要になる。調査対象全体から偏りなくサンプルを得るために、調査の設計が重要であるということは、統計を取扱う者の間では、基本的な了解事項となっているはずである。

社会調査ではサンプリングが重要である

「なぜ開票を始めたばかりで、当確を出せるのか」という疑問に対して、統計学者が自信をもって解説できるのは、出口調査が入念に設計されているという前提があってこそである。この疑問に対する答えで秀逸なものは、ジョージ・ギャラップ(George Gallup)氏によるとされる比喩である。寸胴一杯に作ったスープでも、しっかりかき混ぜてさえいれば、スプーン一杯で味見には十分である、というものである。ツイッターの日本語クラスタでは、立川志の輔氏の話の枕、秋山仁氏による味噌汁バージョンの譬え話[1]が拡散されている。

 味噌汁・スープの味見という喩え話で重要なのは、味噌汁なりスープなりが、あらかじめ、十分にかき混ぜられているという点である。調査対象者(サンプル)が全体の状況を的確に反映していて初めて、サンプルから全体の内容を推定できるのである。調査対象者をいかに選定するか、つまりサンプリングが調査の成否を分けることになる。同様のノリで喩えると、サンプリングがなっていない調査は、飯マズが炒め物を作るときに食材をかき混ぜ続けずに片面を焦げさせた挙げ句、上部だけを味見するようなものである。

 推定値が真の値から一方の方向に、一定程度ずれている状態は、バイアスがあると表現される。手近な人々だけに意見を聞くことは、選択バイアスを作り出す。選択バイアスとは、サンプルを選び出すときに、調査対象集団の一部分だけから母集団を選び出したために生じるバイアスである。出口調査は、投票した有権者の縮図となるように行われなければ、全体を正しく再現できるものにならない。

 バイアスを把握するには、複数回の調査や、ほかの調査主体による調査などと突き合わせる必要がある。新聞社の腕章を付けて出口調査を行うことは、選択バイアスを生じさせる原因になる。それゆえ、新聞社が顕名で出口調査を行う場合には、以前の調査などを利用して、政党別に出口調査結果を補正する必要がある。この点は、別稿で先行研究を紹介した(2016年2月4日)。

 バイアスを避けることができるのであれば、それに越したことはないが、バイアスを避け難いのであれば、その影響を加味して考察することは、社会調査において決定的に重要である。専門家としての評判に対して致命的となり得る誤りを避けるためである。この誤りは、左右の別なく見出すことができる(後述)ものである。時には、この誤りは、悪用されることもある。

CNNの日本語記事と日本の五大紙はサンプリングの拙さに触れない

大統領選の二大候補者の第1回目テレビ討論会について、CNNが報道した電話調査の速報[2]は、クリントン氏勝利を62%、トランプ氏勝利を27%と伝えるが、この記事は明らかに恣意的に作られたものであり、CNNという報道機関の統計リテラシーを疑わせるものである。最初に、英語版の記事[3]には詳しい調査結果が掲載されているが、同じ内容を伝える日本語版[2]にはリンクが張られていない。次に、詳しい調査結果を掲載したPDFファイルには、回答者数が521人である電話調査によることが明記されているが、調査拒否率は掲載されていない。最後に、回答者の41%が民主党支持者、26%が共和党支持者、33%がその他である[4]ことは、この電話調査において決定的な要因となりうるにもかかわらず、この事実は記事本体に示されていない。

 現在、JCAST[5]というウェブメディアを除けば、わが国の大マスコミは、CNNの報道を無批判的に受容している。読売[6]、朝日[7]、毎日[8]、日経[9]、産経[10]の五大紙のいずれもが、どのような調査によってこの結果が得られたのかを報じていない。そもそもCNNは、2012年4月からの5年間、テレビ朝日とニュースに係る独占契約を締結している[11]。このようなニュースに接したときには、ソースに当たる必要がある。

 CNNの記事がアップされた後に、トランプ氏を過剰に同様の拙さで擁護する対抗的な動きが多く作り出された。今回、CNNは「統計戦争」を一方的に開始したとも形容されよう。今回の討論会は、市場を動かしている[12]。『日刊スポーツ』までもが便乗する騒ぎとなっている[13]。CNNの記者や従業員の動機は、丹念な調査報道の対象となって良いであろう。

都知事選に係る「市民調査」もサンプリングがマズい、が...

#以下、やや文体が緩めになるのは、ご愛敬である。

 7月末の都知事選挙の直後からある時期までの間、「修」(@osamu9912)氏は、次のようにツイートしていた。当該のツイートは現在削除されてしまっている。
「市民団体が都知事選の出口調査を、都内5か所の投票所で実施、投票帰りの方に質問「どの候補者に投票?」、結果は次の通り。鳥越候補196人(70%)、小池候補33人(12%)、増田候補23人(8%)、その他候補28人(10%)」=>うわ!事前予想通り、鳥越候補の圧勝となっていますよ!
図:@osamu9912氏のid759706167769640961のツイートの跡(2016年7月31日20時過ぎ)

2016年9月30日深夜の時点では、削除された当該のツイートは、グーグルのキャッシュに残されていたので、そのスクショの一部を合わせて掲示する。スクショに示された時刻は、グーグルのキャッシュの時刻なので、西海岸の時刻と考えて差し支えないであろう。

https://webcache.googleusercontent.com/search?q=cache:7z4dVXsJyL4J:https://twitter.com/osamu9912/status/759706167769640961+&cd=1&hl=ja&ct=clnk&gl=jp&client=firefox-b

 削除されてしまったツイートを信用するとは大概なことを、と考える向きもあろう。とはいえ、最近、ある反原発アカウントが異常な状態に陥っていることが話題に上っている。アカウントが稼働し、類似のツイートが掲示されるという状態は、取扱う話題が話題であるだけに、何らかの原因を見込んでおいても良かろう。アメリカ政府の多数の公式アカウントがクラックされている現在、ツイートが削除された理由には、一定の幅を持たせておくべきであろう。

 「修」(@osamu9912)氏の別のツイートには、以下のように、事前調査に係るものも見られる。「文春砲」の炸裂後であり、同氏が先に挙げた出口調査の数値と類似する傾向であるので、いずれの調査についても、ほかの調査とは著しく異なる、何らかの選択バイアスが働いているものと見て良い。実のところ、本人に問合せすることを除き、かなりの調査を尽くしてみてはいるが、先のツイートとこのツイートの双方の出所は、「修」氏のみによるものである。当人への問合せは、私自身のゲームのフェーズが変わってからでも遅くはないであろう。

 とりあえず今回はここまでとして、次回以降、「市民調査」を二次利用した結果をご覧に入れることとしよう(追記:2016年11月18日)。次回予告として一言だけ。手を動かしてみると、思いもよらない結果が得られるものである。



[1] 立川志の輔 「みどりの窓口」 - YouTube
(アップ:2013年12月06日)
https://www.youtube.com/watch?v=XZtZI5fs6fg

[2] CNN.co.jp : 第1回テレビ討論会、62%が「クリントン氏の勝利」 - (1/2)
(2016年09月27日16:36 JST)
http://www.cnn.co.jp/usa/35089609.html
CNNと世論調査機関ORCが討論会を視聴した有権者を調査したところ、民主党候補のヒラリー・クリントン氏が勝利したとした有権者の割合は62%だった。共和党候補のドナルド・トランプ氏が勝利としたのは27%だった。

[3] Post-debate poll: Hillary Clinton takes round one - CNNPolitics.com
(Jennifer Agiesta, CNN Polling Director, 2016年9月27日16:42GMT更新)
http://edition.cnn.com/2016/09/27/politics/hillary-clinton-donald-trump-debate-poll/

[4] READ: The complete full CNN/ORC poll results
http://i2.cdn.turner.com/cnn/2016/images/09/27/poll.pdf

〔p.8〕
Methodology
A total of 521 adult registered voters who watched the debate were interviewed by telephone nationwide by live interviewers calling both landline and cell phones. Among the entire sample, 41% described themselves as Democrats, 26% described themselves as Republicans, and 33% described themselves as independents or members of another party.
Crosstabs on the following pages only include results for subgroups with enough unweighted cases to produce a sampling error of +/-8.5 percentage points or less. Some subgroups represent too small a share of the national population to produce crosstabs with an acceptable sampling error. Interviews were conducted among these subgroups, but results for groups with a sampling error larger than +/-8.5 percentage points are not displayed and instead are denoted with "NA".
〔直訳すると〕固定電話及び携帯電話の双方に対して調査員が全国的に電話をかけることにより、計521人の成人かつ登録済みの有権者で討論会を視聴した者が、インタビューを受けた。全サンプルのうち、41%が自身を民主党員だと述べ、26%が自身を共和党員だと述べ、33%が自身を党派に属さないか、別の党のメンバーであると述べた。本ページ以降のページにあるクロス集計表は、回答者を重み付けしなくともプラマイ8.5%以下の標本誤差を得ることのできるサブグループの結果だけを含む。インタビューはこれらのサブグループ分類を元に実施されたが、標本誤差が8.5%超となるものについては、表示せず、代わりに「NA(Not Available、該当なし)」と注釈した。

〔p.10〕DemocratIndependentRepublican
Clinton84%41%12%
Trump14%56%86%
Both Equally1%2%2%
Neither1%1%*
No opinion*1%*
Sampling Error+/-6.5+/-7.5+/-8.5


[5] 米大統領選TV討論、ネット世論はトランプ氏「圧勝」 クリントン優勢はCNNだけ : J-CASTニュース
(2016年09月28日19:41)
http://www.j-cast.com/2016/09/28279253.html

[6] 大統領選討論会、クリントン氏優勢…米メディア : 国際 : 読売新聞(YOMIURI ONLINE)
(ヘンプステッド(米ニューヨーク州)=小川聡、2016年09月28日01時03分)
http://www.yomiuri.co.jp/world/20160927-OYT1T50091.html
 CNNテレビが討論会終了後に行った緊急の世論調査によると、クリントン氏の方がよかったとする人が62%で、トランプ氏の27%を大きく上回った。

[7] 米大統領候補、激しい応酬 世論調査で勝ったのは?:朝日新聞デジタル
(ヘムステッド=宮地ゆう、2016年9月27日13時49分)
http://digital.asahi.com/articles/ASJ9W2K0GJ9WUHBI00H.html?rm=480
 米CNNテレビが討論会終了直後に行った世論調査では、今回の討論会でクリントン氏が勝ったと答えた人が62%、トランプ氏が勝ったと答えた人が27%だった。

[8] 米大統領選:テレビ討論会、初の直接対決 クリントン氏、同盟関係を尊重 トランプ氏、雇用を取り戻す - 毎日新聞
(ヘンプステッド(米東部ニューヨーク州)西田進一郎、2016年9月27日 東京夕刊)
http://mainichi.jp/articles/20160927/dde/001/030/062000c
討論会の勝者を聞いた米CNNの緊急世論調査では、クリントン氏が62%、トランプ氏が27%で、クリントン氏が「勝利」した。
[9] 6割がクリントン氏に軍配 米大統領選討論会  :日本経済新聞
(ヘンプステッド=共同、2016年9月27日14:36)
http://www.nikkei.com/article/DGXLASGM27H68_X20C16A9000000/
#短い記事なので、念のため、引用は行わない。

[10] 【米大統領選】第1回討論会でトランプ氏の核武装容認論の危険性を指摘 軍配はクリントン氏に(1/2ページ) - 産経ニュース
(ヘンプステッド=加納宏幸、2016年9月27日19:43)
http://www.sankei.com/world/news/160927/wor1609270037-n1.html
 討論会後のCNNテレビ世論調査では、クリントン氏が勝ったと答えたのは62%だったのに対し、トランプ氏と答えたのは27%。「明快に見解を示した」「政策をより理解している」との設問でもクリントン氏が2対1で勝り、軍配は同氏に上がった。

[11] テレビ朝日・CNN ニュース独占契約を更新/1982年以来の提携関係をさらに5年延長(Microsoft Word - 120307-CNN契約更新 - 120307-CNNcontract.pdf)
(2012年3月7日)
http://company.tv-asahi.co.jp/contents/press/0229/data/120307-CNNcontract.pdf
契約期間は今年4月から5年間。テレビ朝日とCNNは1982年以来30年間提携関係を続けており、今回が第10次契約です。

[12] 米大統領選TV討論、市場関係者「クリントン氏勝利」  :日本経済新聞
(NQNニューヨーク=神能淳志、2016年9月28日08:25)
http://www.nikkei.com/article/DGXLASFL27HQ5_Y6A920C1000000/
クリントン氏に軍配があがったとして外国為替市場ではトランプ氏の攻撃対象の1つになっていたメキシコの通貨ペソが買われ、討論会の直後は米株価指数の先物も上昇した。

[13] ヒラリー氏62% 米大統領選CNNテレビ世論調査 - 社会 : 日刊スポーツ
http://www.nikkansports.com/general/news/1716611.html



2016(平成28)年10月29日修正

ユニバースと母集団との関係を検討した記事(2016年10月14日)の内容を受けて、誤りとなる書き方を、林知己夫氏風の定義により書き換えた。

0 件のコメント:

コメントを投稿

コメントありがとうございます。お返事にはお時間いただくかもしれません。気長にお待ちいただけると幸いです。