2016年7月12日火曜日

木下黄太氏の2012年の言説を今更検討してみる

 ジャーナリストの木下黄太氏は、2012年、横浜市内の一つの高校で、一晩の間に、教員の一人と学生の一人が心疾患で亡くなったという読者の報告について、この現象が珍しいものであり、その原因が福島第一原発事故由来の放射能によるものではないか、と論評した※1。木下氏は、この報告を受けて、裏取りも行ったという。この報告を事実として受容することには、問題がないであろう。ただ、木下氏は、一晩の間に教員と学生とが同時に病死したという事実を、珍しいものであると当然視しているようにも見える。

 そこで、本稿では、遅ればせながら、冒頭の木下氏の主張に焦点を合わせ、木下氏の主張が一種の早とちりではないのか、という可能性を追究することとしたい。あらかじめ本稿における検討結果を述べておく。「一年のうち」という、一晩に比べて長い期間を仮定しても、全国の高校のうち、ある高校一校以上において、学生と教員のそれぞれが一名以上、心疾患で亡くなるという事態は、3.58パーセントという比較的小さな確率に留まる。よって、この現象は、珍しいものと考えて良い、という結果を得た。ただし、「どのような死因を珍しいと捉えるのか」という仮定を検討することなしに、この種の検討を行うことは危険である。この検討は、後日の課題としたい。


 木下氏の紹介するような種類の現象を理解するには、「同じ学級に同じ誕生日の生徒がいる確率はいくらか」という問題に類似した、直感に反しがちな計算を行う必要がある。この問題は、「誕生日のパラドックス」と呼ばれている※a。この問題は、「個別の出来事としてはありそうにないことでも、多数について起こりうることについては、速断するのは危険である」という、数値を取り扱う上での注意点を教えてくれる。

 一年のうちという条件を付せば、ある高校において、学生と教員がそれぞれ一人以上亡くなるという現象は、日本全体で見れば、特に珍しいことではない。少し古い情報だが、平成24年の学校基本調査※2を参照し、高校だけを抜き出すと、高校は5022校あり、高校一校当たりの学生の平均人数は、次表のとおり、669人である。また、25歳から64歳までの5歳年齢階級に教員が均等に分布すると仮定すると、次表に示したとおり、各階級に6名ずつが分布することになる。「組織としての安定性を重視するために、偏りのない年齢構成となる」と仮定することには問題がないので、この仮定を採用する。各年齢階級における10万人当たり死者数は、人口動態統計※3から、次表のとおりである。これらの数値を利用すると、各年齢階級の成員の全員が一年のうちに心疾患で亡くならない確率は、次表のとおりに計算されることになる。

表:わが国の平均的な高校において学生と教員が心疾患で死亡しない確率
五歳
年齢
階級
成員

種別
高校一校
当たりの
平均人数
$N$
10万人
当たり
死者数※4
$d$
全員が心疾患で
死亡しない確率
$\bar{p}$
15~19歳学生66910.9933322950
25~29歳教員62.70.9998380109
30~34歳教員64.50.9997300304
35~39歳教員67.40.9995560821
40~44歳教員613.30.9992022653
45~49歳教員621.80.9986927127
50~54歳教員633.80.9979737129
55~59歳教員652.10.9968780688
60~64歳教員682.10.9950840996

※4 厚生労働省の死因分類表における「09200 心疾患(高血圧性除く)」を利用した。


 各行の末尾にある計算式(各年齢階級の成員の誰もが心疾患で死亡しない確率)は、次式で表せる。\[(1 - \dfrac{d}{100000})^N\]教員については、各階級で求められた$\bar{p}$を乗算すると、教員の誰もが一年の間に心疾患で亡くならない確率となる。その値は、0.9989120686...である。教員の1名以上が亡くなる確率$p_b$は、教員の誰もが心疾患で亡くならない余事象の確率であるので、\[p_b = 1 - 0.9989120686...= 0.00108793...\]である。学生が1名以上亡くなる確率$p_a$は、前表に掲げた$\bar{p}$に相当する事象の余事象の確率であるので、\[p_a = 0.006667705...\]となる。

 以上から、わが国の平均的な高校一校において、一年のうちに、教員と学生がそれぞれ1名以上心疾患で亡くなる確率は、\[p_a \times p_b = 7.25401 \times 10^{-6}\]となる。ここでは、Excelを用いて、対数変換せずに計算しているものの、計算の精度が問題となることはないであろう※b。高校一校で、教員と学生がそれぞれ1名以上心疾患で亡くならない確率は、$0.9999927460...$となる。10万分の7というきわめて小さな数値である。しかしながら、全国には5000校ほどの高校があるので、全国の高校すべてについて、教員と学生が1名以上同時に亡くならないが確率は、$0.9642258305...$となる。念のため、計算式は、\[0.9999927460...^5022 = 0.9642258305...\]である。全国のいずれかの高校において、教員と学生が1名以上同時に亡くなる確率は、べき乗で計算されるので、単に5000倍する場合に比べて、一桁確率が高いものとなる。$0.0357741695...$、つまり$3.58\%$である。この数値は、解釈が人によって異なる程度の大きさである。伝統的な統計学的検定では、危険率を$\alpha = 0.05$に設定する。今回の結果は、何かおかしなことが生じたと解釈する数値になる。



※a 私は、この種の問題を解く方法を、高校生のときにも、大学の学部生のときにも統計の授業で学習したが、このように呼ばれていたことは知らなかった。この問題では、クラスの人数が367名(閏年の場合を含める)を超えると、「鳩の巣原理」が適用されるため、2名以上が必ず同じ誕生日であることになる。100%が保証される閾値よりも相当小さな人数で、2名以上が同じ誕生日を持つ確率が増えることが、「パラドックス」という名を付された理由であるという。「鳩の巣原理」のもう一つの呼び方である「ディリクレの箱入れ原理」は、高校の数学の先生に教えてもらった(ような)記憶がかろうじて残っている(ような)。「鳩の巣原理」は、1963年にハーレス・ジェウェットの両氏によって、一般化されている。

鳩の巣原理 - Wikipedia
https://ja.wikipedia.org/wiki/%E9%B3%A9%E3%81%AE%E5%B7%A3%E5%8E%9F%E7%90%86

統計局ホームページ/日本の統計 2014-第22章 教育
http://www.stat.go.jp/data/nihon/back14/22.htm

22-1 学校教育概況(エクセル:33KB)
http://www.stat.go.jp/data/nihon/back14/zuhyou/n2200100.xls


統計表一覧 政府統計の総合窓口 GL08020103
(人口動態調査>人口動態統計>確定数>死亡>年次>2012年)
http://www.e-stat.go.jp/SG1/estat/List.do?lid=000001108739

5-16 性・年齢別にみた死因簡単分類別死亡率(人口10万対)
http://www.e-stat.go.jp/SG1/estat/Csvdl.do?sinfid=000022220057
A186行(M186:V186)

※b 私の実力の浅さゆえ、1年当たりという死亡率を1日単位に変換する作業を、対数変換抜きにExcelで計算して良いかどうか、即答できない。十中八九、対数変換して計算すべきであろうし、そうすれば問題ない精度の数値が得られるであろうことに対しては、自信を持っている。

0 件のコメント:

コメントを投稿

コメントありがとうございます。お返事にはお時間いただくかもしれません。気長にお待ちいただけると幸いです。