そこで、本稿では、遅ればせながら、冒頭の木下氏の主張に焦点を合わせ、木下氏の主張が一種の早とちりではないのか、という可能性を追究することとしたい。あらかじめ本稿における検討結果を述べておく。「一年のうち」という、一晩に比べて長い期間を仮定しても、全国の高校のうち、ある高校一校以上において、学生と教員のそれぞれが一名以上、心疾患で亡くなるという事態は、3.58パーセントという比較的小さな確率に留まる。よって、この現象は、珍しいものと考えて良い、という結果を得た。ただし、「どのような死因を珍しいと捉えるのか」という仮定を検討することなしに、この種の検討を行うことは危険である。この検討は、後日の課題としたい。
木下氏の紹介するような種類の現象を理解するには、「同じ学級に同じ誕生日の生徒がいる確率はいくらか」という問題に類似した、直感に反しがちな計算を行う必要がある。この問題は、「誕生日のパラドックス」と呼ばれている※a。この問題は、「個別の出来事としてはありそうにないことでも、多数について起こりうることについては、速断するのは危険である」という、数値を取り扱う上での注意点を教えてくれる。
一年のうちという条件を付せば、ある高校において、学生と教員がそれぞれ一人以上亡くなるという現象は、日本全体で見れば、特に珍しいことではない。少し古い情報だが、平成24年の学校基本調査※2を参照し、高校だけを抜き出すと、高校は5022校あり、高校一校当たりの学生の平均人数は、次表のとおり、669人である。また、25歳から64歳までの5歳年齢階級に教員が均等に分布すると仮定すると、次表に示したとおり、各階級に6名ずつが分布することになる。「組織としての安定性を重視するために、偏りのない年齢構成となる」と仮定することには問題がないので、この仮定を採用する。各年齢階級における10万人当たり死者数は、人口動態統計※3から、次表のとおりである。これらの数値を利用すると、各年齢階級の成員の全員が一年のうちに心疾患で亡くならない確率は、次表のとおりに計算されることになる。
表:わが国の平均的な高校において学生と教員が心疾患で死亡しない確率
五歳 年齢 階級 | 成員 の 種別 | 高校一校 当たりの 平均人数 $N$ | 10万人 当たり 死者数※4 $d$ | 全員が心疾患で 死亡しない確率
$\bar{p}$
|
---|---|---|---|---|
15~19歳 | 学生 | 669 | 1 | 0.9933322950 |
25~29歳 | 教員 | 6 | 2.7 | 0.9998380109 |
30~34歳 | 教員 | 6 | 4.5 | 0.9997300304 |
35~39歳 | 教員 | 6 | 7.4 | 0.9995560821 |
40~44歳 | 教員 | 6 | 13.3 | 0.9992022653 |
45~49歳 | 教員 | 6 | 21.8 | 0.9986927127 |
50~54歳 | 教員 | 6 | 33.8 | 0.9979737129 |
55~59歳 | 教員 | 6 | 52.1 | 0.9968780688 |
60~64歳 | 教員 | 6 | 82.1 | 0.9950840996 |
※4 厚生労働省の死因分類表における「09200 心疾患(高血圧性除く)」を利用した。
各行の末尾にある計算式(各年齢階級の成員の誰もが心疾患で死亡しない確率)は、次式で表せる。\[(1 - \dfrac{d}{100000})^N\]教員については、各階級で求められた$\bar{p}$を乗算すると、教員の誰もが一年の間に心疾患で亡くならない確率となる。その値は、0.9989120686...である。教員の1名以上が亡くなる確率$p_b$は、教員の誰もが心疾患で亡くならない余事象の確率であるので、\[p_b = 1 - 0.9989120686...= 0.00108793...\]である。学生が1名以上亡くなる確率$p_a$は、前表に掲げた$\bar{p}$に相当する事象の余事象の確率であるので、\[p_a = 0.006667705...\]となる。
以上から、わが国の平均的な高校一校において、一年のうちに、教員と学生がそれぞれ1名以上心疾患で亡くなる確率は、\[p_a \times p_b = 7.25401 \times 10^{-6}\]となる。ここでは、Excelを用いて、対数変換せずに計算しているものの、計算の精度が問題となることはないであろう※b。高校一校で、教員と学生がそれぞれ1名以上心疾患で亡くならない確率は、$0.9999927460...$となる。10万分の7というきわめて小さな数値である。しかしながら、全国には5000校ほどの高校があるので、全国の高校すべてについて、教員と学生が1名以上同時に亡くならないが確率は、$0.9642258305...$となる。念のため、計算式は、\[0.9999927460...^5022 = 0.9642258305...\]である。全国のいずれかの高校において、教員と学生が1名以上同時に亡くなる確率は、べき乗で計算されるので、単に5000倍する場合に比べて、一桁確率が高いものとなる。$0.0357741695...$、つまり$3.58\%$である。この数値は、解釈が人によって異なる程度の大きさである。伝統的な統計学的検定では、危険率を$\alpha = 0.05$に設定する。今回の結果は、何かおかしなことが生じたと解釈する数値になる。
※a 私は、この種の問題を解く方法を、高校生のときにも、大学の学部生のときにも統計の授業で学習したが、このように呼ばれていたことは知らなかった。この問題では、クラスの人数が367名(閏年の場合を含める)を超えると、「鳩の巣原理」が適用されるため、2名以上が必ず同じ誕生日であることになる。100%が保証される閾値よりも相当小さな人数で、2名以上が同じ誕生日を持つ確率が増えることが、「パラドックス」という名を付された理由であるという。「鳩の巣原理」のもう一つの呼び方である「ディリクレの箱入れ原理」は、高校の数学の先生に教えてもらった(ような)記憶がかろうじて残っている(ような)。「鳩の巣原理」は、1963年にハーレス・ジェウェットの両氏によって、一般化されている。
鳩の巣原理 - Wikipedia
https://ja.wikipedia.org/wiki/%E9%B3%A9%E3%81%AE%E5%B7%A3%E5%8E%9F%E7%90%86
統計局ホームページ/日本の統計 2014-第22章 教育
http://www.stat.go.jp/data/nihon/back14/22.htm
22-1 学校教育概況(エクセル:33KB)
http://www.stat.go.jp/data/nihon/back14/zuhyou/n2200100.xls
統計表一覧 政府統計の総合窓口 GL08020103
(人口動態調査>人口動態統計>確定数>死亡>年次>2012年)
http://www.e-stat.go.jp/SG1/estat/List.do?lid=000001108739
5-16 性・年齢別にみた死因簡単分類別死亡率(人口10万対)
http://www.e-stat.go.jp/SG1/estat/Csvdl.do?sinfid=000022220057
A186行(M186:V186)
※b 私の実力の浅さゆえ、1年当たりという死亡率を1日単位に変換する作業を、対数変換抜きにExcelで計算して良いかどうか、即答できない。十中八九、対数変換して計算すべきであろうし、そうすれば問題ない精度の数値が得られるであろうことに対しては、自信を持っている。
0 件のコメント:
コメントを投稿
コメントありがとうございます。お返事にはお時間いただくかもしれません。気長にお待ちいただけると幸いです。