『統計はこうしてウソをつく』 (ジョエル・ベスト,白揚社)


 この本で取り上げているのは社会学的統計,つまり,失業者の数とか,結婚しない理由の調査とか,交通事故原因の統計などである。そして,アメリカでの実例を挙げ,人はどのようにして間違ったデータを作り上げるか,間違ったデータが一人歩きするのはなぜか,間違ったデータが真実として流布しているのはなぜかなどについて,実例を挙げて鋭く追求している。


 何がおかしい統計(数字)を生み出すのだろうか。それにはさまざまな要因が絡んでいる。最初から相手を騙すために巧妙に作られたウソデータもある。誠実な人が誠実だからこそ作ってしまったウソもある。集めたデータは正しいのに判定が間違ったために生じるウソもある。データは正しいのに,それを伝える側が間違って伝えることもある。そもそも比較すべきでないデータ同士を比較して生み出されたウソもある。

 たとえば,社会活動の活動家(例:麻薬蔓延を防ごう,交通事故死を減らそう,外国人犯罪が社会不安の原因だ・・・などの問題に警鐘を鳴らしている人たち)は,自分が取り組んでいる問題を重要なものだと伝えたいために,根拠もないのについ過大な数字を発表してしまうことがある。彼らは個人的には善人だし,恐らく誠実な人だろう。だからこそ,それらの問題を解決して社会を少しでも良くしようとする熱意のあまり,つい無意識のうちにウソをついてしまうのだ。決して悪意のあるウソではないのだ。だから,彼はそれを悪いとは思っていないし,自分がウソをついているという自覚すらないだろう。そして,そのようにして生まれた数字は報道され,引用されることでいつの間にか事実として一人歩きする。

 また,社会問題では,定義自体(何をもって交通事故死とするか,何をもって外国人とするかなど)に問題があり,数を数える時点で既にウソが入り込む。


 これは社会問題に限らない。医学でも十分に起こりうるはずだ。たとえば,「うがいは風邪の予防に有効か?」という命題について,「うがい群と非うがい群をそれぞれ200人で行い,それを冬の3ヶ月間調べ,データを解析したところ,有意にうがい群で風邪が少なかった」というデータが出たとしよう。ここではどこでウソが入り込むだろうか。

 恐らく,「誰が風邪だと診断したのか」,「どのようにして風邪と判定したのか」,「風邪の診断は毎日行ったのか」,「そもそも,被験者自身に,自分がうがい群か非うがい群かがわかってしまうが,それは結果に影響していないか」あたりが怪しい。

 このような研究を計画するとしたら,どこが一番大変だろうか。恐らく「風邪の診断」の部分である。
 被験者400人を毎日自分一人で診断すれば診断基準の問題さえクリアできれば,「風邪をひいた人の数」はかなり正確なものといえるだろう。だがこれは実際上不可能であり,非現実的だ。400人の人間を一人で毎日診察していたら,3ヶ月間,全く他の仕事ができなくなってしまう。これでは生活ができない。
 では,自分が教育したスタッフに毎日彼らの自宅などに往診してもらうのはどうか。これなら正確さはやや落ちるがまだ許容範囲だろう。しかし,スタッフの移動にかかる交通費などの費用が膨大になる。
 では,毎日患者さんに電話して「あなたは今日風邪をひきましたか?」とインタビューする方式はどうだろうか。これは楽な方法だが,「風邪の診断」という一番基本のところを素人の判断に委ねてしまうことになり,信頼度はかなり小さくなる。
 もっとも手軽な方法は,3ヵ月の実験終了時に電話か手紙で「あなたはこの3ヶ月間で風邪をひきましたか?」と尋ねる方法だ。もっとも手軽な方法だが,風邪の診断を素人に委ね,しかも,患者の記憶が頼りである。要するに最も手軽だが,最もいい加減なデータしか出てこない。

 あなたなら,どの方法を選ぶだろうか?


 また,定義(診断基準,判断基準)の問題も難しい。「ある治療法の効果を発熱の有無で検討」したとしよう。その際の発熱の基準は多分,38℃とか38.5℃ということになるはずだ。一見すると,数字で判定しているから正確に思える。しかし,37.9℃と38.0℃の間で線を引いてよいという理論的根拠はない。あくまでも恣意的なものである。

 同様の問題は,社会問題となるとさらに深刻になる。本書でも取り上げられている「家出少年の数」がそのよい例だ。「家出」の定義,判定基準がないからだ。
 「こんな家,出てやる!」と家を飛び出したが,数時間後に帰ってきた,というのは家出だろうか,家出ではないのだろうか。24時間帰ってこないものを家出と判断すればいいのだろうか,1週間帰ってこないものを家出とすればいいのだろうか。
 結局,家出問題を社会問題として取り上げたいと思っている人は「数時間でも家出は家出」として大きな数字を出すだろうし,一方,数日程度の家出は若者にありがちな普通の行動で問題視すべきでない,と考える人は「1週間家に帰ってこないものが家出だ」と統計を取るはずだ。このような現象は,フリーターの数,失業者の数などでも同様だろう。数字なんて,いくらでも作れるのである。同じ集団から,異なる望みどおりの数字が作れるのである。


 判断基準が変わってしまうのも困るが,判断基準を変えなければいいという訳でもない。たとえば,固定電話の普及率で社会の変化を探ろうという調査をしていたら,いつの間にか携帯電話が普及して固定電話が少なくなり,データ自体が意味を持たなくなった,なんていうのがそれだ。コホート・スタディには,このような問題が常に付きまとっているはずだ。


 ではどうしたらいいのか。簡単である。数字を鵜呑みにしないことだ。数字を見たら疑ってみることだ。マスコミや政治家がある数字を根拠に何かを言っていたら,そこには彼らの意図が隠されていることを見抜くべきだ。その数字を出した根拠を可能な限り再検討すべきだ。本書でもそれを提唱しているし,私もそうすべきだと思う。そしてこれは,医学論文でも同様だろう。
 生き方の基本は性善説でいいが,論文を読むときは性悪説でなければいけない。

 社会全体を見渡すためには,数値化は絶対に必要だ。フリーターが日本全体で50万人いるのか500万人いるのかでは,対策のたて方がまるで違うからだ。だから数字は必要だ。しかし,フリーターの判定基準そのものが曖昧だから,いくらでも望ましい数字は作れてしまう(例:フリーター支援の活動家ならフリーターは多いほうが望ましいし,政府にとっては少ない方が嬉しい)。だから,「フリーターの数」のような数字がマスコミで報じられたら,可能な限りその判定基準を確かめてみてそれが妥当なものかどうかを自分で判断すべきだ。

 もちろん,それを実践するのは極めて困難,あるいは不可能かもしれないが,数字に騙されないためにはそれしか方法がない。少なくとも,自分の仕事である医学分野の数字や論文に対しては,このような「性悪説的検証」は忘れないようにしようと思う。


 本書でも指摘しているが,どんな統計にも欠陥があり,間違いのない統計は存在しない。問題は,統計の欠陥が統計の有用性を損なうかどうかというバランス感覚だ。
 人間が社会で生きていく以上,利害関係の対立は必ず生じる。その利害関係の妥協点を見出さなければ殺し合いの世界になる。その妥協のためには話し合いが必要であり,その話し合いの根拠はの一つが統計だろう。しかし,立場の違いがある以上,数字はどうにでも操作できる。だから,数字を鵜呑みにするのでなく,自分でその価値を判断しなければいけない。私たちに必要なのは,このような考え方なのだろうと思う。

 要するに,統計の数字はなくてはならないが,それは必要悪なのである。生きていくためには喰わなければいけないが,必ず毒成分が含まれている食物みたいなものである。だから私たちは,毒成分が含まれていることを前提に,注意深く食べなければいけないのだ。

(2006/06/21)

 

読書一覧へ

Top Page