ヤバい統計/著者:ジョージナ・スタージ

※ 毎朝、5分以内で読める書籍の紹介記事を公開します。

※そのままの文章ではありませんが、試し読みする感覚でお楽しみください。

書籍情報

タイトル

ヤバい統計

政府、政治家、世論はなぜ数字に騙されるのか

発刊 2024年 1月31日

ISBN 978-4-08-737003-4

総ページ数 367p

著者

ジョージナ・スタージ

統計学者。公共政策の計量的分析を専門にしています。
英国国家統計局の人口・移民統計に関する諮問委員です。

出版

集英社

もくじ

  • はじめに
  • 第一章 人々
    • 把握されている人、されていない人
    • 予想もつかない変化
    • 少ない数がもたらす問題
    • 回答しているのはどんな人?
    • 頭のなかを数える
  • 第二章 質問する
    • 決して簡単なことではない
    • あなたは自分自身をコーンウォール人だと思っていますか?
    • あなたの裁量にお任せします
    • 解決策は、何を問題にするかで決まる
  • 第三章 概念
    • 概念と現実のはざまで
    • 散らかった世界を整頓する
    • それだけの価値があるから
    • すべてを得ることの価値と、すべてを手放すことの代償
  • 第四章 変化
    • 手短に言えば
    • 変化を変化とみなすべきではなきのは、どのような場合か
    • 何事も関連づけて比較する
  • 第五章 データなし
    • 無知は至福、ではない
    • 尋ねる自由
    • 穴だらけのパッチワーク
    • 数えられないものを数える
    • 知らないほうがいい?
  • 第六章 モデル
    • 私たちを導いてくれる見取り図
    • 賢さが鼻につく
    • 「バッドデータ」を入力すれば、「バッドデータ」が出力される
    • 機械の時代における責任とは
  • 第七章 不確かさ
    • 優柔不断さが許されない国
    • 何か効果的な手はあるはずだ
    • 原因と結果
    • うまくバランスを取る
  • おわりに

紹介

 統計学の奥深さとその誤用がもたらす危険性を解き明かす一冊です。

 統計がどのように私たちの日常生活に影響を及ぼしているか、そしてそれがどのようにして誤解や悪用される可能性があるかを、具体的な例とともに紹介しています。

  • 平均値の誤解
    • 統計の平均値が、実際には大多数の人々の状況を反映していない場合があります。例えば、収入の平均値が高いと聞いても、それは少数の高額所得者が平均を引き上げている可能性があり、多くの人々の実際の収入とは異なるかもしれません。
  • 因果関係と相関関係の混同
    • データにおいて、二つの事象が同時に発生する相関関係がある場合でも、それが因果関係を意味するわけではありません。例えば、アイスクリームの消費量が増えると同時に水難事故が増えるというデータがあったとしても、アイスクリームが事故を引き起こしているわけではなく、両者は気温の上昇という共通の要因によって影響を受けている可能性があります。
  • サンプルサイズの無視
    • さなサンプルサイズで得られたデータをもとに、大きな一般化を行うことは危険です。少数の観察結果から得られた結論が、全体の傾向を正確に反映しているとは限りません。
  • 選択バイアス
    • データを収集する際に特定のグループや事象を意図的または無意識的に選択することで、結果が歪められる可能性があります。例えば、オンライン調査では、インターネットを利用できる人々に偏ってしまうことがあります。

 統計学の基礎から応用までを平易な言葉で説明し、読者が統計的思考を身につけることを目指しています。データが支配する現代社会において、真実を見極め、より良い判断を下すための必読書です。

散らかった世界を整頓する

 きれいにまとめられた図式は、現実から乖離していることもあります。

 収入がなくても、必ずしも貧困状態に陥っているとは限りません。多くの人は、収入が減ったときでも生活を維持できるよう貯金をしています。

 書類上では「貧しい」ように見えても、すでに住宅ローンを払い終え、もう旅行もしなくなったので、なんの不自由もなく生活していけるという例もあります。

 不思議なことに、標本調査では、「あなたは自分が貧しいと思うか」「貧困にあえいでいるか」などとは、まず問われません。

 貧困についての定義の境界線は曖昧です。けれど、額面通りの測定結果に現実がなっているかの判断は簡単にできるでしょう。

 幸福度の調査結果では、英国の自殺率がヨーロッパの中で高いほうの地域が、世界で最も幸福であるとされています。この結果をうのみにするわけにはいきません。

関連づけて比較する

 何かを比べるときは、別の何かと関連づけることが役立つ場合が多いです。

 経済学者たちが国同士を比較するときは、GDPと人口を関連付けます。「一人当たりのGDP」といった相対的な指標を見たりもするのです。

 また、経済時に比較するときには、金額と固定する何かをつくっていることもあります。1908年年間平均収入が約70ポンドだと聞いたら、読者はなんとなく今とは価値が異なることを認識するはずです。

 注意してほしいのは、新たなものの見方を提供してくれる方法が、統計データよりも筋が通ったものにするために役立つわけではない点です。「15秒ごとに、1人の子どもが飢えで亡くなっている」というのは、現実味が欠けています。

 実際に等間隔で飢餓を起こすわけではなく、凶作や、保存していた食料が異常気象でだめになった事態のあとに起きています。

 国連児童基金(UNICEF)によると、全世界のこども4人に1人は出生時に登録をしていないとのことです。データでは存在していないので、死亡しているかどうかもわかりません。新型コロナウイルスで亡くなった人の数が掴めていない国が多いのです。それどころか、だいたいの人口も掴めていません。

 誤ったデータをもとに「(貧困や犯罪、死亡率など)問題が解決された」とあれば、地域への投資がおろそかになってしまいます。

モデル

 アルゴリズムを使う機械は、封をされた箱のなかで全ての作業をこなします。

 統計モデリングやアルゴリズムには、計り知れない力が備わっているので、正しく利用すれば、何十億個ものデータポイントを瞬時に分析できるでしょう。

 しかし、現実を反映していないモデルは、正確な答えを人間に与えてくれません。現実では成り立たない仮説に依存しているアルゴリズムは、優れた判断を下せないはずです。

 機会に与えられたデータが、特定の人口集団が除外されたデータ、時代にそぐわない古いデータ、目的との関連性が薄いデータ、当てにならない予測に基づいたデータであれば、でてくる結果もひどいものになる可能性があります。

 私たちがモデルや機械の仕組みを理解していなければ、それらがいつどこで間違えるのかを把握できません。

不確かさ

 自分がロボットに取って代られてしまうのではいか、と気にしている人はいません。けれど、「20年後にも存在している仕事は?」「世界の製造業での作業はAIに取って代わる」などの新聞の見出しに不安を覚えるのも事実です。

 大半の人がロボットに仕事を奪われるという主張には、多くの不確かな要因が存在しています。これらの記事の見出しに使用された統計データは、オックスフォード大学のカール・フレイとマイケル・オズボーンの研究データです。

 この研究は、特定の作業において取って代わると機械学習アルゴリズムが判断したというものです。そこに、オートメーション化のリスクを含む職業に従事している人がどのくらいいるかを調べたものになっています。

 この手法に似た調査で、さまざまなデータが細かく調査されたが、きわめて曖昧なものになっている可能性あるのです。どこまでやっても、具体的な数字が確かなものであるという保証はありません。

 こうした精密さを欠くデータが、「2億人の気候難民」「政府債務危機を呼ぶ平時の累積債務リスク」などの議論を出します。

 警察、教育、国際開発といった曖昧な要因が多い分野では、問いに答えるときに常に注意が必要です。学者、公務員、政治家が自信をもって結論を急ぐのは、明確な動機があります。そのようなやり方には抵抗しなければなりません。

購入リンク

amazon

電子

amazon

(Visited 2 times, 1 visits today)
関連記事

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です