※本ブログおよび掲載記事は、Google、Amazon、楽天市場のアフィリエイト広告を利用しています。
2017年の出版だが、内容は未だ古くない。語り口は平易で内容は網羅的、因果推論の初学者がその全体を理解するのに適した一冊だ。
詳細な目次は下記にあるが、おおよその内容は、因果推論について相関関係と因果関係の違いからその必要性を説きおこし、因果推論の具体的内容については、ランダム化比較実験、自然実験、擬似実験(差の差分析、操作変数法、回帰不連続デザイン、マッチング法、回帰分析)の解説が簡潔に書いてある。
各項目には1章ずつ割り当ててあり、その考え方、前提条件、代表的な研究事例という構成で統一されている。簡潔さとともにこの各章共通の構成で書かれているのも本書の理解しやすさをもたらしている。
構成は以下の通り。
- はじめに
- メタボ健診を受けていれば長生きできるのか
- テレビを見せると子どもの学力は下がるのか
- 偏差値の高い大学へ行けば収入は上がるのか
- 「因果推論」を理解すれば思い込みから自由になれる
- 第1章 根拠のない通説にだまされないためにー因果推論の根底にある考えかたー
- 「因果推論」「相関関係」とは何か
- 因果関係を確認する3つのチェックポイント
- 1.「まったくの偶然」ではないか
- 2.「第3の変数」は存在していないか
- 3.「逆の因果関係」は存在していないか
- 因果関係を証明するのに必要な「反事実」
- タイムマシンがないと反事実は作れない?
- 反事実を「もっともらしい値」で穴埋めする
- 「比較可能」なグループでないと穴埋めできない
- 反事実を正しく想像できないと根拠のない通説にだまされる?
- コラム:チョコレートの消費量が増えるとノーベル賞受賞者が増える?
- 第2章 メタボ健診を受けていれば長生きできるのかー因果推論の理想形「ランダム化比較実験」ー
- 第3章 男性医師は女性医師より優れているのかーたまたま起きた実験のような状況を利用する「自然実験」ー
- 手元にあるデータを用いて、実験のような状況を再現する
- 「医師の性別」と「患者の死亡率」のあいだに因果関係はあるか
- 女性医師が担当すると患者の死亡率が低くなる
- 「出生時体重」と「健康」のあいだに因果関係はあるか
- 出生時体重が重い赤ちゃんは健康状態が良い
- コラム:受動喫煙は心臓病のリスクを高めるのか
- 第4章 認可保育所を増やせば母親は就業するのかー「トレンド」を取り除く「差の差分析」ー
- 第5章 テレビを見せる子どもの学力は下がるのかー第3の変数を利用する「操作変数法」ー
- 新聞の広告料割引キャンペーンを利用する
- 操作変数法が成立するための2つの前提条件
- 「テレビの視聴」と「学力」のあいだに因果関係はあるか
- テレビを見ると偏差値が上がる
- 「母親の学歴」と「子どもの健康」のあいだに因果関係はあるか
- 母親が大卒だと生まれてくる子どもの健康状態が良い
- コラム:女性管理職を増やすと企業は成長するのか
- 第6章 勉強ができる友人と付き合うと学力は上がるのかー「ジャンプ」に注目する「回帰不連続デザイン」ー
- 「49人の店舗」と「50人の店舗」の違いを利用する
- 回帰不連続デザインが成立するための前提条件
- 「友人の学力」と「自分の学力」のあいだに因果関係はあるか
- 学力の高い友人に囲まれても自分の学力は上がらない
- 「高齢者の医療費の自己負担割合」と「死亡率」のあいだに因果関係はあるか
- 高齢者の医療費の自己負担割合が増えても死亡率は変わらない
- コラム:「ホルモン補充療法」の罠
- 第7章 偏差値の高い大学に行けば収入は上がるのかー似た者同士の組み合わせを作る「マッチング法」ー
- 似かよった店舗を探しだす
- 複数の共変量をひとまとめにする
- 「プロペンシティ・スコア・マッチング」
- プロペンシティ・スコア・マッチングが成立するための前提条件
- 「大学の偏差値」と「収入」のあいだに因果関係はあるか
- 偏差値の高い大学に行っても収入は上がらない
- コラム:ビジネス版ランダム化比較実験「A/Bテスト」
- 第8章 ありもののデータを分析しやすい「回帰分析」
- 因果関係の評価に適さないデータしかない時は・・・
- データを表現する「最適な線」を引く
- 交絡因子の影響を取り除いてくれる「重回帰分析」
- コラム:因果推論はどのように発展してきたか
- 補論① 分析の「妥当性」と「限界」を知る
- 補論② 因果推論の5つのステップ
- おわりに
本書を通読して、因果推論の全体像を掴んだら、自分の問題意識に基づいて実際に因果推論を実行してみることが大切だ。補論②に因果推論の5つのステップが簡潔にまとめらており、それを具体的なデータで進めていくことになる。実際の推計等の記載は本書にはないので、他の実証分析系の書籍*1を読む必要があるが、考え方は本書でわかる。
本書を読むと因果推論の考え方、やり方、その前提や限界まで理解できる。そしてその最後の最後で考えるのは、やはりデータの大切さだ。そのデータの出所、取得方法、取得時期などデータについての5W1Hの理解はデータの癖を知るという点で必須だろう。その上でデータを観察し、そのデータの特徴を抽出することがポイントになる。そこまでして自分の研究課題の分析にあたって因果推論を応用するのにそのデータが適切か否かの判断ができるようになる。
データを知るとともに、ランダム化比較実験、自然実験、擬似実験などの手法のどれが採用できるのかを慎重に見極める力をつけないと行けない。本書で理解できるのはその最初の入り口であり、自分のものにするためにはさらに専門書を読まなければならないし、経験を積まないといけないだろう。だからと言って、手をこまねいていてはいつまでたってもマスターできないので、本書を読んだらまずは自分の問題意識に因果推論の方法を当てはめて実際に分析してみることだろう。それを仲間や先生に見てもらい、議論して理解を深めていくプロセスが大切になる。