データ分析の力 因果関係に迫る思考法

先日読了。

データ分析の力 因果関係に迫る思考法 (光文社新書)

データ分析の力 因果関係に迫る思考法 (光文社新書)

かなりの良書。技術啓蒙書の見本のようなスタイルで、興味を維持しつつ読み進められ、新しい知識が身につく。
データの相関関係と因果関係の違いと、因果関係を証明するための基本的な手法を説明。
因果関係は介入効果で判断する。介入グループと比較グループでの差異か介入効果。比較グループのデータを得るのをおろそかにしている実験が多い。
ランダム化比較実験(RCT: Randomized Controlled Trial)、RCTが不可能な場合の自然実験、自然実験の代表例としての、境界線を使うRDデサイン(例として高齢者の医療費自己負担額と医療サービス利用の因果関係を、健保自己負担率が変わる年齢境界の変化で定量説明)、階段状の変化を使う集積分析(例として自動車重量税と自動車重量の分布の因果関係を定量説明)、複数期間のデータを使うパネル・データ分析(例として税制変更と移民の因果関係を定量説明)。
縦軸を対数でとると、小さい差では縦軸数値差が比率差になって便利。内的妥当性と外的妥当性。RCTは内的妥当性が非常に強いが、外的妥当性は弱い。RDデサインと集積分析は内的妥当性はそこそこだが、外的妥当性は境界付近に限定。パネル・データ分析は内的妥当性は弱いが、外的妥当性は強く、介入グループ全体で成立する。
データ分析の限界、データ自体に問題がある(RCTを行う上できちんと乱択されていない等)、外的妥当性、出版バイアス(面白い結果のみ論文化される)やパートナーシップバイアス(実験パートナーの能力や意向が影響)、介入の波及効果が比較グループにも及んでいる、一般均衡すなわち介入効果が長期的には打ち消す効果が出てしまう。
参考図書、原因と結果の経済学、実証分析のための計量経済学計量経済学の第一歩、実証分析入門、Wooldbridge: Introductory econometris: A modern approach.