9年前にやってみた高速道路の料金政策の変更とそれによる交通量の変化に関するデータ分析。当時、高速道路料金の無料化が民主党マニュフェスト(最近全く聞かなくなったw)で取り上げられ、完全無料化を目指し、その効果と実効可能性を検証するために一部実施された社会実験(この言葉も聞かなくなった)*1の効果を分析した。実験期間は、平成22(2010)年6月28日(月)から平成23(2011)年6月20日(月) 午前0:00であった。
高速道路無料化の政府等の状況を伝える日経新聞の記事。
この高速料金の社会実験について、2014年にデータ分析したのが、下記の5つのブログ記事だ(最初の記事は除く)。当時は、STATAを使って分析したが、これを今回はR言語を使い、その後のデータを加えて再分析してみようと思う。
やることは以下の3つ。
- 1つは、前回と全く同じ推定方法、モデルで結果が変わっているかを検証。
- 2つは、前回の分析は因果推論の観点からどう評価されるかを検討。
- 3つは、機械学習で予測モデルを構築し予測してみる。
過去の記事を簡単に紹介する。
2010年8月の記事は自分の生活の中で高速道路料金の値下げで、新幹線を高速と代替して利用し始めている様子が書かれている。当時、深夜割引料金を上手く使うと新幹線の半額で行けたようだ。燃料費を入れると半額とはいかなかったと思うが、安くなったことはなった。
それから4年経ち本格的に分析し始めたのがこちらの記事。データ期間は、前年比を使い2004年10月まで遡り2014年3月までとなっている。今回は、データ期間が2023年6月まで伸びる。データ数は114ポイントから225ポイントに増える*2。その後の状況も視野に入れた分析になる。
ここでは、データの観察と3C、PEST分析をざっと実施している。そこで分析の視点を検討し、対象を絞っている。入手・入力したデータは、pdfファイルであったので、スクレイピング*3や電子データで読み込むような作業はなく、全て手入力で行ったと記憶している。今回も同じだ。
ここからいよいよ計量分析に入っていく。STATAを使ってまずはシンプルなモデル(トレンド項と月次ダミー)で交通量の変動をトレンド項と季節ダミーでどれだけ説明できるか検証している。
次に高速道路料金の指数を導入することにより、シミュレーション用のモデルを推定した。重回帰モデルでの推定は、決定係数は改善し、料金指数の付合条件もよし、ダミー変数もそれぞれ有意だ。これで料金シミュレーションを実施していく。
当時の推定されたモデルを使えば、料金の変更がどの程度交通量に影響するかは分析できる。従来ならその結果で政策を議論する一つの情報として使っただろう。しかし因果推論としてここでは料金が原因で結果としての交通量の変動を捉えているといえるのかという視点が出てくる。交通量と料金の間の因果関係を計測したことになるのかどうか。ここをクリアしないと政策の議論には一つの証拠としては使えない。この辺りは検討材料となる。
9年前はまだ因果推論の議論も自分はまだ知らなかったこともあり、その前で一応の結論を出しているが、今回はそこまで分析、検討できればと考えている。さてどうなりましょうか。
参考文献としては以下の書籍を考えている。
計量経済学はこちら。
因果推論(効果検証)についてはこちら*4。
さらに、機械学習を使った予測はこちらの書籍をまずは読んでみる。他に適切な書籍があれば随時更新。
さて、なるべく前倒しでやっていきたいがどうなりましょうか。
それでは引き続きよろしくお願いします。