ある時系列データを使って予測している。それで機械学習を使うのだが・・・実証分析の経験があるものにとって、まず最初に疑問に思うのが、機械学習での予測というのは、計量経済学でのそれと何がどう違うのかという点だ。
これまで自分は計量経済学の手法、多くは経済理論に基づいたモデルを使って重回帰分析、マイクロデータを利用する際は、Logitモデルなどを利用してきた。時系列データの場合はAR、ARIMA、VARなどのモデルを使うこともある。実際、時系列モデルは、理論なき計量と過去に言われたことがあるとおり、経済学に基づいたモデルの推定とそのモデルを使った予測値の算出、政策効果の推計という作業で、時系列モデルを使うことは自分はあまりなかった。「予測」よりも「説明」が重視されたわけだ。
今回は、目的の第一が予測という。さて、ここで迷わされたのは、最初に書いた点、機械学習は計量経済学と何が違うのかという点だ。いくつかあるのだが、今回の予測という文脈で言うと、機械学習は、予測に重きが置かれ、計量経済学は変数間の関係の説明に重きが置かれていると言うことになろうか。大雑把に言えば、そんな感じだ。
その辺りを解説しているのが、下記の経済セミナーの機械学習の特集号だ。今は、特集の部分だけkindle版で購入できるようになっている。
機械学習と計量経済学の違いを考えたければまずはこれを読むのがいい。端的に答えれてくれているのは、「経済分析のツールとしての機械学習」の解説だ。いくつか挙げると・・・
- 第1に、両者の目的が異なる。計量経済学の目的はパラメータの推定と仮説の検定だ。機械学習の目的は予測だ。
- 第2に、両者の方法が異なる。計量経済学はパラメトリックな手法。機械学習はノンパラメトリックな手法
- 第3に、両者のデータが異なる。計量経済学ではすべてのデータを使って推定や検定を行う。機械学習では、訓練のためのデータとテストのためのデータを分ける
・・・ということとある。さらに機械学習を計量経済分析に応用した事例が紹介され、機械学習と計量経済学の現状を教えてくれる。
特集の最初の上野山氏と成田氏の対談は、機械学習が経済学、社会科学に与えるインパクトの大きさについて語られている。この対談を読むといろいろなところにこれから影響が出てくるなということが自分でも分かる。AIについて現状の技術レベルとそれがもたらす社会への影響とこれまでの社会課題を解決する可能性などを想像させてくれる。
社会科学系の研究所、コンサルで仕事をしている以上、これからの社会構築、課題の解決に機械学習の可能性を常に視野に入れて仕事しないと存在意義を疑われるようになる・・・つまりお仕事もらえなくなると言えるかもしれない。
経済セミナーの特集号『[新版]進化する経済学の実証分析』でも機械学習と経済学について取り上げたれている。前の特集号でも取り上げたれているが、機械学習の課題として「公平性(fairness)」*1と「解釈可能性(interpretablity)」*2についても述べられている。
機械学習等のビッグデータの分析手法を計量経済学との違いを明確にしながら解説している書籍としては以下の書籍がいいらしい(まだ読んでいない)。
CPUやメモリ、通信の性能の向上が、ビッグデータ(IoT)、クラウド、AI技術の社会実装をもたらし人文学・社会科学にも大きく影響し始めている・・・70年代から議論されてきた、情報社会(古いかw)が新たな段階に入ったということだろう。自分としては、これからというかいまさらというか、アラカンの手習だ。
< /p>
蛇足だが・・・今回、改めて機械学習と(計量)経済学の関係について調べたのだが、ここで紹介した経済セミナーや書籍は数年前のものだ。あと、日本経済学会の現代経済の潮流でも2019年に対談が出ているとのこと・・・全然、アカデミアのフォローができていないということを痛感した。反省。