日本橋濱町Weblog(日々酔亭)

Quality Economic Analyses Produces Winning Markets

実証研究入門(統計学、R言語、RStudio、Python)

消費のICT化をRで回帰分析してみた①

さて、前回まででデータの準備は終わったので、今回は回帰分析を実行してみる。 今回の推定式は、以下の通りに定式化。変数名は以下の通り。 lnet.expenditure:インターネットを利用した支出 lnincome:所得 trend:トレンド項 mxx:月次ダミー d1403:消費…

Rの開始からファイルの読み込み、変数の作成まで

データの読込と保存 さてR言語を使って計量分析を始めるにあたって、R言語のアイコンをクリックして立ち上げたら、まずは分析用ファイルを読み込むところからだ。 教科書では、P16にある「2.4 データ分析の準備」の部分。 ここでは作業ディレクトリにデータ…

Rで計量経済学:福地純一郎、伊藤有希著「Rによる計量経済分析」をテキストとして

さて、MacBookProを購入したことに伴い、STaTaが我が家で使えなくなったため、オープンソースベースのR言語を使うことにした。 Rは昔、恐らく10年以上前、一度手を出したことがあったが、その時はインターフェースがどうも気に入らなくていつの間にか遠ざか…

C言語、50の手習い・・・肩肘張らずにw

30代の頃、一度、手を染めたことがある・・・C言語。 今回、20年ぶりにパソコンにインストールしてみた。 仕事で使うなどというたいそれたことを考えるとすぐに挫折するので、ボケ防止のつもりでゆるゆると進めてみたい。 そこで教科書どうするかということ…

実証研究は地道な作業・・・データを作るということ

データを持って何かを語ることを仕事にしている研究者には、データが大切であることは言うまでもない。そうであることは誰でも分かっているのだろうが、最近、気になることがある。最近というより、官庁統計や業界統計を中心にネット上に電子ファイルが整備…

社会科学の目指すもの・・・行動科学革命を振り返る

昔、第二次大戦後1950年代にかけて行動科学革命というものがあった。現在、行動科学というと心理学や社会心理学の一分野と位置付けられることが多いが、当時の革命は社会科学全体に影響をもたらすものであった。その中でも社会心理学等のコミュニケーション…

料金政策の変更は高速道路の交通量にどのように影響したか?

2014年GWの高速道路の混み具合が(感覚的に)自分の予想よりかなり下回っていたのはこの前書いた通りだが、その時、要因として挙げたのは以下の3つ。 高速道路料金の変更(値上げと割引制度の終了?) ガソリンの高騰(レギュラでも170円近い) 消費増税の…

stataで時系列分析を!

統計ソフトの中でもstataはどちらかと言えば、MicroEconometrics用の統計ソフトという認識があった。アンケート調査で個票データを集めたら、それを用いて消費者行動の分析をしたり、企業行動の研究をしたりする。そのstataにも昔から時系列分析用のコマンド…

高速道路観察記・・・料金と最適サービス水準

北軽井沢に行くときは、江戸橋インターから首都高環状線にのり、その後5号池袋線、外郭環状道路、関越、上信越道と高速道路を使って行く。最終的には碓氷軽井沢インターで降りる。民主党の政策のおかげで土日深夜帯をうまく使うとかなり安く行ける(通常475…

Introductory Econometrics: Using Monte Carlo Simulation with Microsoft Excel

エクセルでモンテカルロシミュレーションを使いながら計量経済学の初歩を学べるようなので、突然だけど、ちょっと読んでみようと思う。例によってどれだけ実行されるかは不明。Introductory Econometrics: Using Monte Carlo Simulation with Microsoft Exce…

社会人のための計量経済学

実証研究・・・計量分析は最近はパソコンの普及と計量ソフト(Stataなど)の発達、そして官庁の統計データがネットから簡単に入手できるようになったことにより、誰にでも比較的簡単にできるようになってきている。しかし、実際やってみると、「計量分析は職…

北村行伸:ミクロ計量経済学入門

ついに出ましたSTATAのコードが付いている日本語で書かれたマイクロ計量経済学の入門書。「Stataで計量経済学入門」を傍らに置きながら、この本で微視的計量経済学を本格的に学べることになった。 (adsbygoogle = window.adsbygoogle || []).push({}); 目次…

STATAで微小計量経済学

最近はパソコンで使える統計ソフトも豊富になり、またWebでのアンケート調査で10年前よりかなり安い費用でアンケート調査の実施が可能になったこともあって、最近は個票レベルのデータを使った計量分析がかなり活発に行われるようになってきた。本書はその…

Stata関連のサイト

日本語で読めるStata関連の情報が載っているサイトです。 各サイトの開設者の方にはいつもお世話になっています。御礼申し上げます。 別所俊一郎さんのページ:ネコでもわかるStata入門 松浦寿幸さんのページ:経済分析のためのStata入門 pooさんのページ:S…

離散選択モデルの説明順序のなぞ

離散選択モデルの教科書や参考書を見ると大体以下の順序で説明がなされている。 線形確率モデル(このときは二項選択で説明される) Logitモデルの導入(二項選択) Ordered Logitモデル Nominal Logitモデル なぜこの順番なのか不思議に思っていた。 選択状況…

需要モデルの推定

ブロードバンド市場における消費者の選択行動を離散選択モデル(条件付ロジットモデル)で推定しようとしている。選択肢は大きく光ファイバ、ADSL、ケーブルインターネット。説明変数は、価格、速度(以上、AS変数)、所得、利用上位レイヤサービス&コンテ…

条件付ロジットモデルの推定5:サンプル数について

通常の仮定(詳細はCramer 1986, Eliason 1993を見よ)の下では、最尤推定量は、consistent, efficient, asymptotically normalである。これらの特性はサンプルサイズを無限大に近づけることで維持できる。 最尤推定量はスモールサンプルのとき必ずしも悪い…

条件付ロジットモデルの推定4:CLMの推定

CLMは、いくつかの選択肢の中からの選択がケース間で異なる選択肢の特徴にどのように影響されるかを明らかにできる。ここで観測された結果mの推定選択確率は以下の式で表される(数式はまだ不完全です)。 ここではケースi、選択肢mの説明変数の値である。γが…

条件付ロジットモデルの推定3:CS変数の考慮

CLMでCS変数を考慮するには、独立変数、つまりCS変数を交差項として再設定する必要ある。この考え方の詳細は以下のlongの文献(1997、181ページ)を参照のこと。アカデミックな関心点としては次の2点。 CSおよびAS変数の両者を含んだ混合モデルの可能性を開…

条件付ロジットモデルの推定2:CLM推定用データの作成

具体的な例で示すと以下のとおり。 サンプル数(グループ数):N=5000。 選択肢(モード)の数:J=3(光ファイバ、ADSL、ケーブルインターネット)。 観測値の数:N×J=15000。 このとき、データの構造は、第一列に光ファイバの選択肢、第二列にADSLの選択肢…

条件付ロジットモデルの推定1:case-specific variablesとalternative-specific variables

ある選択行動を離散選択モデルで記述するとき、採用される説明変数は2種類に大別される。 case-specific variables alternative-specific variables case-specific:選択状況の特性を表したもの。例えば、職業選択行動を考えた場合、個人の特性について、学…

Stataで計量経済学入門

Stataの日本語による本格的な初めてのテキストだ。題名は計量経済学入門となっているが、内容は「計量経済学を例にしたStata入門」だろう。これがあればとりあえずStataを使って計量分析ができる。英語が苦手な潜在的Stataユーザにはなくてはならない一冊に…

ダミー変数

OLSを行なって、残差分析をすると、系列相関が見つかるときがある。そういう時、ダミー変数をモデルに入れて最推定する。ダミー変数をどこにいれればよいかは、残差の傾向を図にしてみて、目の子で入れると結構うまくいく。問題なのはそのあとだ。そのダミー…

系列相関の検定(回帰診断)

経済分析ではよく年度(あるいは年)を単位とする時系列データを用いる。 この時系列データを分析に使う場合に注意しなければいけない点の一つが系列相関の問題。系列相関を検定するもっともポピュラーな統計量がダービン・ワトソン比であろう。この検定が扱…

Doファイル

STATAは多くのモデルを推定するとき、Doファイルを作り、それを実行すると一気に計算してくれるので便利だ。しかし、当然だが、Doファイルのプログラムにバグがあれば、途中で止まる・・・あたりまえか。

clogit関連のDoファイル

clogit choice train bus time invc, group(id) nolog listcoef, help predict prob /*(option pc1 assumed; conditional probability for single outcome within group)*/ list id prob choice train bus time invc in 1/6, nolabel sepby(id)・・・てな感…

回帰分析

通常は以下のコマンド。regress dependent_var independent_varとなる。regressは、regと省略可。

tssetコマンド

STATAでは、時系列データを分析する場合には、それが時系列データであることを宣言しなければならない。そのコマンドはtsset variable_nameとなる。

データをマージ(横につなげる)する

まずマージする2つのデータセットをキー変数でソートする。ここではsamplenumをキー変数としてマージするので、ソートは以下のとおり。 sort samplenumこれをマージするデータセットごとに行う。次にソートされたデータセットをマージする作業に入る。ファ…

データの読み込み、保存、クリア

csvデータの読み込みは以下のとおりinsheet using e:\data\data01.csvデータの保存は以下のとおりsave e:\data\data01.csvデータセットをすでに読み込んでいると別のデータセットは読み込めないので、メモリーから消去する必要がある。それはこれ。clear