読者です 読者をやめる 読者になる 読者になる

日本橋濱町Weblog(日々酔亭)

Quality Economic Analyses Produces Winning Markets

STATA

北村行伸:ミクロ計量経済学入門

ついに出ましたSTATAのコードが付いている日本語で書かれたマイクロ計量経済学の入門書。「Stataで計量経済学入門」を傍らに置きながら、この本で微視的計量経済学を本格的に学べることになった。目次は以下のとおり。 はしがき 第1部 統計調査とミクロ統計…

STATAで微小計量経済学

最近はパソコンで使える統計ソフトも豊富になり、またWebでのアンケート調査で10年前よりかなり安い費用でアンケート調査の実施が可能になったこともあって、最近は個票レベルのデータを使った計量分析がかなり活発に行われるようになってきた。本書はその…

Stata関連のサイト

日本語で読めるStata関連の情報が載っているサイトです。 各サイトの開設者の方にはいつもお世話になっています。御礼申し上げます。 別所俊一郎さんのページ:ネコでもわかるStata入門 松浦寿幸さんのページ:経済分析のためのStata入門 pooさんのページ:S…

離散選択モデルの説明順序のなぞ

離散選択モデルの教科書や参考書を見ると大体以下の順序で説明がなされている。 線形確率モデル(このときは二項選択で説明される) Logitモデルの導入(二項選択) Ordered Logitモデル Nominal Logitモデル なぜこの順番なのか不思議に思っていた。 選択状況…

需要モデルの推定

ブロードバンド市場における消費者の選択行動を離散選択モデル(条件付ロジットモデル)で推定しようとしている。選択肢は大きく光ファイバ、ADSL、ケーブルインターネット。説明変数は、価格、速度(以上、AS変数)、所得、利用上位レイヤサービス&コンテ…

条件付ロジットモデルの推定5:サンプル数について

通常の仮定(詳細はCramer 1986, Eliason 1993を見よ)の下では、最尤推定量は、consistent, efficient, asymptotically normalである。これらの特性はサンプルサイズを無限大に近づけることで維持できる。 最尤推定量はスモールサンプルのとき必ずしも悪い…

条件付ロジットモデルの推定4:CLMの推定

CLMは、いくつかの選択肢の中からの選択がケース間で異なる選択肢の特徴にどのように影響されるかを明らかにできる。ここで観測された結果mの推定選択確率は以下の式で表される(数式はまだ不完全です)。 ここではケースi、選択肢mの説明変数の値である。γが…

条件付ロジットモデルの推定3:CS変数の考慮

CLMでCS変数を考慮するには、独立変数、つまりCS変数を交差項として再設定する必要ある。この考え方の詳細は以下のlongの文献(1997、181ページ)を参照のこと。アカデミックな関心点としては次の2点。 CSおよびAS変数の両者を含んだ混合モデルの可能性を開…

条件付ロジットモデルの推定2:CLM推定用データの作成

具体的な例で示すと以下のとおり。 サンプル数(グループ数):N=5000。 選択肢(モード)の数:J=3(光ファイバ、ADSL、ケーブルインターネット)。 観測値の数:N×J=15000。 このとき、データの構造は、第一列に光ファイバの選択肢、第二列にADSLの選択肢…

条件付ロジットモデルの推定1:case-specific variablesとalternative-specific variables

ある選択行動を離散選択モデルで記述するとき、採用される説明変数は2種類に大別される。 case-specific variables alternative-specific variables case-specific:選択状況の特性を表したもの。例えば、職業選択行動を考えた場合、個人の特性について、学…

Stataで計量経済学入門

Stataの日本語による本格的な初めてのテキストだ。題名は計量経済学入門となっているが、内容は「計量経済学を例にしたStata入門」だろう。これがあればとりあえずStataを使って計量分析ができる。英語が苦手な潜在的Stataユーザにはなくてはならない一冊に…

ダミー変数

OLSを行なって、残差分析をすると、系列相関が見つかるときがある。そういう時、ダミー変数をモデルに入れて最推定する。ダミー変数をどこにいれればよいかは、残差の傾向を図にしてみて、目の子で入れると結構うまくいく。問題なのはそのあとだ。そのダミー…

系列相関の検定(回帰診断)

経済分析ではよく年度(あるいは年)を単位とする時系列データを用いる。 この時系列データを分析に使う場合に注意しなければいけない点の一つが系列相関の問題。系列相関を検定するもっともポピュラーな統計量がダービン・ワトソン比であろう。この検定が扱…

Doファイル

STATAは多くのモデルを推定するとき、Doファイルを作り、それを実行すると一気に計算してくれるので便利だ。しかし、当然だが、Doファイルのプログラムにバグがあれば、途中で止まる・・・あたりまえか。

clogit関連のDoファイル

clogit choice train bus time invc, group(id) nolog listcoef, help predict prob /*(option pc1 assumed; conditional probability for single outcome within group)*/ list id prob choice train bus time invc in 1/6, nolabel sepby(id)・・・てな感…

回帰分析

通常は以下のコマンド。regress dependent_var independent_varとなる。regressは、regと省略可。

tssetコマンド

STATAでは、時系列データを分析する場合には、それが時系列データであることを宣言しなければならない。そのコマンドはtsset variable_nameとなる。

データをマージ(横につなげる)する

まずマージする2つのデータセットをキー変数でソートする。ここではsamplenumをキー変数としてマージするので、ソートは以下のとおり。 sort samplenumこれをマージするデータセットごとに行う。次にソートされたデータセットをマージする作業に入る。ファ…

データの読み込み、保存、クリア

csvデータの読み込みは以下のとおりinsheet using e:\data\data01.csvデータの保存は以下のとおりsave e:\data\data01.csvデータセットをすでに読み込んでいると別のデータセットは読み込めないので、メモリーから消去する必要がある。それはこれ。clear

Result画面の表示を最後まで流すには次のコマンドを入力する。

set more offこれで途中で止まることなく、計算結果が最後まで出力される。最初の計算結果はログでチェックすればよい。

ログを取る

Stata上で作業をする場合、Results画面に計算結果が出るのだが、それが大量になると最初の部分は参照できなくなるらしい。そこで、ログを取る必要が出てくる。メニューアイコンの左から4つ目がログファイルを開くアイコンなので、それでファイルを開くように…

記述統計を求めるコマンド

tabstat: tab: sum: table:大体こんなのがあるみたいです。

主成分分析の方法

コマンドは以下のものを使うらしい。pcaさて、これを使いこなせますかどうか。

変数の生成

新たな変数を作るには次のコマンドを使う。generate var1 = var2 * var3上の例は、var2にvar3を乗じてvar1という変数を新たに作るというもの。このコマンドは、 gen と省略できる。

ファイルの呼び出し方

データファイルの呼び出し方は以下の通り。insheet using testdata.csv 上記の場合は、ファイルのあるフォルダがカレントディレクトリに保存されている場合。なお、stataはcsv形式のファイルを直接読み込める。また第一行目にファイル名を入れておくとそれを…

作業ディレクトリの指定

作業ディレクトリをデータファイルのあるところに指定しておくと、いろいろ便利だ。指定の仕方は以下の通り。MS-DOSのコマンドと同じだ。 cd C:\data\IF2005ただ、あまり階層が深くなると、うまく認識してくれないみたいです。

コメントのつけ方

コメント行は以下のようにつける。/*.......*/コメントとしたい部分をスラッシュとアスタリスクで囲めばOKだ。

メモリーの設定

STATAを使うとき、大量のデータの場合はメモリーの量を調整する必要があるかもしれない。ディフォルトの設定では10Mだから、それを必要メモリ量に再設定する。その際のコマンドは以下のとおり。set mem 50mこれで、メモリーが50メガに設定される。当然、…