日本橋濱町Weblog(日々酔亭)

Quality Economic Analyses Produces Winning Markets

実証研究入門(統計学、R、Rstudio、Python、STATA)

離散選択モデルの説明順序のなぞ

離散選択モデルの教科書や参考書を見ると大体以下の順序で説明がなされている。 線形確率モデル(このときは二項選択で説明される) Logitモデルの導入(二項選択) Ordered Logitモデル Nominal Logitモデル なぜこの順番なのか不思議に思っていた。 選択状況…

需要モデルの推定

ブロードバンド市場における消費者の選択行動を離散選択モデル(条件付ロジットモデル)で推定しようとしている。選択肢は大きく光ファイバ、ADSL、ケーブルインターネット。説明変数は、価格、速度(以上、AS変数)、所得、利用上位レイヤサービス&コンテ…

条件付ロジットモデルの推定5:サンプル数について

通常の仮定(詳細はCramer 1986, Eliason 1993を見よ)の下では、最尤推定量は、consistent, efficient, asymptotically normalである。これらの特性はサンプルサイズを無限大に近づけることで維持できる。 最尤推定量はスモールサンプルのとき必ずしも悪い…

条件付ロジットモデルの推定4:CLMの推定

CLMは、いくつかの選択肢の中からの選択がケース間で異なる選択肢の特徴にどのように影響されるかを明らかにできる。ここで観測された結果mの推定選択確率は以下の式で表される(数式はまだ不完全です)。 ここではケースi、選択肢mの説明変数の値である。γが…

条件付ロジットモデルの推定3:CS変数の考慮

CLMでCS変数を考慮するには、独立変数、つまりCS変数を交差項として再設定する必要ある。この考え方の詳細は以下のlongの文献(1997、181ページ)を参照のこと。アカデミックな関心点としては次の2点。 CSおよびAS変数の両者を含んだ混合モデルの可能性を開…

条件付ロジットモデルの推定2:CLM推定用データの作成

具体的な例で示すと以下のとおり。 サンプル数(グループ数):N=5000。 選択肢(モード)の数:J=3(光ファイバ、ADSL、ケーブルインターネット)。 観測値の数:N×J=15000。 このとき、データの構造は、第一列に光ファイバの選択肢、第二列にADSLの選択肢…

条件付ロジットモデルの推定1:case-specific variablesとalternative-specific variables

ある選択行動を離散選択モデルで記述するとき、採用される説明変数は2種類に大別される。 case-specific variables alternative-specific variables case-specific:選択状況の特性を表したもの。例えば、職業選択行動を考えた場合、個人の特性について、学…

Stataで計量経済学入門

Stataの日本語による本格的な初めてのテキストだ。題名は計量経済学入門となっているが、内容は「計量経済学を例にしたStata入門」だろう。これがあればとりあえずStataを使って計量分析ができる。英語が苦手な潜在的Stataユーザにはなくてはならない一冊に…

ダミー変数

OLSを行なって、残差分析をすると、系列相関が見つかるときがある。そういう時、ダミー変数をモデルに入れて最推定する。ダミー変数をどこにいれればよいかは、残差の傾向を図にしてみて、目の子で入れると結構うまくいく。問題なのはそのあとだ。そのダミー…

系列相関の検定(回帰診断)

経済分析ではよく年度(あるいは年)を単位とする時系列データを用いる。 この時系列データを分析に使う場合に注意しなければいけない点の一つが系列相関の問題。系列相関を検定するもっともポピュラーな統計量がダービン・ワトソン比であろう。この検定が扱…

Doファイル

STATAは多くのモデルを推定するとき、Doファイルを作り、それを実行すると一気に計算してくれるので便利だ。しかし、当然だが、Doファイルのプログラムにバグがあれば、途中で止まる・・・あたりまえか。

clogit関連のDoファイル

clogit choice train bus time invc, group(id) nolog listcoef, help predict prob /*(option pc1 assumed; conditional probability for single outcome within group)*/ list id prob choice train bus time invc in 1/6, nolabel sepby(id)・・・てな感…

回帰分析

通常は以下のコマンド。regress dependent_var independent_varとなる。regressは、regと省略可。

tssetコマンド

STATAでは、時系列データを分析する場合には、それが時系列データであることを宣言しなければならない。そのコマンドはtsset variable_nameとなる。

データをマージ(横につなげる)する

まずマージする2つのデータセットをキー変数でソートする。ここではsamplenumをキー変数としてマージするので、ソートは以下のとおり。 sort samplenumこれをマージするデータセットごとに行う。次にソートされたデータセットをマージする作業に入る。ファ…

データの読み込み、保存、クリア

csvデータの読み込みは以下のとおりinsheet using e:\data\data01.csvデータの保存は以下のとおりsave e:\data\data01.csvデータセットをすでに読み込んでいると別のデータセットは読み込めないので、メモリーから消去する必要がある。それはこれ。clear

Result画面の表示を最後まで流すには次のコマンドを入力する。

set more offこれで途中で止まることなく、計算結果が最後まで出力される。最初の計算結果はログでチェックすればよい。

ログを取る

Stata上で作業をする場合、Results画面に計算結果が出るのだが、それが大量になると最初の部分は参照できなくなるらしい。そこで、ログを取る必要が出てくる。メニューアイコンの左から4つ目がログファイルを開くアイコンなので、それでファイルを開くように…

記述統計を求めるコマンド

tabstat: tab: sum: table:大体こんなのがあるみたいです。

主成分分析の方法

コマンドは以下のものを使うらしい。pcaさて、これを使いこなせますかどうか。

変数の生成

新たな変数を作るには次のコマンドを使う。generate var1 = var2 * var3上の例は、var2にvar3を乗じてvar1という変数を新たに作るというもの。このコマンドは、 gen と省略できる。

ベイズ統計学の特徴とベイズ推測の利点

まずはベイズ統計学の特徴から。 どのような場合でも例外なくベイズの定理を用いる。 用いられる確立は確信度を表す主観確率である。 事前情報を何らかの形で利用する。 未知量は常に確率的に変動する量としてとらえられる。 観測されたものは絶対的であり固…

参考文献

ここで出てくるベイズ統計に関することはすべて次の文献を参考ないし、そこから引用したものです。ベイズ統計学入門作者:渡部 洋発売日: 1999/09/01メディア: 単行本

連続量におけるベイズの定理

前の式は、事象の場合を示し確率の話であったが、連続量の場合には次式のようにあらわされる。この式は、事前分布がデータを通じて事後分布へと変化する仕方をあらわしている。連続型確率変数の場合は上記のようになる。 こことき、各記号の意味は以下の通り…

ファイルの呼び出し方

データファイルの呼び出し方は以下の通り。insheet using testdata.csv 上記の場合は、ファイルのあるフォルダがカレントディレクトリに保存されている場合。なお、stataはcsv形式のファイルを直接読み込める。また第一行目にファイル名を入れておくとそれを…

STATA:作業ディレクトリの指定

作業ディレクトリをデータファイルのあるところに指定しておくと、いろいろ便利だ。指定の仕方は以下の通り。MS-DOSのコマンドと同じだ。 cd C:\data\IF2005ただ、あまり階層が深くなると、うまく認識してくれないみたいです。

STATA:コメントのつけ方

コメント行は以下のようにつける。/*.......*/コメントとしたい部分をスラッシュとアスタリスクで囲めばOKだ。

STATA:メモリーの設定

STATAを使うとき、大量のデータの場合はメモリーの量を調整する必要があるかもしれない。ディフォルトの設定では10Mだから、それを必要メモリ量に再設定する。その際のコマンドは以下のとおり。set mem 50mこれで、メモリーが50メガに設定される。当然、…

ベイズの定理は下記のように表される。

このとき、 H:仮説 D:データ Pr(H):データを得る前(事前)の仮説Hについての主観確率 Pr(H|D):データを得た後(事後)の仮説Hについての主観確率 Pr(D|H):仮説HのもとでデータDが発生する確率。ただしPr(D|H)はデータが発生した後で、もはや確率ではない。…

ベイズ統計学:はじめてます

ベイズ統計学入門、読み始めました。 ベイズ統計学入門渡部 洋 福村出版 1999-09by G-Tools著者によれば初学者用の本だそうです。でも内容は数式一杯!しかしその数式はほとんど分布に関するものなので恐れずにあたらずということらしいです。今日も電車の中…