日本橋濱町Weblog(日々酔亭)

Quality Economic Analyses Produces Winning Markets

実証研究入門(統計学、R言語、RStudio、Python)

Result画面の表示を最後まで流すには次のコマンドを入力する。

set more offこれで途中で止まることなく、計算結果が最後まで出力される。最初の計算結果はログでチェックすればよい。

ログを取る

Stata上で作業をする場合、Results画面に計算結果が出るのだが、それが大量になると最初の部分は参照できなくなるらしい。そこで、ログを取る必要が出てくる。メニューアイコンの左から4つ目がログファイルを開くアイコンなので、それでファイルを開くように…

記述統計を求めるコマンド

tabstat: tab: sum: table:大体こんなのがあるみたいです。

主成分分析の方法

コマンドは以下のものを使うらしい。pcaさて、これを使いこなせますかどうか。

変数の生成

新たな変数を作るには次のコマンドを使う。generate var1 = var2 * var3上の例は、var2にvar3を乗じてvar1という変数を新たに作るというもの。このコマンドは、 gen と省略できる。

ベイズ統計学の特徴とベイズ推測の利点

まずはベイズ統計学の特徴から。 どのような場合でも例外なくベイズの定理を用いる。 用いられる確立は確信度を表す主観確率である。 事前情報を何らかの形で利用する。 未知量は常に確率的に変動する量としてとらえられる。 観測されたものは絶対的であり固…

参考文献

ここで出てくるベイズ統計に関することはすべて次の文献を参考ないし、そこから引用したものです。ベイズ統計学入門作者:渡部 洋発売日: 1999/09/01メディア: 単行本

連続量におけるベイズの定理

前の式は、事象の場合を示し確率の話であったが、連続量の場合には次式のようにあらわされる。この式は、事前分布がデータを通じて事後分布へと変化する仕方をあらわしている。連続型確率変数の場合は上記のようになる。 こことき、各記号の意味は以下の通り…

ファイルの呼び出し方

データファイルの呼び出し方は以下の通り。insheet using testdata.csv 上記の場合は、ファイルのあるフォルダがカレントディレクトリに保存されている場合。なお、stataはcsv形式のファイルを直接読み込める。また第一行目にファイル名を入れておくとそれを…

STATA:作業ディレクトリの指定

作業ディレクトリをデータファイルのあるところに指定しておくと、いろいろ便利だ。指定の仕方は以下の通り。MS-DOSのコマンドと同じだ。 cd C:\data\IF2005ただ、あまり階層が深くなると、うまく認識してくれないみたいです。

STATA:コメントのつけ方

コメント行は以下のようにつける。/*.......*/コメントとしたい部分をスラッシュとアスタリスクで囲めばOKだ。

STATA:メモリーの設定

STATAを使うとき、大量のデータの場合はメモリーの量を調整する必要があるかもしれない。ディフォルトの設定では10Mだから、それを必要メモリ量に再設定する。その際のコマンドは以下のとおり。set mem 50mこれで、メモリーが50メガに設定される。当然、…

ベイズの定理は下記のように表される。

このとき、 H:仮説 D:データ Pr(H):データを得る前(事前)の仮説Hについての主観確率 Pr(H|D):データを得た後(事後)の仮説Hについての主観確率 Pr(D|H):仮説HのもとでデータDが発生する確率。ただしPr(D|H)はデータが発生した後で、もはや確率ではない。…

ベイズ統計学:はじめてます

ベイズ統計学入門、読み始めました。 ベイズ統計学入門渡部 洋 福村出版 1999-09by G-Tools著者によれば初学者用の本だそうです。でも内容は数式一杯!しかしその数式はほとんど分布に関するものなので恐れずにあたらずということらしいです。今日も電車の中…

ベイズ統計学2

ベイズ統計学はGoogleの検索システムの背景にある考え方だということは前回書いたが、実際、どういうことなのか・・・実はあまりよく理解しないで書いていた・・・というより、引用した。 Aiが原因でBを結果と考えれば、結果Bを知った後に原因がAiであった…

ベイズ統計学

最近、ベイズ統計学というものが注目されているらしい。統計学をやっていればもちろん、計量分析をやっている人も聞いたことはあると思う。その基礎にはベイズという人が考えた定理があって、それに基づいて構築されているものだ。しかし、実際にやろうとす…

携帯電話の購入

我々は商品を買うときに何に注目し、どのように比較して自分の購入する財・サービスを決めているのであろうか。離散選択モデルで選択場面を描写するとき、それはまさしく個人が選択している場面をモデル化することになる。例えば、今取り組んでいるのは携帯…

標本数の求め方

アンケート調査の標本数・・・どのくらいのサンプルを集めればよいのかは必ず議論になる。当然、公式はあるわけで、それは以下の通り。【無限母集団の場合】 n>=1/(((e/z)×(e/z))×(1/(P(1-P))))【有限母集団の場合】 n>=N/(((e/z)×(e/z))×(N-1/(P(1-P)))+1)…

STATA:データセットの大切さ

計量分析をする上で最も大切なことは、質のいいデータセットを作ることだ。だからアンケート調査を実施した場合も、データがあがってきたからすぐにそれを使って計算できるというものではない。そこから異常値のチェックをして、誤回答を見つけ出し、場合に…