日本橋濱町Weblog(日々酔亭)

Quality Economic Analyses Produces Winning Markets

Rの開始からファイルの読み込み、変数の作成まで

データの読込と保存

さてR言語を使って計量分析を始めるにあたって、R言語のアイコンをクリックして立ち上げたら、まずは分析用ファイルを読み込むところからだ。
教科書では、P16にある「2.4 データ分析の準備」の部分。
ここでは作業ディレクトリにデータファイルを置いている前提で作業する。
ファイルを読み込むコマンドは以下のとおり。
> nedata <- read.csv("net_expend.csv")
作業ディレクトリにある、net_expend.csvというファイルをnedataというオブジェクトに読み込む。
Rでは、このオブジェクト上で作業を行うことになる。よって、現状のデータ(変数)から新たなデータ(変数)を作る時も、このオブジェクトを指定し、各変数を操作する。
> str(nedata)
これでオブジェクトの構造が分かる。strはstructureの略であろうか・・・
作業したオブジェクトをcsvファイルに保存する場合は以下のとおり。
> write.csv(nedata, "net_expend01.csv")
これで、オブジェクトを保存でき、次からはこのcsvファイルを読み込めば、前回の続きから作業を開始できることになる。

データの加工

データの加工は次のとおり。
今回は自然対数に変換する。
文法は、同じ。まずオブジェクトを指定してそのあとに変数名を指定する。
> nedata$lnet.expenditure <- log(nedata$net.expenditure)
こんな感じだ。

時系列データの指定

一応データは揃ったが、今回の場合は時系列データを使うので、もう少し事前準備が必要だ。
Rにこのデータが時系列データであることを認識させなければならない。
それは時系列を表す変数を指定することで行う。時系列データでこの手続きをしないと推定結果は時間効果が含まれたものになる・・・ということでここから教科書は、第6章の「6.4 Rで時系列データを分析」(79ページ)に飛ぶことになる。
今回は時系列データでも月次データなので、それを宣言しなければならない。
> nedatats <- ts(nedata, frequency=12, start=c(2002,1))
その宣言は、こんな感じ。出力先のオブジェクトのあと、ts関数を使う。元データが入っているオブジェクトのあと、月次(12ヶ月)なのでfurequencyは12、そのあと開始年月を指定する。これでこのオブジェクト上のデータは開始年月が2002年1月である、月次データで分析することがR言語上設定されたことになる。
さてこれから本格的に回帰分析を行うことになる。
この記事はここまで。