日本橋濱町Weblog(日々酔亭)

Quality Economic Analyses Produces Winning Markets

Rと統計学を学ぶ・・・パイプ関数とデータの可視化

※本ブログおよび掲載記事は、GoogleAmazon楽天市場アフィリエイト広告を利用しています。

はじめに

継続することは力なり、いろいろ手を出すより1冊の教科書を読破せよということで、あっちゃこっちゃに手を出しがちな癖を矯正するため、毎日の進捗をここにメモることにした。

Cultivation of basic intellect secretly advanced in a secret base

秘密基地で密かに進められる基礎知力の強化

RおよびRStudio

R/RStudioは、下記の「Rでらくらくデータ分析入門」*1を教科書にデータ加工(前処理)の基礎知識を強化していく。ここを強化することにより、現在、Excel上で行なっている前処理をすべてR/RStudio上でやった方が効率的に処理できるようになる・・・らしい。

現在の進捗は以下の通り。

  • 第6章の頭まで終了:data.frame、パッケージ、関数、エクセル等外部ファイルの読み込み、パイプ関数の役割など

これから列データ、行データの加工に入る。

Rで統計学

自分の統計学の知識はだいぶくたびれているので、ここで再度磨き直すことにした。教科書は、「Rで学ぶ確率統計学-実データ分析編-」*2だ。これで一般化線型モデルの理解まで磨き直せることが可能・・・なはず。

  • 第1章の途中まで:Rによるデータの可視化を一応終わる

これから1変量データの扱い方から多変量へ進む。この教科書は以前も書いたが、Rで結果を確認しながら進められるので自分のような数学に必ずしも強くない人間にはちょうどよい。

おわりに

実際はまだこれからなので、この2冊を継続して読んでいき、自分のR/RStudioと統計学の基礎知識を再度磨き直せるように着実に進める。

ではまた明日。

ブログランキング・にほんブログ村へ

PVアクセスランキング にほんブログ村

*1:出版社の技術評論社のサイトにサポートページがある。

gihyo.jp

*2:こちらも出版社内田老鶴圃のサイトからサンプルプログラム等がダウンロードできる。

www.rokakuho.co.jp