日本橋濱町Weblog(日々酔亭)

Quality Economic Analyses Produces Winning Markets

Rと統計学を学ぶ(3)・・・Rでの列の加工と1変量データの扱い方(2)

※本ブログおよび掲載記事は、GoogleAmazon楽天市場アフィリエイト広告を利用しています。

宣言をしてみる

継続は力なり、1冊を読破せよということで、毎日の進捗をここにメモることにした。今回で3回目。

Cultivation of basic intellect secretly advanced in a secret base

秘密基地で密かに進められる基礎知力の強化

前回まで。

mnoguti.hatenablog.com

本日というか最近の進捗は以下の通り(前回から2週間以上経過しているが、実際、ほとんど進めていない)。

RおよびRStudio

現在の進捗は以下の通り。

  • 第6章終了:列データの扱い、特にselectとその中で動く関数(everything(), starts_with(), ends_with())が大切
  • 第7章終了:行データの扱い、並び替え、比較演算子、ロジカル型、ロジカル型を使ったサンプル選択の理解

Key words:列の選択(select)、残っている列全部(everything())、最初に表示したい変数の指定(relocate())、特定の文字列で始まる変数の指定(starts_with())、特定の文字列で終わる変数の指定(ends_with())

列データの扱いは、変数データを加えたりする時に必ず必要になるのでしっかり押さえておきたい。特にselectとその中で使われる関数

7章、行データの加工は、サンプル選択の際、必要になる。その際、比較演算子、ロジカル型の理解が大切。ところで、行だからポンチ絵も行で表してほしかったと最初は思ったのだが、列の中のある要素についてTRUE、FALSEを判断するので列で良いのだな・・・と気づいた。

第6章と第7章は、データ加工で大切な関数やロジカル型での操作などがあるので、利用しながら繰り返し振り返ることで理解を深める。

Rで統計学

現在の進捗は以下の通り。

  • 第1章練習問題(了):1変量データの扱い方、箱ひげ図などのグラフの利用について

Key words:サンプルサイズ、ヒストグラム、平均(算術、幾何など)、分散、偏差、階級数、スタージェスの公式、分位点、箱ひげ図、モード、欠損値

こちらも練習問題等を繰り返し解いて慣れることが大切だ。繰り返し、繰り返し、時間かかってもいいからというより時間をかけて、繰り返し。統計や数理の考え方、文章に慣れることが大切。慣れると理解も早くなる。

おわりに

時間に追われているわけではないので、毎日継続することが大切。途切れないように続ける。

ではまた次回。

ブログランキング・にほんブログ村へ

PVアクセスランキング にほんブログ村