日本橋濱町Weblog(日々酔亭)

Quality Economic Analyses Produces Winning Markets

Rと統計学を学ぶ(6)・・・前期の授業を振り返る

※本ブログおよび掲載記事は、GoogleAmazon楽天市場アフィリエイト広告を利用しています。

 

今日の進捗

継続は力なり、1冊を読破せよということで、日々少しずつでもいいので、進める・・・と書いていながらずーっと止まっていた・・・今回で6回目。

なぜ止まっていたかというと、授業の準備で手一杯だったためだ。授業も終わり、成績も出し終わったので、ここらで再開というか、これまでの授業で学生たちが苦手とするところがいくつかわかったのでそこについて自分自身も復習して、より分かりやすい内容を目指そうということで振り返り。

Cultivation of basic intellect secretly advanced in a secret base

秘密基地で密かに進められる基礎知力の強化

前回まで。

mnoguti.hatenablog.com

RおよびRStudio

振り変えると以下の通り。

まずはR/R Studioの立ち上げから前処理までのデータの取り扱いで苦戦することが多い。

  • パッケージのインストールとライブラリとしてのロード
  • エクセル上でのデータ投入とRへの読み込み
  • 全角と半角英数の違い
  • データの型に注意が向かない

授業では何回も繰り返しているのに自宅のPCで再現しようとすると再現できないことが多い。

一番は、パッケージのインストールをしていなかったり、パッケージをロードしてなかったりというものだ。

Excel上でデータを表として投入するのだが、その時の縦横の見出しの付け方はシンプルがいい。しかし経験が浅いためかシンプルにしようとして逆に複雑になっていたりとチグハグだった。変数名になる欄が複数行に渡っているため、読み込んだデータが意図せざる形になっているものもあった。

基本的には、半角英数で投入するようにしていたが、その半角英数を全角投入モードから半角英数に変換していることがままあった。これだと予期せぬところに全角が残ったりしてエラーになることがしばしば。

  • 関数のレイヤ構造(ggplot関数とgeom_関数)
  • 関数の引数(引数としてのデータの引用方法)

今回、データの視覚化では、ggplot関数を使い、いろいろ工夫できる点を活かそうとしたが、それが逆に難しさに拍車をかけた。関数のレイヤ構造とか、引数の書き方などで躓くことが多々あった。

これらの点を原因とするエラーが彼ら・彼女らに襲いかかると彼らはお手上げだ。エラーメッセージを解読しようとしないから、どのエラーか特定できないでただただ戸惑っていることになり、解決しない。

コーディングについての質問も、エラーメッセージやスクリプトを共有してもらわないと分からないのに、それができない学生が多い。

何が問題かというと、授業を聞いていないのが問題なのだが、文系学生のためかパソコンに苦手意識を持っている学生が多く、最初から理解するのを諦めているようなところがある。

これらの点をクリアしながら、Rを使った統計分析でデータを使って何が分かるかを少しでも理解するようにするにはどうしたらいいか、この夏休みの間に考える。

Rで統計学

Rの使い方でだいぶ苦戦しているので、どうしても統計学の勉強が薄くなりがちだ。こちらももう一度見直し、データ分析の基本(回帰分析の初歩的なところまで)が確実にできるようになってもらうように工夫する。

おわりに

時間に追われているわけではないが、毎日継続することが大切。途切れないように続ける。

ではまた次回。

ブログランキング・にほんブログ村へ

PVアクセスランキング にほんブログ村