[雑感022] All roads lead to R…?!

Pocket

R言語については、私の周囲のセンパイたちが MacRlangtest.jp といった素晴らしい環境を用意してくれるので(少なくとも今は)手を出さずにおんぶに抱っこで済ませるつもりでした。ところが、

といった読みたい文献がRを前提として書かれており、触ったことがないとだいぶつらいというか寂しい。さらに周りの先輩後輩たちが口を開けば「なんでR、愛でR」という有様なので、見ないフリするのがかえってしんどくなりつつありました。

で、南風原(2014)読書会に参加するのを機に、R触っちゃおうと思い立ち、念のために積んでおいた

を手に取りました。RStudioで、1日2章ずつ小一時間〜90分程度を使って(慣れてきた後半は5章いっぺんに進めちゃったりして)1週間で最後まで終わりました。これ一冊で、Rをいじりながら、同時に統計の諸概念・検定の意味などを理解しようとするのは大変かなあと思いましたが、統計についてある程度の理解があればサクサク進められます。データもテキスト・エディタやExcelでちゃんと作成して、載っているスクリプトは全て実際に打ち込んで試しました。何度やっても記載通りの結果を出せなかったのは、coef()を用いて標準偏回帰係数を計算するところ(p. 294)だけで、後は全て再現できました(何度やっても父1.047363、母-0.118008となってしまうのだが、重回帰分析自体はちゃんと出たのでとりあえず良しとした)。

余談ですが、山田・杉澤・村井 (2008)の例は(誤解を避けるためか)変数名が全て日本語です。これだと変数名と関数等で入力をいちいち切り替えなければならず面倒で、サクサク感の妨げになりそうだと思ったので「統計」をstat、「数学」をmathというように変えて英数入力のまま進めました。ただ、cor <- cor(stat, math)とすると関数と変数がゴチャゴチャしそうだと思ったので、sokan <- cor(stat, math)というようなアレンジをしました。加えて同書には「Rエディタ等で関数を作って一気に実行しよう」みたいな記述があるのですが、コンソールで書いたものをRStudioに一気に貼り付けても上手くいきません。RStudioの場合、{を閉じないままでEnterを押せば自動で+記号が表示されるので、1行ずつ入力していけばいいだけでした。インストールも余計なことはせず、ToolsのInstall packagesを選び目的のパッケージを入力すれば良い。

まだ修羅の門の入口のだいぶ手前に立った程度なのは自覚していますし、私なんぞが深入りすべきとも思ってはいないのですが、山田・杉澤・村井 (2008)一冊こなして感じたのは、

  • <- c()の便利さをいかにプログラム感を出さずに実感してもらうかがR入門者にとっては鍵か。
  • plot()やsummary()は、Excelの分析ツールを初めて使うぐらい段階の学生から見ても、同じことをExcelでやるよりはるかに簡単ではるかに便利(比べるのはRに失礼かもしれないけど)。ヒストグラムもそう。
  • ただしこの段階では(abline()なども含めてちょっと感動してしまうものの)描画よりは、自分が何をしているかを常に意識しながら作業できるのが統計教育的にも良いところだと思う。あと乱数発生が容易なので、確率分布を実感しやすい(これは南風原(2014)読書会の前田先生の講義を拝聴して最も強く感じたこと)。
  • Excel等でデータを入力・保存してそれを読み込んで利用するのはそう面倒なことではないことをもったいぶらずに早めに教えてあげてもいいのでは。
  • SEMはパス図まで描けないと不全感が残るので、山田・杉澤・村井 (2008)になくても良かった(がんばれば、「外国語教育研究ハンドブック|Rを使った分析(SEM) 」で解決する)。

で、今は『データ解析のための統計モデリング入門』に戻り?進み?ました。購入時は部分的に読み散らかして放置していたのですが、Rを触ったのでずいぶん読みやすくなったと感じます。やはり触りながら読まないとダメですね。

ということで、R入門としては邪道な、逆向き発想なのですが、久保 (2012)あるいは南風原(2014)を読みたい→ので山田・杉澤・村井 (2008)を読みながらRを触る→たぶんその前に吉田 (1998)南風原 (2002)を読んでおくといい→その前に、この分野だと『英語教師のための教育データ分析入門』を読んでおくべきか→まあ入りやすいのは西内 (2013)西内 (2014)なのか、向後・冨永 (2007)なのか、とある弁当屋なのか宇宙怪人しまりすなのか…と、学生・院生をここまで連れてくる道筋をいろいろ考えてしまうのでした。南風原 (2002)はRを触る前にずいぶん泣きながらがんばって読みましたが、改めて読んでみたら感想も理解も違うかもな。。。

ということで、5月9日の続・『続・心理統計学の基礎』読書会、申し込み絶賛受付中です(もちろん講師は私ではありませんので、安心してお申し込みください)。よろしくお願いいたします。

0

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です