PGに挫折した私があなたにR言語を薦める理由~ゲヲログがオヌヌメするR本五冊


R is easy to learn. If you give up on learning PG languages, that would be unfortunate, because R offers another path.


めちゃくちゃ簡単に学べる複雑な電卓機

Rは簡単である。熱意もって一週間取り組むかちょっとづつ学び一か月取り組めば誰でもR使いに成れる。これは保証する。他の言語だといきなりメモリがなんちゃらとか言ってくるパターンが多く良く言われる「習うより慣れろ」のレベルが高いのだ。PGはハードルが高い。その分Rを用いたPGは構文がとても簡単でやっていくうちに初めは難しいと思われがちなパイプ演算子でさえ簡単に概念として覚えちゃうことができる。RウィザードたちにとってRは複雑な電卓機みたいなもんで文系の人がちょっと統計学を学びさえすれば直感的に駆使もできる(というかそういう方法論もRにはある)。

データの可視化に特化しているツール

ggplotとか使うと超簡単に綺麗なグラフデータを作ることが出来る。それぐらい可視化の面で強みがある。統一感あるデータ可視化が容易でありHTMLやCSSなどで代替する必要はない。Pythonより強いと思う。というのもこのグラフ描画には数行しかコマンド必要性がない。むしろHTMLとかCSSとかの低級言語?っていうのかな。あれさえ出来てればそのノウハウが十二分に生きちゃう。他の言語だとHTMTとかCSSの知識はあまりに立たないがシンボルライクっていうのかな…その辺の知識があればRは使うことが楽勝である。ライブラリ導入すればジオインフォマティック的な解析まで簡単にできる(今井耕介先生の本でさえR使って書かれてる)。

統計学に近しく1~120までそれ向けに超最適化されている

環境構築が完全皆無で不要。RStudioをインストールすればすぐ使える。Pythonだとパスがらみの問題でなかなかこうはいかない。さらには統計学の知識が最低限度ぐらいあればすぐに学び始めることが出来てチュートリアル風にキーに打ち込めば自前のソースでしっかりと解析ができちゃう(自前のデータを揃えるのがムズイってのはあるけどwそれは他の言語でも同じ)。統計学に長じてればそれだけでデータハンドル・アナリティクスまで一括で出来る。反面プロダクトにするには難しいがデータのサイエンスに特化しててマネジメント面ではとても容易である(部分的にShiny使えば出来はする)。ExcelできればあまつさえVBAできさえすれば特段Rなんて至極簡単な部類である。

パッケージが豊富でその駆動も簡素

tidytextとかdplyrとかいう神ツールをlibraryコマンドからインストールすればすぐに使えることが出来てしかもエラーが極めて少ない。これはR自体がシンプルにまとまっているからだと思うけどとにかく数多い神パッケ―ジに解析手法の特化系は任せられる。面倒な開発なんかは天才様に任せて他は自分でちょいと努力しさえすればほとんどの可視化解析は簡単にできちゃう。兎に角解析系のパッケ―ジがライブラリに集積していて全部無料で使えちゃう。