R の概要: インストールと基本コマンド (関数)

UB3/informatics/r/r_overview

このページの最終更新日: 2022/09/23


  1. R のインストールと基本的な使い方
    • Mac へのインストール
    • Mac R で使用するメモリの設定
    • Linux Ubuntu へのインストール
    • 基本用語集
  2. R のライブラリ (パッケージ)
  3. R 演算子のメモ

広告

R のインストールと基本的な使い方

Mac へのインストール

2020 年 5 月ごろから R Studio をインストールして使っている。まず R を、次に RStudio をインストールする。

Terminal を使えるなら、R は Homebrew からインストールすることができる。2022 年 5 月現在、brew install r で OK。

以下は以前のメモ。

  • 2019 年 8 月現在では、バージョン 3.6 がリリースされている。どのようにアップデートされたかは、このページ によくまとまっている。
  • 2018 年 9 月に、新しい Mac で R をセットアップしたとき、Ref. 1の通りに進めたが、brew tap homebrew/science は homebrew/science was deprecated. This tap is now empty as all its formulae were migrated. というエラーが。OS は High Sierra、R のバージョンは 3.5.1。

Mac R で使用するメモリの設定

vector memory exhausted (limit reached?) というエラーが出たことがあった。解決方法は ここ に。

ホームフォルダに .Renviron という隠しファイルを作り、R_MAX_VSIZE=100Gb 記入する。

  • cd ~
  • touch .Renviron
  • open .Renviron

この open コマンドで、隠しファイルもテキストエディットで開けるようだ。単に R_MAX_VSIZE=100Gb と記入して保存。RStudio を一応再起動すると、エラーは出なくなった。


Linux Ubuntu へのインストール

Linux Ubuntu へのインストールはちょっとやっかいだった。

まず apt-get でインストールする方法がある。正式なパッケージ名は r-base のようで、sudo apt-get install r-base でインストールできる。この場合、R で起動可能。

Linux にも brew があり、brew install r でもインストールが可能だった。困ったことに、私の場合は apt-get の場合と 異なるバージョンの R がインストールされた。さらに、この場合の install path は /home/linuxbrew/.linuxbrew/Cellar/r/3.6.1 であり、そのフォルダに path を通さないと起動しない。


基本用語集

作業ディレクトリ

R には Working directory という概念がある。R を起動したときに自分がどの場所に行くのかは、環境設定の Working directory のところで設定することができる。

Working directory を変更したいときは、

setwd()

で括弧内にファイルパスを入れればよい。おそらく "" でパスを囲む必要がある。C ドライブでなくても、問題なくワーキングディレクトリに設定できるようだ。

R のライブラリ (パッケージ)

パッケージとは、R の機能を拡張できるプログラム群のことで、R の最大の強みの一つと言える。世界中の研究者が日々 R の新しいパッケージを開発しており、誰でも無料で使うことができる。ソースコードも全て公開されている。

R のパッケージは、以下の 4 種類に分けられる。詳細は R のパッケージ のページを参照のこと。

  • R とともに自動でインストールされ、読み込みも必要なく使えるもの。
  • R とともに自動でインストールされるが、library('パッケージ名') で読み込まないと使えないもの。
  • install.packages('パッケージ名') でインストールし、かつlibrary('パッケージ名') で読み込まないと使えないもの。
  • install.packages('パッケージ名') ではインストールできないもの。

また、R にはさまざまな組み込みデータセットが用意されている。一覧は、とりあえず このページ にある方法で見ることができる。


広告

R 演算子のメモ

演算子の前には、スペースを入れる習慣をつけておくとよい。スペースがなくても OK な場合もあるが、たとえば < を使って「-1 より小さい」を指定したい場合に、スペースを入れないと <-1 となり、代入になってしまう。


=

A = B は、R では「A は B に等しい」ではなく、「A に B を代入する」の意味になる。<- も代入を意味する。

==

「等しい」は、等号 2 つで表す。A %in% B でも「A は B に等しい」の意味。

!=

否定等号 ≠ の意味、「A は B に等しくない」。

R では ! は否定を表し、例えば is.na (A) は A が NA の場合 TRUE となるが、!is.na (A) では結果がひっくり返って FALSE となる。NA の取り扱い も参照のこと。

& と &&

どちらも論理積、つまり A かつ B を示す。

< と >

大なり、小なりを表す。

<= と >=

指定した値を含む「大なりイコール」は、<=1 のようにイコールをつけて示す。

%%

整数の範囲で除算を行なったときの余り。

%>%

パイプ、つまりある関数の結果を変数に代入せずに、次の関数に渡す (参考)。library(magrittr) に含まれている。次の具体例がわかりやすいだろう。

cars というシンプルな組み込みデータセットの speed という列の の平均値 M を計算し、これを棒グラフにする。

M = mean(cars$speed)
barplot(M)

結果を いちいち M という変数に代入するのは面倒なので、これは以下のように書くこともできる。

barplot(mean(cars$speed))

mean が barplot のカッコ内に入っているくらいならまだ分かりやすいが、この式が複雑になってくると、ステップがわかりにくくなる。

「平均値を計算し」「その結果を使ってなにかをする」というステップをスクリプト中に明示しておきたい場合には、このパイプを使うと便利。

mean(cars$speed)%>%
barplot()

barplot の ( ) 内には何も入っていないが、ここに前の関数の結果が入ることになる。


広告

References

  1. Mac OSにRをインストールする. Link: Last access 2018/09/20.
  2. ベクトル、行列、データフレーム、リスト、配列、テーブルの違い. Link: Last access 2018/09/20.

コメント欄

各ページのコメント欄を復活させました。スパム対策のため、以下の禁止ワードが含まれるコメントは表示されないように設定しています。レイアウトなどは引き続き改善していきます。「管理人への質問」「フォーラム」へのバナーも引き続きご利用下さい。

禁止ワード: http, the, м (ロシア語のフォントです)


このページにコメント

Name:


Comment:



これまでに投稿されたコメント

Date Name Comment

2021-11-02 16:07:11.809311

ZAP