R の概要: インストールと基本コマンド (関数)
UB3/informatics/r/r_overview
このページの最終更新日: 2021/03/09R の目次 のページに、R でできることの一覧があります。
- R のインストールと基本的な使い方
- Mac へのインストール
- Linux Ubuntu へのインストール
- 基本用語集
- R のライブラリ (パッケージ)
- R 関数のメモ
- システム系の関数
- パッケージ系の関数
- オブジェクト操作に使える関数
- オブジェクト作成に使える関数
- 図形描画に使える関数
- 統計検定に使える関数
- R 演算子のメモ
広告
R のインストールと基本的な使い方
Mac へのインストール
2018 年 9 月に、新しい Mac で R をセットアップしたときの記録。OS は High Sierra、R のバージョンは 3.5.1。
Terminal を使えるなら、R は Homebrew からインストールすることができる。Ref. 1の通りに進めるが、brew tap homebrew/science は homebrew/science was deprecated. This tap is now empty as all its formulae were migrated. というエラーが。
brew install Caskroom/cask/xquartz および brew install r はうまく動き、R がインストールされた。開発環境の RStudio はインストールしなかった。
起動時には、ターミナルで R とすればよい。Mac だと小文字の r でも起動できるが、Ubuntu では大文字でないとダメかもしれない。大文字で覚えておくのがいいだろう。
2019 年 8 月現在では、バージョン 3.6 がリリースされている。どのようにアップデートされたかは、このページ によくまとまっている。
2020 年 5 月ごろから R Studio をインストールして使っている。ターミナル上で操作するよりもはるかに使いやすい。
Linux Ubuntu へのインストール
Linux Ubuntu へのインストールはちょっとやっかいだった。
まず apt-get でインストールする方法がある。正式なパッケージ名は r-base のようで、sudo apt-get install r-base でインストールできる。この場合、R で起動可能。
Linux にも brew があり、brew install r でもインストールが可能だった。困ったことに、私の場合は apt-get の場合と
基本用語集
作業ディレクトリ |
R には Working directory という概念がある。R を起動したときに自分がどの場所に行くのかは、環境設定の Working directory のところで設定することができる。 Working directory を変更したいときは、 setwd() で括弧内にファイルパスを入れればよい。おそらく "" でパスを囲む必要がある。C ドライブでなくても、問題なくワーキングディレクトリに設定できるようだ。 |
R のライブラリ (パッケージ)
場合によって library または package という言葉が使われるが、両者に違いはないようである。ライブラリ・パッケージなどという言い方もある。
ただし、library は関数の名前でもあるので、パッケージという言葉の方が少し混乱が少ないかもしれない。例えば ggplot2 というライブラリ・パッケージを読み込むときには
と実行する。この場合、library は関数である。なお、require 関数でもパッケージを読み込むことができ、両者の違いはパッケージが存在しない場合に処理が止まるかどうかということらしい (参考)。
R のパッケージは、以下の 4 種類に分けられる。詳細は R のパッケージ のページを参照のこと。
- R とともに自動でインストールされ、読み込みも必要なく使えるもの。
- R とともに自動でインストールされるが、library('パッケージ名') で読み込まないと使えないもの。
- install.packages('パッケージ名') でインストールし、かつlibrary('パッケージ名') で読み込まないと使えないもの。
- install.packages('パッケージ名') ではインストールできないもの。
また、R にはさまざまな組み込みデータセットが用意されている。一覧は、とりあえず このページ にある方法で見ることができる。
広告
R 関数のメモ
Mac Shell でいうコマンドのようなものを、R では一般に関数 function という。R 関数の簡単なメモと関連ページへのリンク。
システム系の関数
作業ディレクトリ、R オブジェクトではない一般的なファイルの操作などに関する関数。
sessionInfo() |
現在の使用環境を表示する。 |
getwd() |
作業ディレクトリを表示。現在のパスと考えて良い。 |
setwd() |
作業ディレクトリを指定する。" " で囲むのを忘れがちなので注意。 |
list.files() |
作業ディレクトリには、R のデータであるオブジェクト以外のファイルもある。それらの一覧を表示。file 操作に関係する関数も一覧にしておく。
|
read.csv() |
csv ファイルを読み込む。 |
read.delim() |
スペースなどで区切られたテキストファイルを読み込む。 |
write() |
write(x, file = "filename") で、オブジェクト x の内容をファイルに書き出す。
|
quit() | R を終了する。 |
パッケージ系の関数
パッケージ操作に関する関数。
install.packages() | パッケージをインストールする。詳細は R のパッケージ: Install, CRAN の使い方など を参照のこと。 install.packages("パッケージ名") で良いが、install.packages("パッケージ名", dependensies = TRUE) とすると、依存関係のあるパッケージもまとめてインストールできる。 |
remove.packages() |
remove.packages("パッケージ名") で、特定のパッケージを取り除く。 |
library() | どのようなパッケージが用意されているかを見る。 library(パッケージ名): たとえば library(outliers) で、outliers という名前のパッケージを呼び出す。 |
require() |
require(パッケージ名) でパッケージを呼び出す。library と極めて近く、違いはパッケージが存在しないときに処理を続行するかどうか。library は止まり、require は止まらない。 |
オブジェクト操作に使える関数
ls() | Mac の ls と同様、ワークスペース内のオブジェクト一覧を表示。 () の中にオブジェクトを入れると、その列などが表示される。 |
saveRDS readRDS |
saveRDS(object, file = "filename.obj") として、オブジェクトを拡張子 obj のファイルとして保存する。 読み込む場合は、A = readRDS(file, refhook = NULL) とすることで、ファイルの内容が A というオブジェクトとして保存される。 |
mode(A) | オブジェクト A がベクターのとき、そのモードを表示する。データ型 を参照。 |
rm(A) |
オブジェクト A を削除する。ワイルドカード * が使えないので、全てのオブジェクトを削除したいときは ls と組み合わせて rm(list=ls()) とする。 |
print(A) |
オブジェクト A を出力する。 |
summary(A) |
オブジェクト A のサマリーを表示する。平均値、標準偏差など。 |
rnorm |
正規分布 を作成する。A = rnorm(10, 0, 1) のように、サンプル数、平均値および標準偏差を指定する。 |
data() |
data() で読み込めるデータの一覧を取得し、data(データ名) でそのデータを読み込む。「読み込む」とは、オブジェクトとしてワークスペースに保存するということ。 |
select() |
データフレームから、指定した通りに列または行を抜き出す。データフレームからの抽出 を参照のこと。 |
オブジェクト作成に使える関数
c() |
ベクターを作成。A = c(1,2,3,4,5) のようにして、オブジェクト A に 1-5 を入れる。A は 1 次元のベクターになる。 |
data.frame() |
データフレームを作成。 |
rbind() |
行列を作成。 |
seq() |
seq(最初の数, 最後の数, 間隔) で連続する数を指定。 A = c(seq(1, 5, 1)) でオブジェクト A に 1-5 を入れる。 |
rep() |
rep(繰り返すもの, 繰り返し数) で繰り返しを作る。c(rep("A", 10)) なら文字列 A の繰り返しになる。 A = c(1, 2, 3) というベクターに対して rep(A, 3) とすると、1 2 3 1 2 3 1 2 3 のようにベクターが 3 回繰り返される。 R による塩基配列解析 で、ランダムな配列を生成するのに使用している。 |
paste() |
文字列操作の関数。複数の文字列を連結して、1 つの文字列にする。引数がベクトルの場合、それぞれの要素ごとに連結する (参考)。間に挟む文字列は、sep または collapse (ベクトルの場合) で指定する。"" として空を指定すれば、連続した文字列になる。 |
sample() |
無作為抽出を行う関数。 |
図形描画に使える関数
plot(X, Y) のようにオブジェクト X, Y の散布図を作る。 |
|
barplot(A) |
オブジェクト A の棒グラフを描画する。→ R を使った棒グラフの作り方 |
boxplot(A) |
オブジェクト A の箱ひげ図を描画する。 |
hist(A) |
オブジェクト A のヒストグラムを表示。→ R を使ったヒストグラムの作り方 |
par() |
グラフの重ね書き。例えば plot の次に par(new = T) として、もう一つグラフを重ねられる。plot のページに詳細あり。軸などの設定に注意。 |
venn.diagram(A) |
オブジェクト A のベン図を作成する。→ R を使ったベン図の作り方 |
統計検定に使える関数
t.test(A, B) |
ベクトル A, B に対して t 検定 をかける。 |
cor(A, B) |
ベクトル A, B に対して 相関分析。相関係数と P 値などの算出。 |
grubbs.test(A) |
オブジェクト A に対して外れ値の検定 Grubbs test をかける。 |
lm() |
線形回帰の関数。 |
set.seed() |
正則化回帰 などでランダムな seed を使う関数では、繰り返すと違う結果が返ってくる。これが嫌な場合は、set.seed(1) のように seed の値を指定する。数値は基本的に何でも良いはず (参考)。 |
R 演算子のメモ
演算子の前には、スペースを入れる習慣をつけておくとよい。スペースがなくても OK な場合もあるが、たとえば < を使って「-1 より小さい」を指定したい場合に、スペースを入れないと <-1 となり、代入になってしまう。
= |
A = B は、R では「A は B に等しい」ではなく、「A に B を代入する」の意味になる。<- も代入を意味する。 |
== |
「等しい」は、等号 2 つで表す。A %in% B でも「A は B に等しい」の意味。 |
!= |
否定等号 ≠ の意味、「A は B に等しくない」。 |
< と > |
大なり、小なりを表す。 |
<= と >= |
指定した値を含む「大なりイコール」は、<=1 のようにイコールをつけて示す。 |
%% |
整数の範囲で除算を行なったときの余り。 |
広告
References
- Mac OSにRをインストールする. Link: Last access 2018/09/20.
- ベクトル、行列、データフレーム、リスト、配列、テーブルの違い. Link: Last access 2018/09/20.
コメント欄
各ページのコメント欄を復活させました。スパム対策のため、以下の禁止ワードが含まれるコメントは表示されないように設定しています。レイアウトなどは引き続き改善していきます。「管理人への質問」「フォーラム」へのバナーも引き続きご利用下さい。
禁止ワード: http, the, м (ロシア語のフォントです)
|
|
このページにコメント
これまでに投稿されたコメント
Date | Name | Comment |
---|