R の概要: インストールと基本コマンド (関数)

UB3/informatics/r/r_overview

このページの最終更新日: 2021/07/08

R の目次 のページに、R でできることの一覧があります。


  1. R のインストールと基本的な使い方
    • Mac へのインストール
    • Linux Ubuntu へのインストール
    • 基本用語集
  2. R のライブラリ (パッケージ)
  3. R 関数のメモ
    • システム系の関数
    • パッケージ系の関数
    • オブジェクト操作に使える関数
    • オブジェクト作成に使える関数
    • 図形描画に使える関数
    • 統計検定に使える関数
  4. R 演算子のメモ

広告

R のインストールと基本的な使い方

Mac へのインストール

2018 年 9 月に、新しい Mac で R をセットアップしたときの記録。OS は High Sierra、R のバージョンは 3.5.1。

Terminal を使えるなら、R は Homebrew からインストールすることができる。Ref. 1の通りに進めるが、brew tap homebrew/science は homebrew/science was deprecated. This tap is now empty as all its formulae were migrated. というエラーが。

brew install Caskroom/cask/xquartz および brew install r はうまく動き、R がインストールされた。開発環境の RStudio はインストールしなかった。

起動時には、ターミナルで R とすればよい。Mac だと小文字の r でも起動できるが、Ubuntu では大文字でないとダメかもしれない。大文字で覚えておくのがいいだろう。

2019 年 8 月現在では、バージョン 3.6 がリリースされている。どのようにアップデートされたかは、このページ によくまとまっている。

2020 年 5 月ごろから R Studio をインストールして使っている。ターミナル上で操作するよりもはるかに使いやすい。


Linux Ubuntu へのインストール

Linux Ubuntu へのインストールはちょっとやっかいだった。

まず apt-get でインストールする方法がある。正式なパッケージ名は r-base のようで、sudo apt-get install r-base でインストールできる。この場合、R で起動可能。

Linux にも brew があり、brew install r でもインストールが可能だった。困ったことに、私の場合は apt-get の場合と 異なるバージョンの R がインストールされた。さらに、この場合の install path は /home/linuxbrew/.linuxbrew/Cellar/r/3.6.1 であり、そのフォルダに path を通さないと起動しない。


基本用語集

作業ディレクトリ

R には Working directory という概念がある。R を起動したときに自分がどの場所に行くのかは、環境設定の Working directory のところで設定することができる。

Working directory を変更したいときは、

setwd()

で括弧内にファイルパスを入れればよい。おそらく "" でパスを囲む必要がある。C ドライブでなくても、問題なくワーキングディレクトリに設定できるようだ。

R のライブラリ (パッケージ)

場合によって library または package という言葉が使われるが、両者に違いはないようである。ライブラリ・パッケージなどという言い方もある。

ただし、library は関数の名前でもあるので、パッケージという言葉の方が少し混乱が少ないかもしれない。例えば ggplot2 というライブラリ・パッケージを読み込むときには

library(ggplot2)


と実行する。この場合、library は関数である。なお、require 関数でもパッケージを読み込むことができ、両者の違いはパッケージが存在しない場合に処理が止まるかどうかということらしい (参考)。

R のパッケージは、以下の 4 種類に分けられる。詳細は R のパッケージ のページを参照のこと。

  1. R とともに自動でインストールされ、読み込みも必要なく使えるもの。
  2. R とともに自動でインストールされるが、library('パッケージ名') で読み込まないと使えないもの。
  3. install.packages('パッケージ名') でインストールし、かつlibrary('パッケージ名') で読み込まないと使えないもの。
  4. install.packages('パッケージ名') ではインストールできないもの。

また、R にはさまざまな組み込みデータセットが用意されている。一覧は、とりあえず このページ にある方法で見ることができる。


広告

R 関数のメモ

Mac Shell でいうコマンドのようなものを、R では一般に関数 function という。R 関数の簡単なメモと関連ページへのリンク。

システム系の関数

作業ディレクトリ、R オブジェクトではない一般的なファイルの操作などに関する関数。

sessionInfo()

現在の使用環境を表示する。

getwd()

作業ディレクトリを表示。現在のパスと考えて良い。

setwd()

作業ディレクトリを指定する。" " で囲むのを忘れがちなので注意。

list.files()

作業ディレクトリには、R のデータであるオブジェクト以外のファイルもある。それらの一覧を表示。file 操作に関係する関数も一覧にしておく。


  • file.path ('a.txt'): a.txt というファイルのパスを表示
  • file.info ('a.txt'): ファイル情報を表示
  • file.create ('a.txt'): a という名前のファイルを作る

read.csv()

csv ファイルを読み込む。

read.delim()

スペースなどで区切られたテキストファイルを読み込む。

write()

write(x, file = "filename") で、オブジェクト x の内容をファイルに書き出す。

  • append = TRUE or FALSE: 上書きするかどうかの指定
  • ncolumns = 1: 書き出すファイルにおける列の数

参考: R 出力の記録45. ファイルへのデータ出力

quit() R を終了する。

パッケージ系の関数

パッケージ操作に関する関数。

install.packages()

パッケージをインストールする。詳細は R のパッケージ: Install, CRAN の使い方など を参照のこと。

install.packages("パッケージ名") で良いが、install.packages("パッケージ名", dependensies = TRUE) とすると、依存関係のあるパッケージもまとめてインストールできる。

remove.packages()

remove.packages("パッケージ名") で、特定のパッケージを取り除く。

library()

どのようなパッケージが用意されているかを見る。

library(パッケージ名): たとえば library(outliers) で、outliers という名前のパッケージを呼び出す。

require()

require(パッケージ名) でパッケージを呼び出す。library と極めて近く、違いはパッケージが存在しないときに処理を続行するかどうか。library は止まり、require は止まらない。



オブジェクト操作に使える関数

ls()

Mac の ls と同様、ワークスペース内のオブジェクト一覧を表示。 () の中にオブジェクトを入れると、その列などが表示される。

saveRDS
readRDS

saveRDS(object, file = "filename.obj") として、オブジェクトを拡張子 obj のファイルとして保存する。

読み込む場合は、A = readRDS(file, refhook = NULL) とすることで、ファイルの内容が A というオブジェクトとして保存される。

mode(A)

オブジェクト A がベクターのとき、そのモードを表示する。データ型 を参照。

rm(A)

オブジェクト A を削除する。ワイルドカード * が使えないので、全てのオブジェクトを削除したいときは ls と組み合わせて rm(list=ls()) とする。

print(A)

オブジェクト A を出力する。

summary(A)

オブジェクト A のサマリーを表示する。平均値、標準偏差など。

rnorm

正規分布 を作成する。A = rnorm(10, 0, 1) のように、サンプル数、平均値および標準偏差を指定する。

data()

data() で読み込めるデータの一覧を取得し、data(データ名) でそのデータを読み込む。「読み込む」とは、オブジェクトとしてワークスペースに保存するということ。

select()
filter()

データフレームから、指定した通りに列または行を抜き出す。データフレームからの抽出 を参照のこと。


オブジェクト作成に使える関数

c()

ベクターを作成。A = c(1,2,3,4,5) のようにして、オブジェクト A に 1-5 を入れる。A は 1 次元のベクターになる。

data.frame()

データフレームを作成。

rbind()

行列を作成。

seq()

seq(最初の数, 最後の数, 間隔) で連続する数を指定。 A = c(seq(1, 5, 1)) でオブジェクト A に 1-5 を入れる。

rep()

rep(繰り返すもの, 繰り返し数) で繰り返しを作る。c(rep("A", 10)) なら文字列 A の繰り返しになる。

A = c(1, 2, 3) というベクターに対して rep(A, 3) とすると、1 2 3 1 2 3 1 2 3 のようにベクターが 3 回繰り返される。

R による塩基配列解析 で、ランダムな配列を生成するのに使用している。

paste()

文字列操作の関数。複数の文字列を連結して、1 つの文字列にする。引数がベクトルの場合、それぞれの要素ごとに連結する (参考)。間に挟む文字列は、sep または collapse (ベクトルの場合) で指定する。"" として空を指定すれば、連続した文字列になる。

sample()

無作為抽出を行う関数。


図形描画に使える関数

plot()

plot(X, Y) のようにオブジェクト X, Y の散布図を作る。

barplot(A)

オブジェクト A の棒グラフを描画する。→ R を使った棒グラフの作り方

boxplot(A)

オブジェクト A の箱ひげ図を描画する。

hist(A)

オブジェクト A のヒストグラムを表示。→ R を使ったヒストグラムの作り方

par()

グラフの重ね書き。例えば plot の次に par(new = T) として、もう一つグラフを重ねられる。plot のページに詳細あり。軸などの設定に注意。

venn.diagram(A)

オブジェクト A のベン図を作成する。→ R を使ったベン図の作り方


統計検定に使える関数

t.test(A, B)

ベクトル A, B に対して t 検定 をかける。

cor(A, B)
cor.test(A, B)

ベクトル A, B に対して 相関分析。相関係数と P 値などの算出。

grubbs.test(A)

オブジェクト A に対して外れ値の検定 Grubbs test をかける。

lm()

線形回帰の関数。

set.seed()

正則化回帰 などでランダムな seed を使う関数では、繰り返すと違う結果が返ってくる。これが嫌な場合は、set.seed(1) のように seed の値を指定する。数値は基本的に何でも良いはず (参考)。

R 演算子のメモ

演算子の前には、スペースを入れる習慣をつけておくとよい。スペースがなくても OK な場合もあるが、たとえば < を使って「-1 より小さい」を指定したい場合に、スペースを入れないと <-1 となり、代入になってしまう。


=

A = B は、R では「A は B に等しい」ではなく、「A に B を代入する」の意味になる。<- も代入を意味する。

==

「等しい」は、等号 2 つで表す。A %in% B でも「A は B に等しい」の意味。

!=

否定等号 ≠ の意味、「A は B に等しくない」。

< と >

大なり、小なりを表す。

<= と >=

指定した値を含む「大なりイコール」は、<=1 のようにイコールをつけて示す。

%%

整数の範囲で除算を行なったときの余り。


広告

References

  1. Mac OSにRをインストールする. Link: Last access 2018/09/20.
  2. ベクトル、行列、データフレーム、リスト、配列、テーブルの違い. Link: Last access 2018/09/20.

コメント欄

各ページのコメント欄を復活させました。スパム対策のため、以下の禁止ワードが含まれるコメントは表示されないように設定しています。レイアウトなどは引き続き改善していきます。「管理人への質問」「フォーラム」へのバナーも引き続きご利用下さい。

禁止ワード: http, the, м (ロシア語のフォントです)


このページにコメント

Name:


Comment:



これまでに投稿されたコメント

Date Name Comment