R: 欠損値 NA の取り扱い

UB3/informatics/r/na

このページの最終更新日: 2026/04/09

概要: R 欠損値 NA とは
- NA に関連する関数
NA を 0 に置き換える
NA を使って全て非有意のデータを除く

概要: R 欠損値 NA とは

R には NA, Inf, NULL などの数値でない値がある。このページでは、NA とその取り扱いについてまとめる。

いくつかメモ。

NA は数でないので、イコールなどの概念は成り立たない。たとえば 1 == 1 とすると TRUE となるが、NA == NA だと NA という答えが返ってくる。ある値が NA であるかどうかは、== ではなく is.na () 関数を使って調べる。
同じ大きさのデータフレーム A, B があり、A に NA があるとき、C = A + B とすると、A の NA の位置に NA が入る。他の位置は足し算になる。これを使って「A が NA なら B も NA」を実行できそう。
参考: 欠損データの処理は良いページ。

NA に関連する関数

is.na()

欠損値 NA かどうか。このほか、is.null(), is.nan(), is.finite(), is.infinite() などがあり、同様の使い方ができる。

応用の範囲が非常に広い。

sum(is.na(A)) で NA の個数
which(is.na(A)) で NA の場所
any(is.na(A)) で、1 個でも NA があれば TRUE

na.omit()

データフレームに対して使用する (1)。NA が一つでも含まれる行を取り除く。Na が一つでも含まれる列を取り除く場合は、apply() 関数を使用して、以下のようにする。

df_clean <- df[, !apply(df, 2, function(x) any(is.na(x)))]

na.rm

関数でなく、一部の関数に含まれるオプション。例えば sum 関数で sum(A) とすると、A に NA が含まれる場合は合計が計算されず、結果も NA になってしまう。しかし、sum(A, na.rm = TRUE) とすると、NA を除いて合計を計算する。

「あとがき」で当サイトを参考にしたと書いてくれているラノベです。Kindle Unlimited で読めました。ストーリーと文章が良く、面白かったです。

リンク

NA を 0 に置き換える

data というデータフレーム中で、ある特定の数 N をゼロに置き換えるときは以下のようにする。[data == N] の中は、TRUE または FALSE が並んでいることになる。

data[data == N] <- 0

NA は数でないので == は使えないが、TRUE または FALSE を並べればよいわけで、かわりに is.na が使える。つまり

data[is.na(data)] <- 0

となる。

NA を使って全て非有意のデータを除く

P < 0.05 などの基準を決めて、その値を全て NA にする方法。

まずデータの準備をする。p value のデータフレーム A と、データのデータフレーム B がある状態を作ってみる。

a1 = abs(rnorm(n=100, m=0.03, sd=0.02))
a2 = abs(rnorm(n=100, m=0.03, sd=0.02))
b1 = abs(rnorm(n=100, m=20, sd=5))
b2 = abs(rnorm(n=100, m=20, sd=5))
A = data.frame(data1_pval = a1, data2_pval = a2)
B = data.frame(data1 = b1, data2 = b2)

これで A, B が以下のように作成される。一部のデータしか示していないが、2 x 100 のデータフレームである。