Mann-Whitney U テスト (Wilcoxon rank-sum test):
ノンパラメトリックな 2 群比較

UB3/statistics/group_comparison/mw_u_test

このページの最終更新日: 2021/02/07

  1. 概要: Mann-Whitney の U テストとは
  2. R で Mann-Whitney の U テストを実行する

広告

概要: Mann-Whitney U test とは

Mann-Whitney U test とは、正規分布を仮定しない 2 つの群の平均値 が異なるかどうかを評価するノンパラメトリックな検定である。

t 値を算出するわけではないので、t 検定とは本質的に異なるが、対応のない t 検定のノンパラメトリック版 として理解してもそれほどひどい間違いではないだろう。このサイトでは 2 群の平均値の比較に関する一連の手法の一つとして、以下のような順番で学習することを勧めている。


  1. 仮説検定
  2. z 検定
  3. t 検定の原理 #1: 母平均の検定
  4. t 検定の原理 #2: 対応のある t 検定
  5. t 検定の原理 #3: 正規分布、等分散の場合
  6. Welch の t 検定: 等分散を仮定できない場合
  7. Mann-Whitney の U 検定: このページ
  8. 実践 1: Excel での t 検定

Mann-Whitney U test の帰無仮説および対立仮説は、以下の通りである。

帰無仮説: 2 つの群は同じ母集団に由来する。
対立仮説: 片方の群が大きな値をもつ。

Mann–Whitney–Wilcoxon test, Wilcoxon rank-sum test, Wilcoxon–Mann–Whitney test とも呼ばれる。

ただし、Wilcoxon signed-rank test は異なる検定なので注意すること。Mann-Whitney が対応のない場合のテストであるのに対し、Wilcoxon signed-rank test は 対応のある t 検定のノンパラメトリック版 である (5)。


R で Mann-Whitney の U テストを実行する

R では Wilcoxon rank-sum test の名前が使われている。

このテストでは、単純に 2 つのベクトル形式のデータがあればよい。データの作り方については、R: データフレームの作成 を参照のこと。

一次元なので、Excel からコピペするのが簡単だと思ったので、上記の R: データフレームの作成 にある通り


> group1=read.table(pipe("pbpaste"))
> group2=read.table(pipe("pbpaste"))


として 2 つのグループを作り、


> wilcox.test(group1,group2)


で検定した。ところが

Error in wilcox.test.default(group1,group2) : 'x' must be numeric

というエラーが出てしまい、どうも変数が数値として認識されていないようであった。たぶん Excel からコピペすると list 型になってしまうのだろう。

そこで


> group1=c(10,12,10,15,11)
> group2=c(28,29,28,30,34)


のようにして手入力でデータ作成。再びテストを実行すると、今度は cannot compute exact p-value with ties というエラーが出る。このページ によると、ties とは「同じ値」のことで、それが含まれていると p 値を計算できないらしい。

wilcox.test は、データ数の合計が 50 未満で、同値がない場合にのみ正確な p 値を計算するらしい (3)。同値がある場合は、近似で p 値を計算するしかないらしい。

同値がある場合でも実行できる wilcox.exact() という関数があり、これを使用するにはパッケージをインストールする必要がある (4)。


> install.packages("exactRankTests", repos="http://cran.ism.ac.jp/")
> $ library(exactRankTests)



広告

References

  1. Amazon link: 岩波 理化学辞典 第5版: 使っているのは 4 版ですが 5 版を紹介しています。
  2. By i dont know - google, CC BY-SA 4.0, Link
  3. 順序尺度. Link: Last access 2018/09/20.
  4. Rによるウィルコクソンの順位和検定. Link: Last access 2018/09/20.
  5. Rosner 2016a. Fundamentals of Biostatistics.

平均値や中央値から始まり、t 検定、ANOVA、回帰分析まで、普通の論文で使う統計手法を網羅している本。とにかくグラフ付きの実例が多く、さらにその実例は論文からとられているので、実践的な生物統計を学びたい人にはおすすめの一冊。

統計の本は古くてとっつきにくいものが多いが、2016 年と比較的最近の本であることも特徴だ。著者はハーバード公衆衛生の Bernard Rosner。経歴を見ると医学統計のエキスパートだが、この本は シグマ記号の意味が実例つきで紹介されている ことからも分かる通り、平易な解説になっている。

たぶん高校の上級から大学の学部生あたりが基本的なターゲットで、研究に使う際に統計の基礎をチェックしたい研究者にも適した本になっている。


コメント欄

各ページのコメント欄を復活させました。スパム対策のため、以下の禁止ワードが含まれるコメントは表示されないように設定しています。レイアウトなどは引き続き改善していきます。「管理人への質問」「フォーラム」へのバナーも引き続きご利用下さい。

禁止ワード: http, the, м (ロシア語のフォントです)


このページにコメント

Name:


Comment:



これまでに投稿されたコメント

Date Name Comment
写真素材無料【写真AC】

新しく写真の提供を始めました。どんどん追加していきますので、こちらから登録後に Ultrabem の写真 をご覧下さい。登録と 1 日 9 枚までのダウンロードは無料です。