群間比較の統計検定:
検定方法の選び方、実践的な注意点など

UB3/statistics/group_comparison
群間比較に関する上位のページです

このページの最終更新日: 2025/01/05

内容が増えてきたら独自のページを作っています。多くの項目は、このページに簡単なサマリーがあり、詳細をリンク先の別のページで説明しています。

検定方法の選び方

このページでは、以下のフローチャートに従って、データの種類に応じて検定方法を決定する手順を紹介する。

フローチャート以前に、まずデータが離散型か連続型かを判断する必要がある。離散型のデータとは、例えば以下のようなもの。

これらのデータは整数以外の値を取らない。したがって分布は正規分布にはならず、離散型の分布になる。このようなデータには、正規分布を仮定する t 検定を適用することはできず、ノンパラメトリックな Mann-Whiteney の U 検定やカイ二乗検定を使う必要がある。詳細は計数データの検定のページへ。

データが連続型であるなら、次の判断基準は群の数である。

1 群の検定で、平均値がある値に等しいかどうかを知りたい場合には、z 検定や平均値と比較する t 検定が使われる。

2 群の場合には、母集団の分布が問題となる。母集団が特定の分布に従うことを仮定した検定をパラメトリック検定と呼び、そうでないものをノンパラメトリック検定という。このページにある「連続型データの検定 (2 群の場合)」へ進む。

3 群以上の場合は、多重検定を行うことになる。上の表にはパラメトリックな多重検定である ANOVA およびその post-hoc テストのみが示されている。

以下の手順がよく用いられている。フローチャートも再掲しておく。

ただし、この手順に従うと、一つのデータセットに対して Shapiro-Wilk 検定、F 検定、t 検定など、複数回の統計処理を行うことになる。これは多重検定という問題を生じる。「事前検定の問題」を参照。

3 群以上の場合も、基本的な手順は同じである。

まず、Shapiro-Wilk 検定でデータが正規分布に従うかどうかを調べる。
正規分布に従わない場合は、ノンパラメトリックな 3 群以上の検定、Kruskal-Wallis 検定を行う。これで有意ならば、群間比較を Steel-Dwass などのノンパラメトリック post-hoc test をする。
正規分布に従っている場合、パラメトリックな ANOVA を適用するが、その前に等分散の検定を行う。3 群以上の等分散性の検定には、R のバートレット検定が便利である (参考)。
分散が異なる場合は、対数変換などの措置をとるか、ノンパラメトリック検定を用いる (参考)。Games-Howell が等分散性を仮定しない post-hoc test である。
分散が等しい場合、Tukey HSD などの等分散性を仮定した post-hoc test をする。

詳細は多重検定のページを参照のこと。

問題は以下の 2 点である。正規性を例に説明しているが、等分散性を事前検定する場合でも全く同じである。

最初に正規性の検定を行い、確認できたら t 検定。この手順を踏むと、同じデータに対して 2 回統計をかけることになる。これは 2 重検定であり、基本的に避けるべき。全体の有意水準が 5% に収まらなくなる。
正規性の検定における帰無仮説は、「正規分布する」である (8)。この仮説が棄却できない場合、「正規分布する」として t 検定をすることになるが、この状態は論理的に「正規分布するという仮説を棄却する証拠が不十分である」ということで、「正規分布する」ことを証明してはいない。したがって「正規分布するために t 検定をした」という論理に正当性がない。

私は、基本的には事前検定には反対で、最初からノンパラメトリックなテストを行うべきという立場である。この点については、事前検定の是非で解決法を含めて検討している。

図のように、コントロール群の値が全て 1 でエラーバーがなく、実験群の値だけにエラーバーがついている図を見たことがあるだろうか。

このようなデータに対して t 検定をかけるのは誤りであると考えている。詳細は標準化されたデータに対する t 検定のページにまとめた。

山中ら 2009a. 分子生物学、生化学、細胞生物学における統計のポイント. 蛋白質核酸酵素 53, 1792-1801.
Gronke et al. 2010a. Molecular evolution and functional characterization of Drosophila insulin-like peptides. PLoS Genet 6, e1000857.
t検定をばかにしてはいけない。の巻き。 Link: Last access 2018/06/03.
Kawada et al. 2013a. High concentrations of L-ascorbic acid specifically inhibit the growth of human leukemic cells via downregulation of HIF-1a transcription. PLoS ONE 8, e62717.
Okumura's Blog; 2 段階 t 検定の是非. Link: Last access 2018/06/03.
統計勉強: 等分散性の検定について. Web.
Welch検定が主流、単純 t 検定や ANOVA は時代遅れ：Statwingの話題から. Link.
Rochon et al. 2012a. To test or not to test: Preliminary assessment of normality when comparing two independent samples. BMC Med Red Method 12, 81.
Square Root Transformation. Link: Last access 2018/07/20.
ポストホックテストとしての多重比較検定. Link: Last access 2022/05/01.

サーバー移転のため、コメント欄は一時閉鎖中です。サイドバーから「管理人への質問」へどうぞ。