ANOVA のあと: Post-hoc test の種類と選び方

statistics/group_comparison/anova_post_hoc
2018/11/10 更新

  1. 概要: Post-hoc test とは
  2. Post-hoc test としての多重比較検定
    • Bonferroni test
    • Fisher's LSD test
    • Tukey, Tukey-Kramer test
    • Newman-Keuls test
    • Duncan's multiple range test
    • Dunnet test

t 検定を理解するために

以下の順番に読んでみて下さい。

  1. 仮説検定
  2. z 検定
  3. t 検定の原理 - 母平均の検定
  4. 対応のある t 検定: このページ
  5. t 検定 メインページ: 等分散の場合
  6. Welch の t 検定: 分散が同じと言えない場合
  7. Mann-Whitney の U 検定
  8. t 分布
  9. 実践: Excel での t 検定, 平均値と分散を用いた t 検定

広告

概要: Post-hoc test とは

事後検定 post-hoc test とは、通常 ANOVA ののちに行われる多重比較の群間検定のことである。

Dunnet, Tukey-Kramer, Bonferroni は F 統計量を用いない多重比較であるため、ANOVA で有意でなくても有意差が出ることがある (3)。これらについては、前もって ANOVA をかける必要がない。

一方、Scheffe, Games/Howell, Fisher PLSD は F 統計量を用いているため、前もって ANOVA をかける必要があり、ANOVA で有意でなければ有意差は出ない (3)。


早見表

この表の作成には、文献 2 「私のための統計処理」を大いに参考にさせて頂きました。

Test 母集団の分布 分散 特徴
Bonferroni 正規分布 等分散 5 群以上では使わない方が良い。
Fisher's LSD 4 群以上では使えない。
Tukey, Tukey-Kramer もっとも一般的な post-hoc test である。
Steel-Dwass 制限なし 制限なし Tukey-Kramer の non-parametric 版。
Newman-Keuls
Duncan's MRT Multiple range test。第 2 種の過誤に堅牢だが、第 1 種の過誤のリスクが大きい。
Dunnet 対照群とその他の群の比較。


Post-hoc test としての多重比較検定

ボンフェローニの検定

Bonferroni test は検定の多重性を調整する方法のひとつで、有意水準を直接いじる 最もわかりやすい方法である (3)。

  • 3 群で仮説を検定する場合、2 群の組み合わせの検定を 3 回繰り返す必要がある。このときには、有意水準 0.05 を 3 で割って 0.017 とする。
  • 同様に、4 群の場合は 6 回の検定が必要なので、0.05/6 = 0.0083 を有意水準とする。

群が増えると有意水準がどんどん低くなり、厳しくなりすぎるという問題がある。5 群以上の検定では用いるべきではないとされているが、この点を改良したのが Holm 法、Shaffer 法である (3)。



Fisher's LSD

多重性の問題が考慮されていないため、3 群のみに限定される (3)。


Tukey および Tukey-Kramer 法

Tukey 法は各群の n が揃っている場合、Tukey-Kramer 法は揃っていない場合の検定である (3)。後者は n が揃っている場合でも検定できる。Tukey HSD 法も同じ検定のことであり、HSD は honestly significant difference の略である。

Newman-Keuls test

追加予定

ダンカンの多重比較検定

Duncan's multiple range test は Newman-Keuls を発展させて作られた検定である。

Wikipedia には 「Duncan's new multiple range test (MRT) などとも呼ばれる多重比較法。第 1 種の過誤 type I error のリスクを高めることを許容し、第 2 種の過誤 type II error に対して堅牢 protective な検定である」とあるが、文献 3,4 では 多重性の問題を考慮していないため使用すべきではない と書かれている。

なぜ多重性の問題を考慮していないと言われるかは、文献 4 で詳しく解説されている。英語では少し異なる表現がされているようで、このページ などでは type I error を意図的に増やして Newman-Keuls の問題点を解決しようとしていると書かれている。

"Duncan's MRT does not control family wise error rate at the nominal alpha level, a problem it inherits from Student–Newman–Keuls method. The increased power of Duncan's MRT over Newman–Keuls comes from intentionally raising the alpha levels (Type I error rate) in each step of the Newman–Keuls procedure and not from any real improvement on the SNK method."


広告

コメント欄

フォーラムを作ったので、各ページにあるコメント欄のうち、コメントがついていないものは順次消していきます。今後はフォーラムをご利用下さい。管理人に直接質問したい場合は、下のバナーからブログへ移動してコメントをお願いします。


References

  1. 山中ら 2009a. 分子生物学、生化学、細胞生物学における統計のポイント. 蛋白質核酸酵素 53, 1792-1801.
  2. 私のための統計処理. Link.
  3. 池田 2013a. 統計検定を理解せずに使っている人のために III. 化学と生物 51, 483-495.
  4. 山村 1998a. 土壌肥料学における数理統計手法の応用上の問題点. 3. Duncanの多重検定はなぜ使えないか. 日本土壌肥料学会誌、69, 649-653, 1998.