ANOVA のあと: Post-hoc test の種類と選び方

UB3/statistics/group_comparison/anova_post_hoc

このページの最終更新日: 2020/06/30

  1. 概要: Post-hoc test とは
  2. Post-hoc test としての多重比較検定
    • Bonferroni test
    • Fisher's LSD test
    • Tukey, Tukey-Kramer test
    • Newman-Keuls test
    • Duncan's multiple range test
    • Dunnet test

t 検定を理解するために

以下の順番に読んでみて下さい。

  1. 仮説検定
  2. z 検定
  3. t 検定の原理 - 母平均の検定
  4. 対応のある t 検定: このページ
  5. t 検定 メインページ: 等分散の場合
  6. Welch の t 検定: 分散が同じと言えない場合
  7. Mann-Whitney の U 検定
  8. t 分布
  9. 実践: Excel での t 検定, 平均値と分散を用いた t 検定

広告

概要: Post-hoc test とは

事後検定 post-hoc test とは、通常 ANOVA ののちに行われる多重比較の群間検定のことである。

Dunnet, Tukey-Kramer, Bonferroni は F 統計量を用いない多重比較であるため、ANOVA で有意でなくても有意差が出ることがある (3)。これらについては、前もって ANOVA をかける必要がない。

一方、Scheffe, Games/Howell, Fisher PLSD は F 統計量を用いているため、前もって ANOVA をかける必要があり、ANOVA で有意でなければ有意差は出ない (3)。


早見表

この表の作成には、文献 2 「私のための統計処理」を大いに参考にさせて頂きました。

Test 特徴

Bonferroni

多重性の程度に応じて、有意水準を直接変更する。つまり、有意と認定する P 値を下げる。

群が多いと P 値が低くなりすぎて全く有意にならなくなるので、5 群以上では使わない方が良い。

Fisher's LSD

4 群以上では使えない。

Tukey, Tukey-Kramer

もっとも一般的な post-hoc test である。

Steel-Dwass

Tukey-Kramer の non-parametric 版。母集団の分布、分散ともに制限なし。

Newman-Keuls

Duncan's MRT

Multiple range test。第 2 種の過誤に堅牢だが、第 1 種の過誤のリスクが大きい。

Dunnet

対照群とその他の群の比較。



Post-hoc test としての多重比較検定

ボンフェローニの検定

Bonferroni test は検定の多重性を調整する方法のひとつで、有意水準を直接いじる 最もわかりやすい方法である (3)。正規分布、等分散を仮定。

  • 3 群で仮説を検定する場合、2 群の組み合わせの検定を 3 回繰り返す必要がある。このときには、有意水準 0.05 を 3 で割って 0.017 とする。
  • 同様に、4 群の場合は 6 回の検定が必要なので、0.05/6 = 0.0083 を有意水準とする。

群が増えると有意水準がどんどん低くなり、厳しくなりすぎるという問題がある。5 群以上の検定では用いるべきではないとされているが、この点を改良したのが Holm 法、Shaffer 法である (3)。



Fisher's LSD

Least significant difference の略。多重性の問題が考慮されていない。文献 3 では 3 群のみに限定される と書かれている (3)。また、この Prism という統計ソフトの マニュアル の記述がわかりやすい。英語なので簡単に意訳しておく。


Tukey および Tukey-Kramer 法

Tukey 法は各群の n が揃っている場合、Tukey-Kramer 法は揃っていない場合の検定である (3)。後者は n が揃っている場合でも検定できる。Tukey HSD 法も同じ検定のことであり、HSD は honestly significant difference の略である。


Newman-Keuls test

追加予定


ダンカンの多重比較検定

Duncan's multiple range test は Newman-Keuls を発展させて作られた検定である。

Wikipedia には 「Duncan's new multiple range test (MRT) などとも呼ばれる多重比較法。第 1 種の過誤 type I error のリスクを高めることを許容し、第 2 種の過誤 type II error に対して堅牢 protective な検定である」とあるが、文献 3,4 では 多重性の問題を考慮していないため使用すべきではない と書かれている。

なぜ多重性の問題を考慮していないと言われるかは、文献 4 で詳しく解説されている。英語では少し異なる表現がされているようで、このページ などでは type I error を意図的に増やして Newman-Keuls の問題点を解決しようとしていると書かれている。

"Duncan's MRT does not control family wise error rate at the nominal alpha level, a problem it inherits from Student–Newman–Keuls method. The increased power of Duncan's MRT over Newman–Keuls comes from intentionally raising the alpha levels (Type I error rate) in each step of the Newman–Keuls procedure and not from any real improvement on the SNK method."


Dunnet's test

対照群とその他の比較に用いる。


広告

References

  1. 山中ら 2009a. 分子生物学、生化学、細胞生物学における統計のポイント. 蛋白質核酸酵素 53, 1792-1801.
  2. 私のための統計処理. Link.
  3. 池田 2013a. 統計検定を理解せずに使っている人のために III. 化学と生物 51, 483-495.
  4. 山村 1998a. 土壌肥料学における数理統計手法の応用上の問題点. 3. Duncanの多重検定はなぜ使えないか. 日本土壌肥料学会誌、69, 649-653, 1998.

コメント欄

各ページのコメント欄を復活させました。スパム対策のため、以下の禁止ワードが含まれるコメントは表示されないように設定しています。レイアウトなどは引き続き改善していきます。「管理人への質問」「フォーラム」へのバナーも引き続きご利用下さい。

禁止ワード: http, the, м (ロシア語のフォントです)


このページにコメント

Name:


Comment:



これまでに投稿されたコメント

Date Name Comment