検出力の検定: Power analysis

UB3/statistics/basics/power_analysis

このページの最終更新日: 2025/01/05

  1. 概要: 検出力の検定とは
  2. R を使った power analysis
  3. 論文に Power analysis の結果を載せる

広告

概要: 検出力の検定とは

有意差検定や P 値の意義については色々な議論があるが、古典的には、複数の群 A, B, C... を比較するようなタイプの研究では、群を比較して 有意差 を検出し、有意な結果について議論するのが基本である。

差が有意になるかどうかは、サンプル数に大きく左右される。つまり、N = 3 の実験では有意でなかった結果も、N = 50 なら有意になるかもしれないということである。これを考えると、始めから 50 匹のマウスを使った実験を計画したくなるが、実際には 10 匹使えば十分かもしれない。この場合、残りの 40 匹のマウスは無駄な犠牲だったということになってしまう。さらに、実験にかかる資金や労力も無視できない。

このようなことが起こらないよう、「どれぐらいの数の動物を使えば有意差が出そうか」を見積もる方法が power analysis である。以下、文献 1 に沿ってもう少し専門的な言葉で解説しておく。

> Power analysis についての日本語総説 (1)。

  • 検出力は、1 - false negative を起こす確率 (β) で定義される。
  • 検出力に影響する要因は 5 つ: 測定値 (または統計量) の分布、群間の測定値の差、測定値の標準偏差、サンプルサイズ、false positive を起こす確率 (α, 通常は 0.05 に設定される)
  • 同じ検定を使う限り、この 5 つのうち 4 つまで決まれば、残りの 1 つは自動的に決定される。

以上のことから、サンプルサイズを求めるためには、測定値 (または統計量) の分布、群間の測定値の差、測定値の標準偏差、α の 4 つの値を得れば良いということになる。もちろん、分布、測定値の差、測定値の標準偏差などは実験をしてみないとわからないので、これらは 過去の文献から推定する ことになる。

個人的には、以上のような性質をもつ power analysis はあまり好きではない。これは 効果量分散 が過去の文献からある程度推定できる、おそらくは臨床試験などを想定した解析であり、基礎生物実験で、とくに新規性が高い実験ほど形式的かつ無意味なものになる手法であると考えている。


広告

R を使った power analysis

R には、デフォルトで以下の 3 つの検出力検定が用意されている。

t 検定

power.t.test 関数を用いる。使い方は以下の通りで、delta, sd, sig.level, power, n のうち 4 個に値を入れ、知りたい部分を NULL とする。とする。

power.t.test(delta = 1, sd = 1, sig.level = 0.05, power = 0.7, n = NULL)


この関数を実行すると、以下のような結果が得られる。注意書きにあるように、ここでの N は各グループごとの個体数である。t 検定は 2 群なので、合計で 26 - 28 個体が必要という結果である。

カイ二乗検定

方法は t 検定と似ている。

power.prop.test(p1 = 0.1, p2 = 0.3, sig.level = 0.05, power = 0.7, n = NULL)


ANOVA

ANOVA の場合は、群の数、群間の測定値の分散、群内の測定値の分散が必要になる。

power.anova.test(groups = 4, between.var = 1, within.var = 2, sig.level = 0.05, power = 0.7, n = NULL)


結果が各グループの個体数で与えられるのは t 検定の通り。

論文に Power analysis の結果を載せる

Power analysis は、むしろ実験計画の段階で行われる解析であり、論文でその結果を詳細に記述することはあまりない。しかし、以下のような文例がみつかる。

  • A pre-hoc power analysis determined that a minimum sample size of 16 in each group would have an 80% power to detect a difference... (ref)
  • Our power analysis determined a need for a sample size of 38 subjects to detect a κ value of 0.40 with 80% power (ref).

広告

References

  1. 岡田 2007a. R Commander を用いた統計解析の基礎. Link: Last access 2020/07/14.

コメント欄

サーバー移転のため、コメント欄は一時閉鎖中です。サイドバーから「管理人への質問」へどうぞ。