Welch の t 検定: 等分散を仮定しない t 検定

UB3/statistics/group_comparison/t_test_welch

このページの最終更新日: 2023/02/14

  1. 概要: Welch の t 検定とは

広告

概要: Welch の t 検定とは

このページでは、「データに対応がなく、かつ 分散 が等しいと仮定できない場合」に使われる Welch の t 検定を説明する。t 検定について原理からよく理解したい人は、以下の順にページを読んでもらいたい。

  1. 仮説検定
  2. z 検定
  3. t 検定の原理 #1: 母平均の検定
  4. t 検定の原理 #2: 対応のある t 検定
  5. t 検定の原理 #3: 正規分布、等分散の場合
  6. Welch の t 検定 等分散を仮定できない場合。このページ。
  7. Mann-Whitney の U 検定: 正規分布 を仮定できない場合。ノンパラ。
  8. 実践 1: Excel での t 検定

Welch の t 検定は、母分散が等しいと仮定できない場合 の検定である。母分散は通常の場合未知であるので、2 つの標本集団の分散から推察するしかない。標本集団の分散が大きく異なっている場合は、母分散が等しいと仮定できないと推論することになるだろう。


この場合も、もちろん帰無仮説は等式で表されるので、


帰無仮説: 標本集団 A および B の平均値は同じである。
対立仮説: 標本集団 A および B の平均値は同じでない。


となる。これまでと違うのは、検定統計量の定義だけである。

左は、t 検定の原理 #3 で示した、等分散を仮定できるときの t 値である。どちらの t 値でも、Xa, Xb は標本集団 A および B の平均値、na, nb は標本数。違うのは分散の部分である。



ue2 は併合分散で、これは分散が等しい場合にのみ使うことができる。

ua2、ub2 は標本集団 A および B の標準不偏分散で、分散が等しいと仮定できないのでこれらを別々に用いなければならない。


右側の Welch の t 検定の t 値は、残念なことに 近似でしか t 分布に従わない。逆に言えば、この近似を編み出したことが Welch の功績なのだろう。さらに自由度 v も近似であり、以下の式で表される。整数になる場合はその値を、ならない場合はもっとも近い値を自由度として扱う。



このようにして算出した Welch の t 値は、近似ではあるが t 分布に従うことになる。したがって、以降の手順はこの t 値が出現する確率がどの程度小さいかを求めるということで、これは他の t 検定と同じである。

ここでは以降の手順の解説は省略する。「概要」の部分の目次から、ノンパラメトリックな検定へ進むこと。


広告

References

  1. MATLAB による仮説検定の基礎. Web pdf.
  2. バイオインフォマティクス入門. ウェルチの t 検定. Link.

コメント欄

サーバー移転のため、コメント欄は一時閉鎖中です。サイドバーから「管理人への質問」へどうぞ。