t 検定の原理 #3: 等分散を仮定した対応のない t 検定

statistics/group_comparison/t_test
2018/07/25 更新

  1. 概要: t 検定とは
  2. 対応のない等分散 t 検定の原理
  3. R による対応のない等分散 t 検定

広告

概要: t 検定とは

t 検定とは、t 分布に従う 検定統計量 t を利用する検定法 の総称である。一般に、2 組のグループ (標本集団) があるとき、それらの集団のもつ値の平均値が有意に異なるかどうかという検定に用いられるが、以下のように様々なパターンがある。

  1. ある標本集団 (1 群) の母集団の平均値が特定の値に等しいかどうか → t 検定の原理 ページで詳しく解説しています。
  2. 2 群の母集団の平均値が等しいかどうか
  3. 回帰直線を引いたときに、その勾配が 0 に等しいかどうか

いずれの場合も、「帰無仮説 = 等しい、対立仮説 = 等しくない」である。

このページでは、「対応がなく分散が等しいと仮定できる場合の t 検定の原理」 と、t 検定を使う際の実践的な注意事項を解説する。 t 検定について原理からよく理解したい人は、以下の順にページを読んでもらいたい。

t 検定を理解するために

以下の順番に読んでみて下さい。

  1. 仮説検定
  2. z 検定
  3. t 検定の原理 - 母平均の検定
  4. 対応のある t 検定
  5. t 検定の原理 #3: 正規分布、等分散の場合
  6. Welch の t 検定: 等分散と言えない場合
  7. Mann-Whiteney の U 検定: ノンパラ
  8. t 分布
  9. 実践: Excel での t 検定

対応のない等分散 t 検定の原理


例題

東地区と西地区からガソリンスタンドを 16 店舗ずつランダムに選び、価格を調査した。両地区の平均価格は同じと言えるか? ただし、両地区の分散は同じと考えて良いものとする。

東地区
119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113

西地区
118 115 115 122 118 121 120 122 120 113 120 123 121 121 109 117


分散が等しいと仮定できる場合は、対応のある t 検定とほとんど状況が変わらない。 唯一異なるのは、標本数が等しいとは限らない ので、検定統計量を定義する際にこの点を考慮しなければならないことである。この問題は、併合分散 merged variance と呼ばれる分散値を使うことで解決する。

母分散の値はわからないが、2 標本の分散が等しいと仮定できるので、それらをプールした併合分散を考えることができる。



u2e は併合分散、u2a は 標本 A の分散、u2b は標本 B の分散、na は A の標本数、nb は B の標本数である。

ここで以下のように検定統計量 t を定義すると、これは自由度 na + nb -2 の t 分布に従う。



Xa, Xb は、それぞれの標本の平均値である。 あとはこの通りに t を算出し、通常の仮説検定を行えばよい。

ここのポイントは、等分散を仮定すると併合分散を導入できることである。等分散を仮定できない場合は、以上の操作を近似に基づいて行う Welch の検定 が必要になる。

また、等分散性の検定をかけてから平均値の比較を行っている場合もあるが、この是非については Preliminary test のページ を参照のこと。


R による対応のない等分散 t 検定

更新予定、とりあえずコマンドのみ。

  • t.test(group1, group2, var.equal=T) で等分散を仮定した検定
  • t.test(group1, group2, var.equal=T, paired=F) で paired
  • t.test(group1, group2) で Welch の検定

広告

コメント欄

一言コメントをどうぞ! (100 字まで)

フォーラムを作ったので、各ページにあるコメント欄のうち、コメントがついていないものは順次消していきます。今後はフォーラムをご利用下さい。管理人に直接質問したい場合は、下のバナーからブログへ移動してコメントをお願いします。


References