t 検定の基礎

statistics/group_comparison/t_test_mean_principle
2018/05/06 更新

  1. 概要: t 検定とは
  2. t 値の分布

広告

概要: t 検定とは

このページでは,t 検定の原理を理解するために,もっともシンプルな t 検定である「母分散が未知の場合の母平均の検定」を行う。仮説検定 hypothesis testz 検定 のページを理解していることが前提である。実際に,やっていることは z 検定と非常によく似ている。

z 検定と同様に,文献 1 の例題を用いる。


例題 1

ある地域に立地する全てのスーパーマーケットの昨年の卵 1 パックの平均価格は,117 円でした。今年は,地域からランダムに 20 店舗を選び,卵 1 パックの値段を調査することになりました。結果は,次の通りです。

119; 117; 115; 116; 112; 121; 115; 122; 116; 118;
109; 112; 119; 112; 117; 113; 114; 109; 209; 118;

この結果から,地域内全てのスーパーマーケットの今年の卵 1 パックの平均価格は,117 円であるといえるでしょうか?

なおデータは正規分布に従うが,その母標準偏差は未知である。この部分が唯一 z 検定と異なる。


仮説検定のページの流れに従い,

帰無仮説: 平均価格は 117 円である。
対立仮説: 平均価格は 117 円ではない。

のように仮説を設定する。検定統計量 z を算出するには母集団の標準偏差 σ が必要であるが,今回は未知なので,検定統計量 t を下のように計算する。

z value z value

z 検定に用いる検定統計量,z 値。
m は標本平均,μ は母平均,
σ は母標準偏差
n は標本数である。

t 検定に用いる検定統計量,t 値。
m は標本平均,μ は母平均,
u は標本集団の標準偏差 (不偏分散から算出),n は標本数である。


上の 20 個の値から計算すると,t = -2.1379 となる。そこで次に,この -2.1379 という値が現れる確率がどれだけ小さいかを検討することになる。



t 値の分布

z 値は標準正規分布に従う値であったが,この t 値は t 分布 に従う統計量である。そして,t 分布は自由度 degree of freedom のみの関数である。

t 分布表 (2) および t 分布の図 (3) を以下に載せておく。


例題の場合,自由度は 19 になる。有意水準 5% での棄却域はプラスマイナス 1.729 になるため,帰無仮説は棄却される。つまり,この条件で - 2.1379 という t 値が現れる確率は 5% 以下と極めて低いことになる。したがって,「平均価格は 117 円とは有意にずれており,117 円であるとは言えない」という結論になる。

次はいよいよ,「普通の」2 標本の平均値の差を検定する t 検定に移ります。対応のある t 検定のページへ進んで下さい。



広告

コメント欄

一言コメントをどうぞ! (100 字まで)

このコメント欄は各ページにあるので、いつ管理人がコメントを見ることになるのか分かりません。内容について質問がある場合は、下のリンク先のフォームから質問頂ければ、早めに返信するようにします。


References

  1. MATLAB による仮説検定の基礎. Web pdf.
  2. "Tabla t" by Jsmura - Own work. Licensed under CC BY-SA 4.0 via Wikimedia Commons.
  3. "Student densite best" by The original uploader was Thorin at French Wikipedia - Transferred from fr.wikipedia to Commons.. Licensed under CC BY-SA 1.0 via Wikimedia Commons.