仮説検定: 原理、帰無仮説、対立仮説など

UB3/statistics/basics/hypothesis

このページの最終更新日: 2024/09/30

  1. 概要: 仮説検定とは

広告

概要: 仮説検定とは

仮説検定とは、母集団に関して立てた 仮説が間違いであるかどうか を、標本調査の結果をもとに検証することである (1)。大まかに、以下のような段階を踏む。

  1. 仮説を設定する
  2. 検定統計量を求める
  3. 判断基準を定める
  4. 仮説を判定する
 

なぜ、わざわざ否定するための仮説を立ててから、それを否定するという面倒な形をとるのかは、ページ下方の「白鳥の例え」を参考にすると分かりやすい。


1. 仮説を設定する

検定を行う人は、2 つの仮説、帰無仮説 null hypothesis (H0) と、対立仮説 alternative hypothesis (H1) を設定する。

帰無仮説は、主に 否定したいことを定義する仮説 で、通常は等式で表せる形式で設定する。たとえば、「2 群に有意差がある」と言いたい場合は、「2 群は同じである」という帰無仮説を立ててから否定するという手順をとる。

  1. 喫煙者と非喫煙では、体重に差がない。両者の体重をそれぞれ BwS および BwNS と置くと、BwS = BwNS。
  2. ある地域のスーパーマーケットの昨年の卵 1 パックの平均価格は 117 円であった。今年の平均価格 m も同じく 117 円である (1)。 (m = 117)

対立仮説は、帰無仮説と背反関係 (同時に成り立たないということ) にある仮説のことをいう。上の帰無仮説と対応して、

  1. まず考えられるのは、BwS ≠ BWNS である。
    しかし、BwS > BWNS や BwS < BWNS も帰無仮説と背反関係にあり、対立仮説として用いることができる。つまり、可能な対立仮説は
    • BwS ≠ BWNS。これは「BwS > BWNS または BwS < BWNS」と同等である。
    • BwS > BWNS
    • BwS < BWNS
    の 3 つである。一番上の仮説を用いる検定を両側検定、下の 2 つのうちいずれかの仮説を用いる検定を片側検定という。
  2. 同じ論理により、m ≠ 117, m > 117, m < 117 の 3 通りの対立仮説がある。

ただし、1 回の検定で設定できる対立仮説は 1 個だけである。この後は帰無仮説を正しいと仮定して検定統計量を求め、その出現確率から帰無仮説を棄却するという流れになる。


2. 検定統計量を求める

検定統計量 test statistic とは、検定に使うデータを要約したものである (1)。統計的に表現すると「確率変数 random variable を標準化したもの」ということができるらしい。

検定統計量には、例えば以下のようなものがある。検定統計量の名前 (z 値、t 値など) がそのまま検定の名前 (z 検定, t 検定) として使われることが多いようである。


z value

z 検定に用いる検定統計量、z 値。

z value

t 検定に用いる検定統計量、t 値。



3. 判断基準を定める

検定統計量は適当に定められたわけではなく、正規分布 normar distribution や t 分布 t distribution など 何らかの分布に従うように設定された数 である。したがって、その分布の形から、「今回の実験で得られた検定統計量 (たとえば 2.1) が発生する確率 probability」を求めることができる。

この確率は P 値 P value と呼ばれる。P 値が有意水準 level of significance と呼ばれる値よりも低いとき、一般に「帰無仮説が棄却された」ということになる。

これは、「帰無仮説では説明できないほど珍しいことが起きた」ということである。有意水準としては 5% (0.05) や 1% (0.01) がよく用いられる。この値を予め設定しておく。


4. 仮説を判定する

最後に、得られた検定統計量および有意水準を用いて、仮説を判定する。具体例の方がわかりやすいと思うので、z 検定 のページを参照して頂きたい。


広告

白鳥の例え: なぜわざわざ否定するための仮説を立てるのか?

集めてきたデータを使って、設定した仮説が正しいことを証明するのは難しい ためである (2)。文献 2 の白鳥の例を紹介する。

例えば、「白鳥は白い」という仮説が正しいことを証明するのはどうすればいいだろうか? 仮に 100 羽の白鳥を集めてきて、それが全て白かったとしても、これは仮説の証明にはならない。今回のサンプルに、たまたま黒い白鳥が含まれていなかっただけかもしれない。

サンプルが 1000 羽になっても 10000 羽になっても同じである。この仮説を証明するには、世界中の全ての白鳥について調査を行わねばならず、これは標本調査ではないため、仮説検定とは無縁な研究になる。

一方、仮説を否定することは容易である。この場合、(実際に見つけることが容易かどうかわからないが) 黒い白鳥を 1 羽みつけてくればよいわけである。

そのために、仮説検定では帰無仮説を「否定する」ためのデータを集めてくることになる。

歴史

仮説検定の考え方は、1933 年にネイマンとピアソンによって提唱された (3)。


広告

References

  1. MATLAB による仮説検定の基礎. Web pdf.
  2. 佐藤弘樹、市川度 2013.

生存時間解析 について平易に書いた数少ない解説書。

統計のなかでも、生存時間解析はそれだけで 1 冊の本になるほど複雑なわりに、ANOVAや t 検定などと違い使用頻度が低いため、とっつきにくい検定である。

この本では、とくに Kalpan-Meier 生存曲線、Log-rank 検定、Cox 比例ハザードモデルを重点的に解説しているが、prospective study と retrospective study, 選択バイアス、プラセボなど、臨床統計実験で重要な概念についても詳しい説明がある。臨床でない、基礎生物学の実験ではあまり意識しない重要な点であるので押さえておきたい。


  1. なるほど統計学園高等部. Link.

コメント欄

サーバー移転のため、コメント欄は一時閉鎖中です。サイドバーから「管理人への質問」へどうぞ。