カイ二乗検定・独立性の検定:
原理と Excel による解析

UB3/statistics/group_comparison/chi_square

このページの最終更新日: 2020/09/12

  1. カイ二乗検定: 独立性の検定 by Excel
    • 1. 期待度数の表を作る
    • 2. カイ二乗値を計算する
    • chisq.test 関数の使い方
  2. カイ二乗検定の実際

広告

カイ二乗検定: 独立性の検定 by Excel

このページでは、与えられた 2 つの集団の分布が一致しているかを判定する 独立性の検定 について解説する。カイ二乗検定・適合度の検定 のページの続きなので、まずはリンク先のページを読むことをお勧めする。

適合度の検定 goodness-of-fit testでは、母集団の分布をそのまま期待値とした。しかし、独立性の検定では母集団が与えられていないため、2 群のデータから期待値を算出する必要がある。違いはそれだけである。同じように、問題を解きながら実際に作業するのがいいだろう。

問題

治療法 A, B を比較した結果、治療によって回復した人、回復しなかった人の割合として以下のようなデータが得られた。2 つの治療法の効果は有意に異なっていると言えるか?



解答

1. 期待度数の表を作る

以下のように、期待度数は、合計値から算出する。この場合、「治療 A と治療 B で頻度に差がない」というのが帰無仮説になる。

偏りがない場合、「回復した」と「回復せず」の割合は、治療 A でも治療 B でも 89 : 41 になるはずである。よって、「治療 A」「回復した」の期待値は、50 * 89 / 130 = 34.2308 となる (黄色のハイライト)。

これと同様にして、4 つの期待度数を計算する。

  • 54.7692 = 80 * 89 / 130
  • 15.7692 = 50 * 41 / 130
  • 25.2308 = 80 * 41 / 130

要するに、その行・その列の合計値を掛け合わせて、総計の 130 で割っているだけ。これで観測度数と期待度数が得られたので、カイ二乗値を計算することが可能になる。


2. カイ二乗値を計算する

カイ二乗値は、以下の式で与えられる。

実際に数字をあてはめてみると以下のようになり、これがカイ二乗分布に従うわけである。あとは chisq.dist.rt 関数でカイ二乗値 1.15429 と自由度 1 から計算してもいいし、chisq.test 関数を使ってもいい。


chisq.test 関数の使い方

chisq.test 関数を使うなら、自分でカイ二乗値を計算する必要はない。chisq.test(実測度数の範囲, 期待度数の範囲) とすればよい。具体的にはこんな感じに、4 つのセルを選択する。


当然のことながら、P 値はいずれの方法でも同じになる。この場合、P = 0.28265 なので、治療法 A と B は有意に異なるとは言えない、という結論になる。


広告

カイ二乗検定の実際

実際にカイ二乗検定をする際の注意点もメモしておく。

  • パーセンテージを直接使った検定はできない。2 つの値、X% と Y% があるとすると、これらを算出したもとの数 A, B, C および D があるはずである (X% = A/B * 100、Y% = C/D * 100)。この整数値 A から D を用いて検定を行う。

広告

References


コメント欄

各ページのコメント欄を復活させました。スパム対策のため、以下の禁止ワードが含まれるコメントは表示されないように設定しています。レイアウトなどは引き続き改善していきます。「管理人への質問」「フォーラム」へのバナーも引き続きご利用下さい。

禁止ワード: http, the, м (ロシア語のフォントです)


このページにコメント

Name:


Comment:



これまでに投稿されたコメント

Date Name Comment