生存時間分先 - Log rank 検定:
原理、R を使った実際の検定、論文への記載方法など

statistics/survival/log_rank
2018/09/20 更新

  1. 概要: Log-rank 検定とは
  2. 群が複数あるときの Log-rank 検定
  3. 生存曲線が交差する場合
  4. R を使った Log-rank 検定

広告

概要: Log-rant test とは

Log-rant test とは、ある時点の生存率でなく、生存曲線の全体を比較 することができる生存時間の検定手法である。

生存時間 T は、一般に正規分布 normal distribution には従わず、exponential distribution, Weibull distribution, Lognormal distribution などの分布に従う (4)。したがって、寿命を t 検定などのパラメトリック検定で比較するのは正しくなく、Log-rank 検定などの専用の検定が必要となる。


Log-rank 検定の基本的な考え方は、カイ二乗検定 chi-square test に似ているようである (5)。

  1. 右図の生存曲線 (3) である時点 t1 を選び、そこで n 件の死亡が起こったとする。
  2. 例えば図で 2 年の時点を考えると、個体数はおよそ A : B = 1.5 : 1 であるため、n 件の死亡のうち 1.5/2.5 は A 群で、1/2.5 は B 群で起こると予想される。
  3. ただし、これは両群の死亡率 (つまり生存期間) に差が無い状態であり、実際にはこの割合から微妙にずれて死亡というイベントが起こっているわけである。
  4. 生存曲線全体にわたって、この ずれ の具合を検定するのが Log-rank 検定である。

広告

群が複数あるときの Log-rank 検定

Log-rank 検定は、基本的に 2 群の生存曲線を比較 するための検定である (5)。複数の群を比較する場合は、多重検定となる。最もシンプルは方法は、有意水準を低めに抑える Bonferroni 補正をかけることである。


生存曲線が交差する場合

Log-rank test は、proportional hazard rates を仮定した場合に、最適な power を与える検定である (9)。

生存曲線が交差するということは、瞬間生存率が交差している時点の前後で異なることを意味する。したがって、瞬間生存率が一定であることを仮定する Log-rank test を使えないので注意が必要である。詳細は 生存曲線 のページに。


R を使った Log-rank test

統計パッケージ R を使い、実際に Log-rank test を行う方法を解説する。データフレームの作り方については、R: データフレームの作成 を参照のこと。

R で Log-rank test を行うには、少なくとも以下のデータが dataframe に含まれる必要がある。

  • 生存時間
  • 打ち切りの有無
  • 群 (上に書いたように 2 群が基本)

簡略化のため、3 個体 x 2 群でデータフレームの例を示しておく。念のため、作り方は次の通り。



データテーブルは以下の通り。

group time censor
1 A 10 1
2 A 11 1
3 A 10 1
4 B 19 1
5 B 25 1
6 B 23 0

グループ B は A の約 2 倍長生きで、6 番の個体のみ打ち切りであったというデータである。このデータの並べ方は重要。この他、性別や年齢など関連するデータがあるなら、列を追加してもよい (10)。

このようなデータフレーム test がある状態で、以下のように survival パッケージを読み込み、ログランク検定をかける。


> library(survival)
> test_stat<-survdiff(Surv(time,censor)~group,data=test)


これによって test_stat というデータフレームに Log-rank 検定の結果が格納される。test_stat と入力すれば、結果が見られるわけである。



なお、上の結果からわかるように、得られる検定統計量は chi square value である。統計検定の英語表現 のページにまとめたように、上記の Log-rank 検定の結果を paper に記載するときの正式な表記法は、Log-rank test, chi-square = 5.2, p = 0.02 のようになる。


広告

コメント欄

フォーラムを作ったので、各ページにあるコメント欄のうち、コメントがついていないものは順次消していきます。今後はフォーラムをご利用下さい。管理人に直接質問したい場合は、下のバナーからブログへ移動してコメントをお願いします。


References

  1. R と生存時間分析. Link.
  2. 汪 2005a. 生存時間解析入門. pdf file.
  3. "Km plot" by Deanne Taylor (made and original to submitter) - Transferred from en.wikipedia to Commons by Maksim. The original description page was here. All following user names refer to en.wikipedia.. Licensed under Public Domain via Wikimedia Commons.
  4. JMP Statistics and Graphics Guide. SAM, 2007.
  5. 佐藤弘樹、市川度. 2013.
  1. カプランマイヤー法、ログランク検定の結果とCox比例ハザード解析の結果の解釈について. Link.
  2. 生存曲線が交差する場合. Yahoo 知恵袋. Link.
  3. Survival analysis. thebmj. 広告付きリンク.
  4. Li et al. 2014a. Statistical influence methods for two crossing survival curves: a comparison of methods. PLoS ONE 10, e0116774.
  5. R で生存時間分析を行う. Link: Last access 2018/09/20.