実際の論文から統計を学んでみる③-ログランク検定は何をしているのか-カプランマイヤー曲線
さて、ログランク検定が具体的に何をしているのか
掘り下げてみようと思います。
使用している論文がこちら
"Neck weakness is a potent prognostic factor in sporadic amyotrophic lateral sclerosis patients"
(, et al
前回までの記事はこちら
実際の論文から統計を学んでみる②-ログランク検定とは- - 脳内ライブラリアン
カプランマイヤー曲線の作り方から
まずカプランマイヤー曲線について。
被験者の死亡もしくは打ち切りまでの期間を
短い順に並べます。
死亡者が出た時点での死亡者数と打ち切りの数をカウントしていき
その時点での生存者数÷その前の時点での生存者を計算し
掛け算していくことで、生存割合を出していきます。
Dを死亡(death)、Cを打ち切り(censored)として横軸に時点をとり
模式図にして説明してみます。
n人の被験者がいると想定してみていきましょう。
一番左を始まりとすると
ひとつめの縦線の時点で最初の死亡者が1名でています。
残りはn-1名です。
生存割合はとなります。
次の縦線の時点で死亡者が2名出ました。
残るはn-2名です。
生存割合はになります。
ここで3本目の縦線の前に打ち切りが1名います。
なのでさらに減って生存者はn-3名。
この時は打ち切りなので生存割合は変化しないと考えます。
4本目の時点で減ってn-4名となります。
生存割合はとなります。
縦軸にこの生存割合、横軸に時間をとっていったものがカプランマイヤー曲線ですね。
死亡時点毎に区間を区切っていくことが特徴です。
ハザードの出し方
ここで時点毎の瞬間の死亡率(=ハザード)はどうやって出すか。
4本目の縦線(赤)の時点をj番目、t(j)と考えて説明してみます。
死亡がごく短い時間δの間に起こるものと考えます。
そうしないと死亡率の算出ができないので
これはそういう決まりだと思ってもらえればいいのかなと思います。
死亡者数が今回は1ですが死亡者数をd(j)とすると
その瞬間での死亡率はで表されます。
長くなってきたので続きはまた次回。
参考文献:「医薬統計のための生存時間データ解析 第2版」