実際の論文から統計を学んでみる①-比例ハザード性とは-
今回は医師向けの内容です。
最近数理統計学をそれなりに勉強したので
多変量解析とか生存時間解析などの
応用分野に手を伸ばし始めています。
これでようやく普段読む論文の解析内容に近づいてきました。
そこで、論文の内容みながら
解析方法についてどんなものか学んでいきたいので
freeで手に入る実際の論文をみつつ、どんな解析方法を使っているかを中心に
記事にしていきたいと思います。
今回使用する論文は2013年にBMJ系のジャーナルに掲載されていたもので
"Neck weakness is a potent prognostic factor in sporadic amyotrophic lateral sclerosis patients"
(, et al
です。
ALS患者の予後が頚部屈曲の筋力で予測できる、というものですね。
google scholarなどで検索していただければfreeで本文が手に入ります。
研究の方法
まずはどのような研究かというところを簡単に。
投げっぱなしですみませんが、、詳細は本文を読んでください。
内容としては前向きコホート研究ですね。
登録されたALS患者の筋力を色々な場所でMMT(徒手筋力検査)で計測し
primary endpoint(死亡もしくは気管切開などの6つ)を満たすかフォローして
予後予測因子としてどの部位の筋力が優れているか
Cox回帰分析した、という具合です。
またカプランマイヤー生存曲線についてはログランク検定を行っています。
、、、とここでログランク検定とCox回帰分析って
何やっているんだね、というところを掘り下げたいと思います。
比例ハザード性が大前提
まずその前に、比例ハザード性について知る必要があります。
何故これが必要かと言えば
ログランク検定もCox回帰分析も比例ハザード性を前提としているからです。
ハザードとハザード比とは
(2020.10.17追記、内容に色々ミスがあったので書き直しました、すみません)
そもそもその前に比例ハザード性のハザードって何でしょう。
ある時間(t)における瞬間死亡率をハザードと呼びます。例えば日単位で被験者を観察している研究であれば、ある日~ある日+1日の間に死亡した人の数と生存者数から、ある日の瞬間死亡率を算出することができます。
このハザードどうしの比率をハザード比と呼びます。さらにハザード比が時間に関わらず、一定に保たれることを比例ハザード性と言います。比例ハザード性が保たれているのかどうかは、大まかに言えばカプランマイヤー曲線をみると分かります。
カプランマイヤー曲線というと大体こんな感じだと思います。
比例ハザード性が保たれている→生存曲線が”交わらない!”
ということが参考になります。
考えてみれば自然で、初めからずっとハザード比が一定ならば、交わるはずがありません。ただこれはあくまで必要条件であって十分条件ではないので、絶対的な基準にはなりません。
前述のログランク検定やCox比例ハザード回帰(名前の通りですが)では
比例ハザード性を前提に数式を作って、計算しています。
なので比例ハザード性が全く保たれない生存関数どうしでは、ログランク検定やCox回帰には適していないというべきでしょう。
今回の論文でFigure1 D、E、Fの青と緑はいずれも交差しており
もし青と緑の比較をする場合は
そもそも比例ハザード性が成立しないので
ログランク検定はあまり適していません。
比例ハザード性が保たれない例として
時間に応じて変化する要因がある場合が考えられます
(2021.05.01 追記)
比例ハザード性が保たれない例は、後で書き直したこちらの記事の一部に書きました
ちなみに
生存曲線が交わらない→比例ハザード性が保たれている ではないので
注意が必要です。
今回はここまでで、ログランク検定とCox回帰については次回書きます。
参考文献:「医薬統計のための生存時間データ解析 第2版」
高い買い物ですが、数式の証明も含めてきっちり書いてあります。