脳内ライブラリアン

脳内ライブラリアン

医療、統計、哲学、育児・教育、音楽など、学んだことを深めて還元するために。

MENU

実際の論文から統計を学んでみる⑤-Cox比例ハザード回帰とは-

実際の論文をみつつ統計学習をしてきましたが

今回の論文についてはここでいったん最後です。

 

使用している論文がこちら

"Neck weakness is a potent prognostic factor in sporadic amyotrophic lateral sclerosis patients"

(Nakamura RAtsuta NWatanabe H, et al 

 

前回までの記事はこちら

実際の論文から統計を学んでみる① - 脳内ライブラリアン

実際の論文から統計を学んでみる②-ログランク検定とは- - 脳内ライブラリアン

実際の論文から統計を学んでみる③-ログランク検定は何をしているのか-カプランマイヤー曲線 - 脳内ライブラリアン

実際の論文から統計を学んでみる④-ログランク検定は何をしているのか-超幾何分布 - 脳内ライブラリアン

 

 

今回は論文中のtable1, table2について。

table1では登録時の各筋群ごとで

Cox比例ハザード回帰でハザード比を出しています。

 

table2では過去の研究で明らかな予後予測因子を組み込んだ

Cox比例ハザード回帰で頚部屈筋のハザード比を出しています。

 

そこで「Cox比例ハザード回帰」について今回は説明してみます。

 

Cox比例ハザード回帰とは

①で書いた「比例ハザード性」を前提として

生存時間解析において回帰分析を行う方法です

 

そもそも回帰分析とは
あるデータを関数(要は数式)に当てはめて
結果を予測する方法の総称です。

 

回帰分析では基本的には得られたデータを使って

従属変数(結果)=説明変数(要因)の式

で表します。

 

生存時間解析の場合、時間の概念があるため

時間tをこの式の中に組み込まなければなりません。

 

ちなみにCox回帰分析は、単変量~多変量まで可能で
質的データ(男女、MRC score毎など)、量的データ(年齢、%VCなど)の
どちらも対応可能です。

 

今回の例でいけば
説明変数(得られたデータ)は「もともと知られている予後指標」
→登録時の年齢、性別、罹病期間、%VC、ALSFRS-R score、リルゾールの内服
 球麻痺症状、revised El Escorial citeriaの分類
従属変数(結果)は「Primary outcomeのイベント数」と
そのほか解析したADL指標のイベントになります。

 

Cox回帰で使われる関数をみて、ざっくりしたイメージをつかみます。

 

Cox回帰ではある時点tにおける瞬間的な死亡率を

ハザード関数h(t)で表します。

被験者毎に説明変数(疾患の死亡率に影響する要因の有無や数値)が

違うため、その人ごとにハザード関数は異なります。

 

例えば、i番目の被験者のハザード関数を考えると式は
h_i(t)=exp(\beta_1x_{1i}+\beta_2x_{2i}+\beta_3x_{3i}+…+\beta_9x_{9i} ) h_0 (t)
となっています。

 

xはそれぞれの説明変数

(今回の研究では既存の8つ+本研究で知りたい1つの計9つ)を表します。
βは説明変数ごとの影響の大きさを表し、偏回帰係数と呼ばれます。

h_0(t)はベースラインハザード関数と言われ
説明変数の要因が全て0である場合のハザードを表します
全てのxに0を代入すると分かると思います

 

何で式にexpが出てきたの?と言う理由は
単純に負にならないようにするためです

 

前述の通りハザードは瞬間死亡率なので
ハザードが負になるということはあり得ません

 

別にexpじゃなくてもなんでもいいかもしれませんが
logとったときに計算しやすいのでexpになってます


ここで大事なのは先ほどの比例ハザード性を前提として
関数が成り立っていること

 

式における
exp(\beta_1x_{1i}+\beta_2x_{2i}+\beta_3x_3i+…+\beta_9x_{9i} )
の部分はtに依存しない関数であることが分かります

つまり、
「tによらず一定の比例を保つ=比例ハザード性が成立」を前提にしています

 

あとは実際の回帰分析ですが
得られたデータからソフトを使って
具体的なβの値をそれぞれ算出します

 

この過程は難解すぎるので割愛します・・・

 

すると、たとえばβ1を算出できれば
exp(\beta_1)がハザード比として求まります
こうして算出されたのがハザード比です


この部分がtに依存せず、比例をしている部分となります

 

論文の結論は

こうして回帰分析で出されたハザード比は

生存曲線どうしの平均的な傾きの比になります。

 

table1の結果から筋群の中では頚部屈筋が最も有力な指標であり

さらにtable2で過去の予後予測因子も組み込んだより正確(と思われる)モデルでも

有意差が得られており、頚部屈筋が予後の予測に有用であることが

示されています。

 

参考文献:「医薬統計のための生存時間データ解析」