脳内ライブラリアン

脳内ライブラリアン

医療、統計、哲学、育児・教育、音楽など、学んだことを深めて還元するために。

MENU

アダム・スミスはいつ生まれてどんな人だったか?

先日第二子が生まれたので更新はゆっくりになりそうです。コロナの関係で出産時含めて全然会えないので、まだ実感がしっかりわきません。会うのが楽しみです。

 

 

最近経済思想史の入門書を読んで

1700年代の人から色々と興味のある哲学や経済史を学んでみようと思ったので

少しずつまとめてみます。

 

高校以降こういったことを学ぶ時もなく

背景知識は正直全然ありません。

 

当時のセンター試験では倫理学を選択しており

授業や教科書も結構好きでした。

ただ深く学ぶことは全くなかったです。

 

また、世界史もさして高校時代から良い点数もとっておらず

普通のことから書いていこうと思います。

 

あんまり上等な内容は書けませんが、練習がてら

記録のようなまとめになります、すみません。

 

ちなみに読んだ本はこちらです。

知識人の方が大好きなマルクスはよく分からなかったので 

いったん読み飛ばしました。

また、順番に勉強します。

 

アダム・スミスについて知っていること

f:id:medibook:20200508053947j:plain

 

本を読む前の印象で知っていることと言えば

国富論」を書いて

需要と供給による市場の自動調整作用のことを「見えざる手」

と言っていたということぐらいでした。

 

そのため、とにかく政府よりも市場の調整に任せようとする

市場主義の印象が強く、どちらかと言えば冷たい印象だったのですが

実は、全然違いました。

 

もう一つの著作「道徳感情論」について知ることで

「見えざる手」だけではない国富論についてがみえてきます。

 

アダム・スミスの生まれた時代

まずいつの時代の人なのか。

その人の考えが生まれるには、社会的な背景を知ることが必要です。

アダム・スミスは1723年生まれ、1790年に67歳で亡くなっています。

 

1700年代にはそもそも何があったのか。

イギリスでは産業革命が始まってきた時代です。

徐々に重工業化を進め、商品を貿易で売って利益を上げる方向に

国が動いていた頃。

こうして商業を重視し、”金銀・貨幣の蓄積=国の富”としていた時代でした。

 

また、1740-1748年のオーストリア継承戦争

1756-1763年の7年戦争と出費がかさみ

税金up・借金増加の一途を

辿っていたようです。

 

加えて1775年にアメリカとの独立戦争が始まります。

格好の貿易相手・植民地であるアメリカを失いたくなかったと

思われ、痛手を負います。

 

アダム・スミスが活動していたのはこんな時代で

重商主義=国の富”にはつながらないと批判しています。

 

アダム・スミスの生涯

1723年スコットランドで生まれています。

イギリスの北の方ですね。

グラスゴー大学、オックスフォード大学で学び

オックスフォードを中途退学。

グラスゴー大学というと医療従事者としては

グラスゴーコーマスケールという意識障害の評価スケールが有名です。

 

その後1751年にグラスゴー大学で論理学教授になります。

28歳ですね、、若い。翌年には道徳哲学教授に。

この頃「道徳感情論」が書かれます。

「見えざる手」ばかりが有名ですが

当時は経済学自体が真新しいもので

そもそもアダム・スミスは道徳哲学が専門だったのですね。

 

その後貴族の家庭教師として3年ほど

フランスやスイスを旅行したようで

この際様々な知識人(ヴォルテールダランベール

エルヴェシウス、ケネー、テュルゴー)と交流を深めます。

ヴォルテールテュルゴーは名前を聞いたことある気がしますが

他はあまり知りません、、、

国富論」はこの後の著作であるため、こうした交流の影響はあったようです。

 

その後はイギリスに帰国し、執筆活動を続け

グラスゴー大学の名誉総長にも就任。

67歳に亡くなっています。

 

次は「道徳感情論」の考え方について書いていきます。

 

参考文献:

読みやすく、代表的な著作の考え方を簡潔に要約してまとめてあり

理解しやすかったです↓

 

医療者が哲学・倫理・経済を知る意味

以前から興味はあったのですが

哲学史経済思想史などをぼちぼち本読みながら

まとめていこうかなと思ってます。

 

普通に医者やるだけなら必須ではないと思いますが

何でそれをやろうと思うのか目的からまず書こうと思います。

 

医学には答えがないことも多い

医療従事者はなんとなくわかるだろうと思いますので

そうでない人向けに書きます。

 

医学は基本的に科学に則ったもので

明確に答えが出ているものも多くあります。

 

細菌感染したら抗生剤を使用する、なんていうごく単純な話は

世界中どこへ行ったって最早同じです。

明確に答えがあります。

 

ただ、普段の診療の場面においても

もっと広い視野でみた場合でも

答えが出ないことは多くあります。

 

例えば、自分がみている脳神経内科では

脳梗塞の患者さんが最もよく入院してきます。

 

脳梗塞は脳の血管が詰まることで起こる疾患で

大多数は生活習慣病による影響です。

きちんと管理している人もいれば

健診の結果での医療機関受診指示をちゃんと真に受けず

放置していた結果、脳梗塞になってしまう人もいます。

 

自分が悪かった、と認める人もいれば

家族に迷惑がかかっても、ライフスタイルを変えない人もいます。

 

医療従事者は得てして後者の人には冷たい目線を注ぐことが多いです。

防ごうと思えば防げたかもしれないのに

それをやろうとせず、入院を繰り返す場合にはそりゃ怒りも感じます。

 

 

ただ、これも突き詰めていくとどこまでが

本人のコントロールできたことなのかは線引きが難しいところです。

 

最近ではデータの集積に伴って

生活上のリスク要因がどんどん明らかになっていきます。

ありとあらゆるリスクを徹底的に管理しないと

全て自己責任になってしまうのでしょうか。

果たして自分の身を省みたときに

そこまで良い生活を心掛けているのでしょうか。

 

また、どこまでが「本人の責任」といえるのか、という点も問題です。

労働環境が悪くて、運動などの良い習慣ができないのか。

収入の問題で食生活が悪いのか。

あるいは知識と治療上の教育が不足しているが故に

きちんと薬を飲んだりできないのか。

 

これには明確な解答がありませんし、今後も出てきません。

「個人の自由」や「自由意志」があまりにも尊重されてきたがために

かえって病気を助長し、周りの人の負担となり自由を阻害している

可能性はあります。

こうしたことを考えるときに

「どのような流れで個人の自由が獲得されてきたか」

「平等をどう考えるのか」

はどうしても必要になります。

 

その場合に哲学・倫理的な歴史や流れは役立つと思います。

 

広い視野でみた場合に経済の影響は免れない

もう少し広い視野で考えてみた場合。

 

神経内科では希少疾患と呼ばれる稀な病気の方々がいます。

 

有名な難病としてALSを例に考えます。

ALSは難病情報センターによれば

年間10万人あたり約1~2.5人程度新規に発症しているようです。

対して、先ほど例に挙げた脳梗塞

年間10万人あたり約100~200人程度と言われています。

 

ALSの方の健康寿命(自分で生活できる時間)を1年延ばす治療と

脳梗塞の方の健康寿命を1年延ばす治療があった場合に

どちらにお金を投資をするでしょうか。

 

個人的にはALSの健康寿命を1年伸ばせる治療があったら

素晴らしいと思いますが、それはさておき。

 

患者さんの総数とそれによって得られる時間を

単純に計算した場合、脳梗塞の治療に投資した方が

費用対効果では良いということになります。

 

ただ、この単純計算で考えると非常に厳しい話で

ALSの治療が脳梗塞の100倍近く良いものでない限り

予算が回ってこないことになってしまいます。

 

もちろん、現実には費用対効果だけで回っているわけではないので

数々の希少な疾患の研究も進んでいます。

 

 

 

もう一つ例を挙げます。

 

トランスサイレチン型家族性アミロイドポリニューロパチー

というまた稀な病気があります。

 

手足に伸びていく末梢の神経の障害が起きる病気で

年単位でゆっくりと手足のしびれや、筋力低下が進み

歩行できなくなり、感覚もなくなってしまう病気です。

 

この疾患の治療薬として昨年秋から

オンパットロという薬が採用になりました。

 

この薬以外にはビンダケルという内服薬があり、病状を抑えられるものの

ゆっくりと進行していまうというデメリットがありました。

 

オンパットロは3週間ごとに点滴していく薬なのですが

症状を若干上向きにする効果があります。

 

自分がこの病気になっているとしたらぜひとも使いたい薬です。

 

ただ驚きなのはその薬価で

薬瓶1本あたり、1004358円

そう約100万円です。

 

これを3週間ごとにやるので年間1700万円以上かかります。

難病であるため基本的に個人負担は3割にはなりません。

 

単純に患者さんの立場で考えれば使う以外の選択肢はないですし

自分も一医師としてはもちろん適応があれば使います。

ここまでの高額薬剤は非常に稀なので

医療費削減が求められる中、薬価ばかりに注目すべきではないと

思います。

 

ただ今後高額な薬剤が増えてきたときに

何を優先していくのか、ということも問題です。

 

それを語るには経済のこともわかってなければいけないですし

薬価を決める国の仕組みも知らないと何も言えません。

 

上述したどちらの話も考えるには

経済的な仕組みと思想の知識が必要です。

 

医療者が何でも知っていないといけない訳ではないけれど

医学部あるいは保健学科・看護の教育というのは

当たり前ながら基本的に医学(とわずかの周辺分野)の勉強が主体です。

他のことにはとにかく疎いんです。

少なくとも自分は。

 

一般的な教養も1-2年目で学びますが

正直そこで何かが身についているとも思い難いです。

(そうでない人もいると思いますが、全体からみると稀)

 

臨床医として仕事をする場合

倫理的な問題は患者さんを通じて学んでいくこともできますし

こういったことを何でも知っていないといけないことはないと思います。

 

ただ、臨床研究など社会的な必要性・関連が大きいことをしようとしたときに

その目的意識を明確にするには前述した問題に医学以外の知識で

きちんとアプローチしていく背景知識が欲しいです。

 

また今回のコロナ感染では切に感じましたが

医療と経済、そのバランスをどう考えるかは

医療従事者の立場からも意見を言っていく必要がありますし

そのためには共通言語として互いのことをある程度知らなければ

本当の意味でバランスのとれた意見を言えません。

 

自分の中でも目的意識を出したいので長々と書きましたが

少しでもそういった知識が得られるように

ちょくちょくまた本を読んでいきます。

 

記事にはするものの

やっぱり専門ではないので、より詳しい方がいらっしゃれば

申し訳ないですが訂正・コメントがもらえると嬉しいです。

群発頭痛の発作期治療の論文"Prednisone in Short-term Prevention of Episodic Cluster Headache"

今回は専門の話。

 

2020.5.1にNeurologyから群発頭痛の発作期治療としての

プレドニンのRCTの論文が出ました。

 

群発頭痛といえば

今まで発作期→再発予防期の薬剤までのつなぎに

酸素投与ぐらいしかなかった印象で

プレドニンは効果あるけれど

エキスパートオピニオン止まりだったと思うのですが

ついにRCTが出たみたいです。

 

論文名と雑誌は以下です↓

"Prednisone in Short-term Prevention of Episodic Cluster Headache"

Neurology April 14, 2020; 94 (15 Supplement)

 

まだabstractしかみられませんが

プレドニゾン100mgを5日間→20mgずつ漸減と

プラセボ群の比較で

109名の被験者をITT解析しています。

primary endpointは最初の1週間以内における発作回数としています。

 

結果としては
primary endpointの発作の平均回数が

プレドニゾン群 7.1回 (SD: 6.5, 95%CI 5.3 8.9) vs

プラセボ群 9.5回(SD: 6.0, 95%CI 7.9 11.2], p=0.02)

だったようです。

さらに1週間後の発作消失が

プレドニゾン群で34.7%に対してプラセボ群では7.4%でした。

 

臨床的に群発頭痛って自分で診断した人は一人くらいしかいないので

全体の印象はよくわからないのですが

結構しっかり差が出ていますね。

 

これで大手を振ってプレドニンが使えますね。

細かい内容はまた出たら読みたいところです。

現代数理統計学の基礎 6章 問15

久々になりましたが統計学基礎の解説に戻ります。

 

問14は3章の別の問題の結果を多用しすぎていて

正直解説が若干めんどくさい、、、ので問15。

 

母数θを用いた関数の不偏推定量について

与えられるクラメールラオの不等式の問題です。

 

コーシーシュバルツの不等式を用いて証明していきます。

 

コーシーシュバルツの不等式はネットで検索してみてください。

 2乗の和≧各数積の和の2乗というのですね。

期待値について用いると以下のような使い方になります。

\{E[(\hat h(x)-h(\theta))S_n(\theta,x)]\}^2\leq E[\{\hat h(x)-h(\theta)\}^2]E[\{S_n(\theta,x)\}^2]

 

ここで右辺は

E[\{\hat h(x)-h(\theta)\}^2]E[\{S_n(\theta,x)\}^2]\\=Var(\hat h)I_n(\theta)

となります。

 

 (h(\theta)の不偏推定量\hat h(x)なので

 逆に言えば、\hat h(x)の期待値は必ずh(\theta)になります。

 なので分散の定義に当てはまるわけです)

 

この時点でかなり解答に近づいています。

あとは左辺の中括弧の中身をh'(θ)に変換できれば証明できます。

まず左辺を展開して

E[(\hat h(x)-h(\theta))S_n(\theta,x)]\\=E[\hat h(x)S_n(\theta,x)]-E[h(\theta)S_n(\theta,x)\

となります。

 

ここで

E[S_n(\theta,x)]=\int\frac{\frac{d}{d\theta}f_n(x|\theta)}{f_n(x|\theta)}f_n(x|\theta)dx\\=\frac{d}{d\theta}\int f_n(x|\theta)dx=0

なので第2項は消えます。

 

第1項は

E[\hat h(x)S_n(\theta,x)]=\int\hat h(x)\frac{\frac{d}{d\theta}f_n(x|\theta)}{f_n(x|\theta)}f_n(x|\theta)dx\\=\frac{d}{d\theta}\int\hat h(x)f_n(x|\theta)dx\\=\frac{d}{d\theta}E[\hat h]=\frac{d}{d\theta}h(\theta)=h'(\theta)

となるので

 

Var_\theta(\hat h)\geq \frac{\{h'(\theta)\}^2}{nI_1(\theta)}

 

が証明されました。

実際の論文から統計を学んでみる⑤-Cox比例ハザード回帰とは-

実際の論文をみつつ統計学習をしてきましたが

今回の論文についてはここでいったん最後です。

 

使用している論文がこちら

"Neck weakness is a potent prognostic factor in sporadic amyotrophic lateral sclerosis patients"

(Nakamura RAtsuta NWatanabe H, et al 

 

前回までの記事はこちら

実際の論文から統計を学んでみる① - 脳内ライブラリアン

実際の論文から統計を学んでみる②-ログランク検定とは- - 脳内ライブラリアン

実際の論文から統計を学んでみる③-ログランク検定は何をしているのか-カプランマイヤー曲線 - 脳内ライブラリアン

実際の論文から統計を学んでみる④-ログランク検定は何をしているのか-超幾何分布 - 脳内ライブラリアン

 

 

今回は論文中のtable1, table2について。

table1では登録時の各筋群ごとで

Cox比例ハザード回帰でハザード比を出しています。

 

table2では過去の研究で明らかな予後予測因子を組み込んだ

Cox比例ハザード回帰で頚部屈筋のハザード比を出しています。

 

そこで「Cox比例ハザード回帰」について今回は説明してみます。

 

Cox比例ハザード回帰とは

①で書いた「比例ハザード性」を前提として

生存時間解析において回帰分析を行う方法です

 

そもそも回帰分析とは
あるデータを関数(要は数式)に当てはめて
結果を予測する方法の総称です。

 

回帰分析では基本的には得られたデータを使って

従属変数(結果)=説明変数(要因)の式

で表します。

 

生存時間解析の場合、時間の概念があるため

時間tをこの式の中に組み込まなければなりません。

 

ちなみにCox回帰分析は、単変量~多変量まで可能で
質的データ(男女、MRC score毎など)、量的データ(年齢、%VCなど)の
どちらも対応可能です。

 

今回の例でいけば
説明変数(得られたデータ)は「もともと知られている予後指標」
→登録時の年齢、性別、罹病期間、%VC、ALSFRS-R score、リルゾールの内服
 球麻痺症状、revised El Escorial citeriaの分類
従属変数(結果)は「Primary outcomeのイベント数」と
そのほか解析したADL指標のイベントになります。

 

Cox回帰で使われる関数をみて、ざっくりしたイメージをつかみます。

 

Cox回帰ではある時点tにおける瞬間的な死亡率を

ハザード関数h(t)で表します。

被験者毎に説明変数(疾患の死亡率に影響する要因の有無や数値)が

違うため、その人ごとにハザード関数は異なります。

 

例えば、i番目の被験者のハザード関数を考えると式は
h_i(t)=exp(\beta_1x_{1i}+\beta_2x_{2i}+\beta_3x_{3i}+…+\beta_9x_{9i} ) h_0 (t)
となっています。

 

xはそれぞれの説明変数

(今回の研究では既存の8つ+本研究で知りたい1つの計9つ)を表します。
βは説明変数ごとの影響の大きさを表し、偏回帰係数と呼ばれます。

h_0(t)はベースラインハザード関数と言われ
説明変数の要因が全て0である場合のハザードを表します
全てのxに0を代入すると分かると思います

 

何で式にexpが出てきたの?と言う理由は
単純に負にならないようにするためです

 

前述の通りハザードは瞬間死亡率なので
ハザードが負になるということはあり得ません

 

別にexpじゃなくてもなんでもいいかもしれませんが
logとったときに計算しやすいのでexpになってます


ここで大事なのは先ほどの比例ハザード性を前提として
関数が成り立っていること

 

式における
exp(\beta_1x_{1i}+\beta_2x_{2i}+\beta_3x_3i+…+\beta_9x_{9i} )
の部分はtに依存しない関数であることが分かります

つまり、
「tによらず一定の比例を保つ=比例ハザード性が成立」を前提にしています

 

あとは実際の回帰分析ですが
得られたデータからソフトを使って
具体的なβの値をそれぞれ算出します

 

この過程は難解すぎるので割愛します・・・

 

すると、たとえばβ1を算出できれば
exp(\beta_1)がハザード比として求まります
こうして算出されたのがハザード比です


この部分がtに依存せず、比例をしている部分となります

 

論文の結論は

こうして回帰分析で出されたハザード比は

生存曲線どうしの平均的な傾きの比になります。

 

table1の結果から筋群の中では頚部屈筋が最も有力な指標であり

さらにtable2で過去の予後予測因子も組み込んだより正確(と思われる)モデルでも

有意差が得られており、頚部屈筋が予後の予測に有用であることが

示されています。

 

参考文献:「医薬統計のための生存時間データ解析」

サイコホラーとコメディの絶妙なハーモニー「人魚姫のごめんねごはん」野田宏、若松卓宏

堅めな記事ばっかりなのでたまにはマンガの話でも。

 

最近はコロナによる外出自粛の影響で

オンラインのマンガもタダで読める量を増量されていることが

多いです。

 

読み直してもやっぱり面白いな、と思ったので

いまさらながら「人魚姫のごめんねごはん」について語ります。

やわらかスピリッツ」にて

現在も30話まで一気に読めますので未読の方はぜひ。

 

 

どんな話?

人魚姫のエラは友達であるおサカナたちと海の底で暮らしています。

時折人間に釣りあげられるお友達をエラ姫は地上に出て弔いに行きます、、、

と思いきや実はエラ姫は地上で調理されてしまった

お友達(魚)を食べており、それがやめられない止まらない

というサイコパスな話です。

 

”リトル〇ーメイド”でアリ〇ルがおさかなとかセバスチャンとか

こっそり食べている、のと全く同じです。

 

相当サイコな話です。

 

一線を超えすぎている、という面白さ

基本的な話の流れは

お魚もしくは地上の人間のちょっとしたいいエピソード

 ↓ 

エピソードがおさまったところで魚釣られる

 ↓

エラ姫が食べる

 ↓

レシピ紹介

 ↓

オチ

 

という流れです。

 

どんなにいいエピソードがあろうが

最後にはエラ姫がエピソードの主人公となる魚を美味しくいただく

という流れは変わりません。

 

一瞬、エラ姫が友達を食べてしまうのにも理由があった!?

と思わせる話もありますが

実はそんな理由もなく、ただひたすらに彼女は魚を食べるのが

好きなのです。

 

どんなエピソードがあろうが

いい話があろうが、自身の食欲を抑えられないエラ姫は

正直笑えます。怖いけど笑えます。

 

ホラーとコメディの絶妙なマッチング

こどもができてからというもの、全然見られないのですが

個人的にはB級ホラーとか好きなんです。

 

 殺人ピタゴラスイッチと言われる

ファイナルシリーズとか

ファイナル・デッドコースター (字幕版)

ファイナル・デッドコースター (字幕版)

  • 発売日: 2013/11/26
  • メディア: Prime Video
 

1作目はサイコサスペンスっぽかったけど

段々とネタっぽくなってきたSAWシリーズとか

ソウ (字幕版)

ソウ (字幕版)

  • 発売日: 2017/10/10
  • メディア: Prime Video
 

 

結構全部観ているんですけど

ホラーも一線を越えすぎると何か笑えてくるんですよね。

 

エグいんですけど、あまりにも常識で考えるものから

解離しようとしてくるのでそのズレが滑稽に見えてきます。

 

ホラーとコメディって遠いようで

どちらも現実からの絶妙なズレがあるという点では

一歩超えると非常に近いんじゃないかと感じます。

 

主人公は多くを語らない

主人公はエラ姫ではあるのですが

エピソード毎に主役となる魚(食材)がいるので

そこまでエラ姫の心境は多く語られません。

 

だからこそ不気味で笑える、というところはあるでしょうし

魚の世界が題材だからこそ共食いと言われても

まあ笑える部分があるのかなと思います。

 

1話目を連載当時読んだときには

イロモノ感と、どう続くのだろうと思ってましたが、

共食いって、どう考えてもサイコホラーなテーマを

切り口によってこうもうまくブラックな笑いに変えられるのかと

鮮やかさに感心する作品でした。

 

無料で読めるうちにぜひどうぞ。

実際の論文から統計を学んでみる④-ログランク検定は何をしているのか-超幾何分布

引き続き

実際の論文をみつつ統計の学習してみます。

 

使用している論文がこちら

"Neck weakness is a potent prognostic factor in sporadic amyotrophic lateral sclerosis patients"

(Nakamura RAtsuta NWatanabe H, et al 

 

前回記事はこちら

実際の論文から統計を学んでみる① - 脳内ライブラリアン

実際の論文から統計を学んでみる②-ログランク検定とは- - 脳内ライブラリアン

実際の論文から統計を学んでみる③-ログランク検定は何をしているのか-カプランマイヤー曲線 - 脳内ライブラリアン

 

ログランク検定は何をしているか

 

でようやく本題に戻りまして

ログランク検定の話です。

 

前回示した説明でいくと、①が終わりました。

①2群にわけてカプランマイヤー曲線に必要なデータを出す

(被験者の死亡時点毎に死亡者数、生存者、死亡が出る前の生存者数)

 

次は

②被験者の死亡時点から次の被験者の死亡時点までの

 区間について死亡者数、生存者数、死亡が出る前の生存者数を

 クロス表にする

です。

 

2群の比較を例に出します。

群1と群2でそれぞれ死亡時点が出るごとに区切って

生存者数、死亡者数、死亡者が出る前の生存者数(瞬間死亡率の影響を

受けるのでリスク集合と言われます)を計測します。

 

先ほど示したイメージである時点t(j)について

計測したとしてみましょう。

 

t(j)時点で死亡した群1の被験者をd1

t(j)時点で死亡した群2の被験者をd2

合計をd

 

t(j)を超えたあとの群1の生存者数をn1-d1

t(j)を超えたあとの群2の生存者数をn2-d2

合計をn-d

 

t(j)の前の群1のリスク集合をn1

t(j)の前の群2のリスク集合をn2

合計をn

 

として表にまとめると

 

f:id:medibook:20200426165326p:plain


こうなります。これがクロス表です。

 

よく見てみると

d1+d2=d, n1+n2=nなので

実は変数はd1だけになることが分かります。

 

ここから前回提示した

③②について期待値を出し、実際の数値との差を求める

 分散も出す

④それぞれの時点については独立なのでの

 すべてを足し合わせた統計検定量を出す

⑤これがχ2乗検定に従うので、確率を出すことができる

 をやっていきます。

 

まずはこの確率変数d1がどのような分布に従うか

分かれば良さそうです。

 

ここで周辺和(表の外側の数字)を固定して考えると

変数d1は超幾何分布に従います。

 

超幾何分布とは

 

超幾何分布ってなんやねんとなるかもしれませんが

数学の問題でよく見る

「白いボールと赤いボールが入った袋があり

それぞれからランダムにある数のボールを取ったら

赤いボールがx個ある確率はいくつでしょう」

というやつです。

この確率変数Xは超幾何分布に従います。

 

今回の例で図にするとこうなります。

 

f:id:medibook:20200426173317p:plain

 上述のように確率変数d1の動きに着目したいので

n-d個の白いボールとd個の赤いボールが入った袋から

n_1個取り出して、そのうちの赤いボールの数をd1としています。

 

するとd_1は超幾何分布に従うので

平均\frac{n_1・d}{n}となります。

 

 

この平均と計測されたd_1の差(この差の平均は0になる)を

各時点毎に足し合わせると(ある時点jでの死亡者数をd_{1j}, 1 ≦ j ≦ rとします)

 

\sum_{j=1}^r\{d_{1j}-\frac{n1・d_j}{n_j}\}=U_L(統計量)

 

となります。

 

超幾何分布の分散は

 

\frac{n_1・n_2・d(n-d)}{n^2(n-1)}

 

なのでこれも各時点毎に和をとってV_Lとします。

 

 

すると

\frac{U_L}{\sqrt {V_L}}\sim N(0,1)

なので

\frac{U^2_L}{V_L}\sim\chi_1^2

となるためχ2乗検定にかけることができます。

 

長い旅路でしたが結局ログランク検定は

時点毎にクロス表を作って

χ2乗検定にかける、というもの、ということでした。

 

 

肝心の論文に戻りますと

figure1ではログランク検定を用いて

「すべてのカプランマイヤー曲線が同じである」という仮説に対して

検定をかけていました。

 

残るはCoxハザード回帰についてです。

 

(追記 2020.06.10)

足し合わせた検定統計量がなぜ正規分布に従うのかという点について追記します。

 

通常の中心極限定理は「同一の確率分布に従う、互いに独立した確率変数がn→∞のときに正規分布に従う」というもので、今回の死亡者が出た時点での超幾何分布は同じ超幾何分布ではあるものの、それぞれn_jの値が徐々に減っていくことから、数値が異なるため分布が微妙に異なってしまいます。

 

明確な回答のある文献がみつからなかったのですが、中心極限定理をより一般化したリンデベルグ・フェラーの定理に従うためと思われます。

 

これはリンデベルグ条件を満たせば、確率変数は同一分布でなくても互いに独立であればn→∞のときに正規分布に従うというものです。

 

定理を記載すると

X_1, X_2,…を独立な確率変数の列とし、X_iの平均を\mu_i、分散を\sigma_i^2とし、分散の存在を仮定する。S_n=\sum_{i=1}^nX_i, B_n=\sum_{i=1}^n\sigma_i^2と置くと

 

すべての\epsilon\gt0

\lim_{n\rightarrow\infty}\frac{1}{B_n^2}\sum_{i=1}^nE[(X_i-\mu_i)^2I_{|X_i-\mu_i\geq\epsilon B_n|}]=0(リンデベルグ条件)が成立するとき

 

\lim_{n\rightarrow\infty}\max_{1\geq i\geq n}\frac{\sigma_i^2}{B_n^2}=0

\frac{(S_n-E[S_n])}{B_n}→N(0,1)が成り立つ

 (現代数理統計学の基礎 p.109より引用)

 

さらにリンデベルグ条件を変形すると|X_i|\lt K, (K\geq0),\lim_{n\rightarrow\infty}B_n=\inftyであれば成立するので(これもまた現代数理統計学の基礎 p.111からですが)今回の超幾何分布についても|X_i|\lt1ですし、分散の和を無限に飛ばしたら増えていくので、リンデベルグ・フェラーの定理が成立すると思われます。

 

検定統計量が正規分布に従う他の理由があったら誰か教えてください、、、。