脳内ライブラリアン

脳内ライブラリアン

医療、統計、哲学、育児・教育、音楽など、学んだことを深めて還元するために。

MENU

絶対に忘れない脳神経核の位置と解剖の覚え方

最近は専門医試験の勉強をやっと少しずつやっています。専門医試験では脳幹部の特殊な梗塞が問われることがしばしばあり、ここで問題になってくるのが脳幹部の神経解剖です。

 

「そんなものくらい神経内科医なら当然知っているでしょ」と言われると辛いところがありますが、せっかくなので改めてもうこれ以上忘れないように脳神経核の位置と解剖の覚え方についてまとめてみます。臨床的にはMRI水平断で確認することが多いと思うので、それに沿ってやってみます。

 

医学生の方々、研修医の方々にもお役立ていただけると幸いです。

 

それではみていきましょう。

 

目次:

 

事前知識

①脳神経の機能

そもそも脳神経って何番がどれだっけとか、それぞれどんな機能なんだっけ、というのは流石に割愛します。ネット検索するとごろごろ情報が出てくるかと思います。

 

②各脳神経のレベル

もう一つ押さえておきたいのは、各脳神経の脳幹でのレベルです。

中脳〜延髄では以下のように分類されます。(図は矢状断です)

f:id:medibook:20211203055944j:plain

数字は脳神経の番号です。

通常()なしの数字が簡単な教科書等には書いてあると思うのですが、それは各脳神経が出てくる場所であって、脳神経核については()の付いている数字のようになります。

 

5番の三叉神経の核は中脳〜延髄まで幅広く分布しますし、7、8番も核については延髄レベルまで長く広がります。

 

なお、1(嗅神経)、2(視神経)は場所も異なり、特殊なのでこの記事では触れません。11(副神経)も延髄〜頸髄に位置しており、頭蓋外に存在するため触れません。

 

③各脳神経の機能分類

それぞれの脳神経核がどこに分布するかは機能ごとにある程度は決まっています。

 

これは発生学的に考えると当然で、元々似た機能の脳神経は水平断でみた時も同じような場所に集まります。

 

機能については一般・特殊・体性・臓性・遠心・求心(あるいは運動・感覚)を組み合わせて7種類に分ける方法もありますが、7個は覚えにくいので、一般・特殊を分けずに以下の4つに分類します。

 

①体性運動性

例. 横紋筋を動かす神経核

 

②内臓運動性

例. 平滑筋や腺(唾液・涙)を支配する神経核

例. 鰓弓に由来する顔面・咽頭の横紋筋を動かす神経核

 

③内臓感覚性

例. 味覚、咽頭などの感覚を支配する神経核

 

④体性感覚性

例. 顔面などの知覚を支配する神経核

 

では、ここまでの知識を使って次に進みます。

 

脳幹での分布の大原則

ここからは脳幹で核がどこに分布するか考えていくわけですが、基本的な原則を覚えて記憶の容量を節約しようと思います。覚えるルールは3つだけ。あとは例外のみ後から触れていきます。

 

原則1:内側から体性運動性、内臓運動性、内臓感覚性、体性感覚性の順に並ぶ

まず、並び順は基本的にこうなります。延髄を例にとってみてみましょう。MRIで部位をある程度想定できることが前提なので、常に上側を腹側としていきます。

f:id:medibook:20211204053049j:plain

結構中心側が狭いイメージで、基本的な並びはこうなっています。

 

実際には、下から頑張って上がってきた脊髄からの錐体路や内側毛帯などが腹側を通っているため、脳神経核は後ろに追いやられています。

f:id:medibook:20211204054020j:plain

ひとまずはこの順番を覚えます。

 

原則2:脳神経は交叉せずそのまま脳幹を出る

文章そのままです。神経核からそのまま前に出ていきます。一部例外があります。

 

原則3:鰓弓由来の筋を動かす神経核は他の内臓運動性より前方外側に位置する

5、7、9、10の神経核咽頭や顔面といった鰓弓に由来する横紋筋を動かします。これらは他の横紋筋を動かす神経核と違って、内臓運動性の部分に位置します。さらに、他の内臓運動性とも違って、やや前方外側に位置しています。

 

再び延髄を例に取るとこんな感じです。

f:id:medibook:20211204054758j:plain

 

この3つの原則と一部の例外を抑えれば、脳神経核の位置は大体把握することができます。実際に個々の脳神経をみていきます。

 

個々の脳神経核<原則と例外>

では、この3つの原則に沿って脳神経核を順番に見ていきます。例外も合わせてみていきます。

 

3番動眼神経

f:id:medibook:20211204055907j:plain

体性運動性のためルール通り、後方内側(1)に位置します。

 

!例外1!

さっそくですが、内臓運動性のEdinger-Westphal核(2)は原則1の例外です。

動眼神経核よりさらに内側に位置します。

 

 

 

4番滑車神経

f:id:medibook:20211204061654j:plain

滑車神経核は中脳の中でも動眼神経核より尾側にあります。体性運動性のため、後方内側(赤丸)に位置します。

 

!例外2!

滑車神経は原則2と異なり、そのまま前方に出ず、後ろ側から交叉して出ていきます。いきなり例外が多いなと思ったかもしれませんが、残る例外は2つです。

 

 

 

5番三叉神経、6番外転神経、7番顔面神経、8番聴神経

まとめられるところはまとめていきます。橋下部レベルです。

f:id:medibook:20211204061704j:plain

原則に則るとどれがどれでしょうか。

 

 

(1)はこの中で唯一の体性運動性なので6番の外転神経核です。

 

(2)の内臓運動性でやや前方に位置するのは顔面神経の運動核です。なお、三叉神経も運動成分がありますが(咀嚼筋)、もう少し上のレベルで橋の中部あたりにあります。

 

顔面神経は複数機能を持つ混合神経のため、後でもまた登場します。

 

(3)は体性感覚性の位置にあり、三叉神経脊髄路核になります。中脳〜延髄まで幅広いレベルで登場しますが基本的に後外側に位置します。国試でも問われがちなワレンベルグ症候群で顔面の痺れが出るのは、これが後外側にあり、さらに延髄まで広く分布しているせいですね。

 

(4)は聴神経の一部である蝸牛神経核になります。後外側のかなり外れにあり、下小脳脚に近いです。AICA(前下小脳動脈)の脳梗塞で難聴が出現するのはこの位置によるものです。

 

例外はここでの2点で終わりです。

 

!例外3!

(5)の青色の神経核は前庭神経核です。体性感覚性でありながら、位置としては少しだけ内側にあります。内臓感覚性に近い部位です。

 

!例外4!

(2)の顔面神経は外転神経核をぐるっと回って前方に出ていきます。こんな感じです。

f:id:medibook:20211204063144j:plain

翻訳書である参考文献*1には以下のような記載があります。

下ネタが好きな第7脳神経は第4脳室近くでセックスが見られると聞き、初期発生の段階で反対方向の脳幹に伸びていきました. 第4脳室に近づいてみると誤解に気づきました. セックスではなくシックス(第6脳神経核)だったのです. そこで,顔面神経は,回れ右(about-face)して第6神経核を回り, 外側に出ていきました.(*1より引用)

 

この本はいったい急に何を言っているんだ・・・

 

そう思いましたが、印象に残ったので良しとします。

 

英語で「回れ右」がabout faceというところは第7脳神経と被せててオシャレだと思いました。

 

 

 

9番舌咽神経、10番迷走神経、12番舌下神経

続いて延髄レベルをみていきます。事前知識で述べたように5,7,8番の神経核も位置しています。

f:id:medibook:20211204065038j:plain

こちらも基本的に原則通りです。

(1)は唯一の体性運動性である舌下神経です。

 

(2)は内臓運動性かつ鰓弓由来の筋支配の場所なので、舌咽神経と迷走神経の運動成分が集まる疑核を示します。

 

(3)は内臓運動性である迷走神経背側核が位置します。体の臓器に広がっていく神経の核ですね。また延髄の最も頭側では同様に内臓運動神経である顔面神経の上唾液核、舌咽神経の下唾液核が位置します。

 

(4)は内臓感覚性である孤束核が位置します。

・顔面神経(舌前方2/3)と舌咽神経(舌後方1/3)からの味覚

・舌咽神経と迷走神経からの咽頭の感覚

・舌咽神経からの頸動脈洞/頸動脈小体からの感覚

が集まります。

 

(5)は体性感覚性であるため、三叉神経脊髄路核となります。

 

(6)は橋の場合と同様の例外で前庭神経核が位置しています。

 

特殊な脳梗塞を考えてみる

さて、ここまでの知識を使って脳幹部の特殊な脳梗塞の症状を考えてみると良い練習になります。

 

例えば延髄外側症候群(ワレンベルグ症候群)であれば、延髄レベルの外側にある脳神経核が影響を受けます。

 

延髄レベルに核が存在する脳神経は(5,7,8)9,10,12でした。

 

これらを外側から順に並べると

5の体性感覚(三叉神経脊髄路核)

8の体性感覚(前庭神経核)<例外>

9、10の内臓運動(疑核)

7、9、10の内臓感覚(孤束核)

12の体性運動(舌下神経核

となります。

実際は、上の2〜3つが障害されることが多いとされます。

 

同様に橋下部外側のAICA梗塞も考えてみます。

 

橋下部レベルでは5,6,7,8の神経核が存在します。

これも外側から考えると

8の体性感覚(蝸牛神経核

5の体性感覚(三叉神経脊髄路核)

8の体性感覚(前庭神経核)<例外>

7の内臓運動(顔面神経核

6の体性運動(外転神経核

となります。

 

実際この梗塞では上の4つまで障害されることがあります。

 

こんな感じで、脳幹の特殊な脳梗塞を考えるときにも役に立つ原則かと思います。例外がいくつかあったり、血管支配域がどこまでなのかは分からなかったり、同じ機能分類の神経核がどこにあるか細かく分かりにくかったりするかと思いますが、まあ大まかに覚えられる!ということで大目にみていただきたいと思います(汗

 

参考文献:

*1『楽しく読めてすぐわかる臨床神経解剖』

かなり古い本ですが、上記のようにまとめ方がユニークな一冊です。

*2『イラスト解剖学 第10版』

学生時代にお世話になった本ですがいつの間にか第10版まで改訂されていました。現在はフルカラーのようです。

*3『脳卒中ビジュアルテキスト』

脳梗塞に関連した神経の局在や解剖に関してパッとみてわかりやすく構成されています。これから脳梗塞診療にあたる方におすすめです。

*4『脳の機能解剖と画像診断』

神経核の位置の確認のため使いました。

正規分布の平均まわりのk次モーメントの求め方

さて、統計検定で勉強した名残を少し記事にしていこうかと思います。

 

統計検定でも時折問われることがあるのが、正規分布のk次モーメントです。

 

X\sim N(\mu,\sigma^2)のとき、E[(X-\mu)^3]あるいは[tex:E[(X-\mu)^4]がどうなるかといった問題ですね。

 

そのまま式を考えるより、標準正規分布N(0,1)のモーメント母関数をテイラー展開して考えるとうまくいきます。

 

標準正規分布のモーメント母関数はe^{\frac{t^2}{2}}なのでこれをテイラー展開して

M_X(t)=e^{\frac{t^2}{2}}\\=0+\frac{t^2}{2}+\frac{1}{2!}(\frac{t^2}{2})^2+\frac{1}{3!}(\frac{t^2}{2})^3+\frac{1}{4}(\frac{t^2}{2})^4...

となります。

 

そうするとモーメント母関数を1回微分したときは

M'_X(t)=0+t+...

となるので、0を代入すると

M'_X(0)=0

つまり微分したときに残ったtのある項は全て消えてしまうので、微分で残ったやつのみに着目すれば良いんですね。

 

続いて2回微分

M''_X(t)=1+\frac{3t^2}{2}+...

なので

M''_X(0)=1

 

3回微分

M''_X(t)=3t+...

M''_X(0)=0

 

4回微分

M''''_X(t)=3+...

M''''_X(0)=3

 

となっていきます。

 

そうすると実は奇数のモーメントは全て0になり、偶数のモーメントもある程度の規則性があることがわかります。

 

『現代数理統計学の基礎』の第3章問15にその証明問題がありますが、偶数次のモーメントが、カイ二乗分布に従うことを利用して変数変換を施すことで

E[X^k]=\frac{\Gamma(\frac{k+1}{2})}{\Gamma(\frac{1}{2})}\frac{2^{\frac{k+1}{2}}}{\sqrt2}

と一般化できます。

 

ここまでは標準正規分布の話でしたが、平均mu、分散\sigma^2正規分布の際に、肝心の平均まわりのモーメントはどうなるかというと、後は簡単です。

 

例えば4次モーメントであれば

\frac{X-\mu}{\sigma}\sim N(0,1)

なので、先ほどの結果から

E[(\frac{X-\mu}{\sigma})^4]=3

母分散は定数であるため

E[(X-\mu)^4]=3\sigma^4

となります。

 

これで平均まわりのモーメントであれば何次でも求められることがわかります。

 

参考文献:

 

実臨床に役立てるメタアナリシスの読み方⑥ -Results~Discussion編-

さて、この記事ではResults〜Discussionに書かれている内容を中心に、みる点を整理していきたいと思います。

 

目次:

 

前回までの記事はこちら

実臨床に役立てるメタアナリシスの読み方① システマティックレビューとメタアナリシスの違い『なぜメタアナリシスのみはダメなのか』

実臨床に役立てるメタアナリシスの読み方② -Background編〜Methods編前半

実臨床に役立てるメタアナリシスの読み方③ -Methods編中盤①

実臨床に役立てるメタアナリシスの読み方④ -Methods編中盤②

実臨床に役立てるメタアナリシスの読み方⑤ -Methods編後半①

メタアナリシスについてより詳しく学ぶ①-fixed effects model, random effects modelと異質性

まとめたページと参考文献はこちら

実臨床に役立てるメタアナリシスの読み方まとめ

 

 

フォレストプロットの見方と結果の一貫性

メタアナリシスにおける結果は基本的にフォレストプロットと呼ばれる図表で表現されています。それぞれの項目が指し示している数値や意味について簡単に説明してみましょう(図の数値は適当です)。

f:id:medibook:20211125050332j:plain

①各研究の重み
右側にあるフォレストプロットの四角の大きさが各研究の重み(サンプルサイズと関連)を示します。大きければ信頼区間も小さく規模の大きい研究と言えます。

 

②各研究の信頼区間

算出された各研究のオッズ比の95%信頼区間を示します。

 

③統合された結果

全ての研究を統合した結果を示します。菱形の端が95%信頼区間、中心が統合された結果の値を示します。

 

④各研究のオッズ比と重み

右側のプロットの実際の数値を表したものです。

 

⑤統合結果のオッズ比と検定統計量、p値

統合された結果のオッズ比が各研究のオッズ比の下に書いてあります。また、「Z=」で示されているのは検定統計量と言われる仮説検定の際に使われる数値です。p値の算出に使われるだけなので、普通に読む際は気にしなくて良いと思われます。

 

⑥異質性の検定統計量と自由度、異質度

τ(タウ)値は前回記事で書いた変量効果モデル(random effect model)における“研究毎の偏り“を示す分散です。固定効果モデル(fix effect model)を使っている場合は必ずここが0になっています。

前回記事はこちら

メタアナリシスについてより詳しく学ぶ①-fixed effects model, random effects modelと異質性-

 

隣にあるχ(カイ)二乗値は異質性の仮説検定をする際に使われる検定統計量です。これも普通に読む際は気にしなくて良いと思います。

 

dfはdegree of freedomの略で自由度という数値です。独立に動ける変数の数を示しており、推定する数値の分だけ自由度が下がるので多くの場合は(統合する研究数-1)となっていると思います。今回は5−1=4ですね。これも臨床的に読む分には気にしなくて良いでしょう。隣のp値は異質性があるかどうかを仮説検定した数値で「有意差がつく=異質性がある」という意味になります。

 

一番右のI^2は前回記事で書いた異質度ですね。

 

 

フォレストプロットの基本的な見方は以前の記事にも書いています。ここで書いたように大事なのは結果の一貫性があるかどうかです。

medibook.hatenablog.com

 

各研究の結果が一貫して良いもの、あるいは悪いものであればそれだけ統合された結果には信頼性が出ます。もちろんそれはここまでの記事で説明していた報告バイアスなどの問題がない前提です。

 

フォレストプロットを見ると結果の一貫性があるかどうかはパッとみて分かるので非常に便利であると言えます。

 

また、異質性の評価もこの図からわかります。異質性があまりに大きい場合はみているものがバラバラのものを無理やり集めている可能性が考えられます。そうなると、まるで違うものを統合してただ数値だけ出している、という“リンゴとオレンジの問題”が出てきてしまうため、注意が必要です。

 

感度分析をしているか

Resultに関して、結果の頑健性がどうかを評価する上でみておきたいのは「感度分析をしているかどうか、またどう行なっているか」という点です。

 

感度分析とは、データ分析する基準を変えたりしても結果が変わってしまわないかどうか確認することで、結果の頑健性を調べるための分析のことです。

 

データを分析する際の基準として、必ずしも明確な理由のない恣意的な基準が入ってしまうことがあります。

 

例えば、高齢者について調べた研究で高齢者の基準を60歳にするのか、65歳にするのか、あるいは70歳にするのかという点は、なんとなくキリが良いからという理由だけであって、明確な医学的理由があるわけではありません。

 

基準を変えて分析してみても結果が変わらなければ、良いことになりますし、変わってしまうようだと結果の信頼性は揺らぎます。

 

Cochrane handbookでは「対象となる研究の検索方法」「組み入れ基準」「どのデータを解析するか」「どんな解析方法にするか」といった点で感度分析が使われうることが述べられています。

Chapter 10: Analysing data and undertaking meta-analyses | Cochrane Training

 

例えば「どんな解析方法にするか」という点では、前回記事で述べていた固定効果・変量効果モデルはどちらが適しているか明確な基準がないため、感度分析としてそれぞれのモデルを行なって結果に違いがないか確認されていることがあります。

 

感度分析とサブグループ解析の違い

一部のデータに絞って解析をしなおしたりする点でサブグループ解析と似通っているように思われる場合もあるのですが、両者は明確な違いがあります。

 

感度分析は上述したように結果の頑健性を調べるための方法であるため、結果の推定値にはあまり大きな意味がありません。サブグループ解析はそれぞれのグループの推定値がどうなのかを調べて比較することに意味があるので(偶然かもしれないがもしかしたら大きく数値が異なるものがあるかもしれない)意味合いが異なると言えるでしょう。

 

臨床での適用はどうか

結果が基本的にオッズ比で出されることになりますが、臨床的には解釈がしにくくなります。そこで、前向き研究には限られますが、統合した数値を絶対リスク減少(ARR; absolute risk reduction)に変換し、さらにNNT(number needed to treat)やNNH(number needed to harm)まで割り出すと臨床的には非常に使いやすいものとなります。

 

例えば、コクランの脳梗塞急性期に対するアスピリンのメタアナリシスでは、統合された結果のNNT,NNHが表にしてまとめられています。

 

f:id:medibook:20211125055458j:plain

(Oral antiplatelet therapy for acute ischaemic stroke | Cochraneより引用)

 

コントロール群の平均的なイベント率も算出した上でこのような表にまとめており、とても分かりやすいです。エビデンスの妥当性という意味とは少し異なりますが、臨床的に解釈ができないようでは意味をなさないので、こうした数値の算出は重要な点であると言えます。

 

Discussionで述べられること

メタアナリシスのガイドラインであるPRISMA statement2020ではDiscussionにおいて「他のエビデンスと比較した際の結果の一般的な解釈」、またlimitationとして「レビューされている個々の研究の限界」「レビューのプロセスの限界」、さらに今回得られた知見をどうしていくかに関して「臨床への適用、今後の研究との関連」を述べるように指示されています。

 

「結果の一般的な解釈」は過去の似通った臨床的疑問のある論文と比較して、結果をどう解釈すべきかを示します。

 

「レビューされている個々の研究の限界」では研究の規模が小さいものやrisk of bias、欠測データの問題について論じます。不確実性が高いデータを集めても結局は大きなRCTでひっくり返される事がある、というのは以前に書いた通りなので、個々の研究の問題はメタアナリシスそのものの問題に直結しています。

 

「レビューのプロセスの限界」はmethod編で述べた“網羅的な検索“や“報告バイアス”の問題がどこまであるかを論じるものです。こちらも今までに述べていたようにメタアナリシスはあくまで後付け解析であるため、必ずこういったバイアスの影響を受けますから、問題点があればそこについて述べていき必要があります。

 

まとめ

・フォレストプロットでは各研究の結果の一貫性を通覧し、異質性の確認をする

・感度分析で結果の頑健性を確認する

・discussionでは結果が受けるバイアスが説明されているか注意する

 

ここまでざっとメタアナリシスの読み方について一度考えてみました。最初で述べたようにメタアナリシスであれば良いエビデンスというわけではなく、質について検討する方法は必ず持っていないといけません。とはいえ、本当に全て吟味するのは時間がかかり過ぎるので、ここまでの記事で紹介した内容でざっと最低限の質に関する部分を確認できると良いかと思っています。まとめページの参考文献にメタアナリシスについて論じているものを色々置いてあるので参照いただければ幸いです。

2021年の統計検定1級(統計数理・統計応用/医薬生物学)を受けてきた

さて、昨日は統計検定1級の試験日でした。Twitterでワイワイやるのは楽しかったですが、久々に頭を使って疲れました。

 

来年に向けて試験の内容と感想を書いておきます。

 

試験の内容

問題用紙は持ち帰れますし、じきに公式ページにも問題がアップされると思いますが、以前のページに内容を追加しておきました。今年受験しなかった方はご参考にしてください。

2014-2021年の統計検定1級の出題範囲をまとめてみた(統計数理+医薬生物学+共通問題)【統計検定1級対策】

 

今年が初めての受験だったわけですが、まだ受験がこれからという人向けに当日の状況でも書いておきます。(2021年時点)

 

配られるのは問題冊子と解答冊子で、問題冊子には結構大きな空欄が1ページ分あるため、計算用紙として使えます。

 

解答冊子は横に引かれた罫線があり、両端数cmに縦線で区切られた空白がありますが、そこは何も書いてはいけないみたいです。

 

解答冊子の各ページ上方に受験番号と解いている問題がどれなのか問題番号を書く欄があります。最後の方で見直した時に、焦って問題番号書くのを忘れてるページがあったので、みなさんご注意ください(汗

 

なお、当日は鉛筆もしくはシャープペンシル(B,HB)+消しゴムという装備で挑むので、事前に同じようなもので練習しておくと安心です。私は久しくシャープペンシルも使ってなかったので前日慌てて家の中で探しました笑

 

試験の感想

まあやっぱり難しいですね笑

 

なんとなく問題をみて、いけそうな雰囲気はするんですが、解いてみるとやっぱりうまくいかない。きっと難易度は例年とそう変わらないと思いましたが、初見の問題をしっかり解くのが難しいことを感じました。

 

そして時間がとにかくない。初見の問題でも全力で解ききるような力が入りますね。見直す時間など当然ほぼありませんでした。

 

あとは各分野で何を解いたかの雑感です。

 

統計数理は行列、ベイズという言葉を避けた結果、問1、3、4を選択しました。

 

問1は畳み込みと(あってるかどうか分からないけれど)変数変換使ったりしてゴリ押しで全部一応解きました。

問3はなんか後半の信頼区間が変な数値になったけれどまあなかったことにします笑

問4はあってるかどうかこれもわかりませんが、やたら期待値が0になる気がして不安でした。そして解ききれませんでした。

来年はベイズと行列に怯まないようにしたいです。

 

統計応用は問1、2、5を選択しました。

 

問1は今見直してみるとこれは競合リスクモデルの問題だったようですね。同様の推定値があったのでネットで出てきたこちらの資料を貼っておきます。

https://www.jstage.jst.go.jp/article/jjb/29/2/29_2_141/_pdf

間違っているのが怖すぎてまだ読んでません。傷が癒えたら読みます笑

 

表にある大量の数値を埋めるという鬼畜な後半の問題のせいで合計40分かかりました。

 

問2は突っ込んでしまったものの、正直よくわかりませんでした。複合仮説のあたりで何がやりたいのかわからなくなってしまい、後半の対数正規分布の問題をちょっと解いて終わってしまいました。1/3もできていない感じですね。終わってます。

 

対数正規分布を用いた中央値の算出は2016年問4でも出てましたね。そこだけは自信を持って解きました。本当にそこだけ。。

 

問5は共通問題でしたが、ラッキーなことにかなり医療寄りな感度特異度関連の問題でした。多分時事ネタなのでしょう。これは1級の教本の練習問題にもかなり類似していてやりやすかったように思います。ミスさえなければ、、、。

 

よい刺激になって非常に勉強が捗ったので、落ちたら落ちたでまた頑張ろうと思います。

 

受験された皆様、お疲れさまでした!

 

※2021.12.20追記:不合格でした!来年また頑張ります

【医療統計YouTube】多重検定の問題【第6回】

youtu.be

 

YouTube更新しました。

前回の動画でわずかに触れた「多重検定」の話をちょっとだけ掘り下げました。

予告の内容とは異なってます(汗

 

仮説検定において

・無計画に後付けで検定を繰り返す

・仮説検定をしまくって、P値が低い結果が出たものだけを発表する

といった行為はデータドレッジング(あるいはP値ハッキング)とも呼ばれ、本当はデータ間の違いに意味がないのに、さも意味があるかのようにみえてしまう問題があります。

 

なお、ドレッジング(dredging)は「川や湖の底にある土砂をさらう」ことを指しており、データを綺麗にしちゃうということですね。

 

もう少し詳しく知りたい方は新谷歩先生の『今日から使える医療統計』が参考になります。こちらでは複数回仮説検定を行うような例として以下の場合を挙げています。

 

 

 

(1)比較群が3つ以上存在する

(2)アウトカムが2つ以上存在する

(3)中間解析など研究終了前にデータの比較が繰り返し行われている

(4)回帰分析などでリスクファクターなどの曝露因子が2つ以上存在する

(5)データが時間によって繰り返し計測され、それぞれの時間において比較が行われている(『今日から使える医療統計』より引用)

 

今回動画で出てきた例は(1)(2)に当たるものですが、それぞれの場合に応じて補正の方法やP値のとらえ方も異なるので注意が必要です。こちらの本では具体的な解析方法の話も簡単に触れています。

 

多重検定の問題があるからといって「仮説は常に1個でなければ信用ならない!」という極論に走るわけではなく、適切な補正やとらえ方をすべきである、という点に注意しましょう。

 

また、当ブログで激推ししているJAMA user's guideでも多重検定の問題は触れられています。

 

以下の論文が参考として挙げられており、1980年代には生物統計の分野でBonferroni法や中間解析のO'Brien-Fleming法などが使われていたことが分かります。ガチガチの数式も出てきます。

The analysis of multiple endpoints in clinical trials

仮説検定の根底に関わる問題なので古くから問題点として指摘されているようです。

 

今回紹介したBonferroni法も、内容は単純そうですが元を正せばボンフェローニの不等式(1936年に報告)という確率論の話から導き出されるものです。

Bonferroni correction - Wikipedia

よくみたらお世話になっている『現代数理統計学の基礎』でも練習問題に出ていましたね。

 

この辺の話は掘り下げていくと数学と密接に関係した話がそれぞれの内容についてとめどなく繰り広げられるので、興味があるところを少しずつ深めていくのがよさそうです。

 

 

さて、次回こそは「標準誤差と標準偏差」についてやっていく予定です。

今回も異動もろもろで仕事が忙しく遅れ気味になりましたが、1か月程度でまた公開できるよう取り組みます。た、多分。

現代数理統計学の基礎 4章 問16

久しぶりに問題解きましたので記事追加します。

条件付き期待値・分散の問題を解きたかったのでやってみました。

 

(1)から。全分散の公式の共分散バージョンといった感じですね。

Cov(X,Y)=E[Cov(X,Y|Z)]+Cov(E[X|Z],E[Y|Z])

を示す問題です。

 

条件付き期待値の変形を多用するので馴染みがなければこちらを参照ください。

medibook.hatenablog.com

 

右辺の第1項は

E[Cov(X,Y|Z)]=E[E[XY|Z]-E[X|Z]E[Y|Z]\\=E[XY]-E[E[X|Z]E[Y|Z]]

右辺の第2項は

Cov(E[X|Z],E[Y|Z])=E[E[X|Z]E[Y|Z]]-E[E[X|Z]]E[E[Y|Z]]\\=E[E[X|Z]E[Y|Z]]-E[X]E[Y]

となります。

 

よって第1項と第2項を足し合わせると

E[XY]-E[X]E[Y]

となるので左辺と一致します。

 

続いて(2)。(1)の式を用いれば簡単にできます。

Cov(X,Y)=E[Cov(X,Y|Z)]+Cov(E[X|Z],E[Y|Z])

のうち、まずZが与えられたときXとYが独立に分布するため

E[Cov(X,Y|Z)]=0

次に

Cov(E[X|Z],E[Y|Z])=Cov(Z,Z)\\=V(Z)\\=1

となります。

 

よって

Cov(X,Y)=0+1=1

です。

実臨床に役立てるメタアナリシスの読み方⑤ -Methods編後半①-

今回はMethods~Resultsにかけて、risk of bias(バイアスリスク)を中心にみていきます。

 

前回までの記事はこちら

実臨床に役立てるメタアナリシスの読み方① システマティックレビューとメタアナリシスの違い『なぜメタアナリシスのみはダメなのか』

実臨床に役立てるメタアナリシスの読み方② -Background編〜Methods編前半

実臨床に役立てるメタアナリシスの読み方③ -Methods編中盤①

実臨床に役立てるメタアナリシスの読み方④ -Methods編中盤②

まとめたページと参考文献はこちら

実臨床に役立てるメタアナリシスの読み方まとめ

 

 

目次:

 

risk of biasの目的は?

ではまずrisk of biasとは何なのか、何のために評価されるものなのかを簡単に説明してみます。

 

risk of biasというのは名前の通り、バイアスが起きる危険性のことです。メタアナリシスに組み込まれる各研究がバイアスが起きやすい構造となっているのかどうか、それを評価するわけです。

 

初めの記事にも書いた通り、メタアナリシスは組み込む研究の質が低いと誤った結論を導きかねません。

実臨床に役立てるメタアナリシスの読み方① システマティックレビューとメタアナリシスの違い『なぜメタアナリシスのみはダメなのか』

 

それぞれの研究がどの程度質が高いのかを明確にすることで、まず結果の妥当性が分かります。質の高い研究が同じような結果を導き出すことができていれば、正しい結果である可能性が高いことが推測できますし、逆もまた然りです。

 

また、研究全体で質のばらつきがある場合、risk of biasが低い(=質の高い)研究を集めたサブ解析をすることで、全体での結果と変わらないか確認するときもあります。そうすることでも、結果の妥当性をある程度保証できます。

 

risk of biasが評価されていないメタアナリシスは結果の妥当性が極めて不明瞭となります。どんな質のものが含まれているのか分からないので、読む側がそれを個々に調べるしかありません。そんな不親切なことはあまりないとは思いますが、読む際に注意しなければいけないでしょう。

 

risk of biasの評価方法

では具体的にどのようにrisk of biasを評価するのでしょうか。

 

メタアナリシスを見るとこういう図をよく目にすると思います。

f:id:medibook:20210922054944j:plain

8 Assessing risk of bias in included studiesより引用)

 

縦軸に「各研究」、横軸に「評価するポイント」が書かれており、緑や赤のマルでそれぞれ評価内容が表現されている表です。場合によっては色で評価内容を分けた棒グラフやただの文章のみの表であることもあります。これがrisk of biasを評価した結果となっています。

 

横軸の「評価するポイント」は著者のオリジナルではなく、概ね決まった評価方法が採用されます。ランダム化比較試験では、ガイドラインでよくみられるGRADE systemやコクランで使用されるversion 1 of the Cochrane risk-of-bias tool for randomized trial(通称RoB1、上の表はこれです), RoB2などが存在します。観察研究においても同様にさまざまな評価方法があります。

 

今回の記事では、その代表的な例としてRoB2を紹介します。他の例に関してはどんな風なのか知りたい人のために、こちらにリンクを貼っておきます。

・GRADE systemの評価方法

GRADE guidelines: 4. Rating the quality of evidencedstudy limitations (risk of bias)

・コクランの観察研究の評価方法(ROBINS-Ⅰ)

ROBINS-I | Cochrane Bias

 

では、RoB2の内容を簡単にみてみます。まず、大まかに評価するポイントは以下の5点に絞られます。

  1. bias arising from the randomization process;
  2. bias due to deviations from intended interventions;
  3. bias due to missing outcome data;
  4. bias in measurement of the outcome; and
  5. bias in selection of the reported result.

Chapter 8: Assessing risk of bias in a randomized trial | Cochrane Trainingより引用)

 

順番に見ていきます。

 

1. bias arising from the randomization process

ランダム化を行う時点で生じうるバイアスを確認します。ランダム化の方法が未知の予後因子を均等に配分できるように取られているのかどうか、またコントロール群・介入群のどちらに入っているのか被験者や試験の協力者にバレてしまうような分かりやすい割付がされていないか、といった点を評価します。

 

予後因子が均等でなければ、そもそも介入群とコントロール群で違いがついてしまい、介入の効果以外に結果が偏りうる要素が出てしまいます。またどちらの群に入っているかがバレて、盲検化が外れてしまうと、介入群が良い結果を出そうとしてしまったり(いわゆるホーソン効果)してしまいかねません。

 

ただし、各群で偶然に起きてしまったばらつきについてはここでは評価をしません。そのため、サンプルサイズが小さいといったことも否定的な評価はされません。あくまで、系統的に起きた誤差のみについて評価する形を取ります。

 

2. bias due to deviations from intended interventions

これはもともと研究のプロトコールで意図されていた介入とは異なる要素によって生じる結果の偏りを指します。

 

まず、一つには指定された介入以外に結果に影響を与えうる介入が行われてしまう場合が考えられます。

 

例えば、糖尿病の治療薬で新薬とプラセボを比較した研究があったときに、新薬群では他の治療薬もたくさん使われていたら、どうでしょうか。結果は「新薬vsプラセボ」ではなく「新薬+治療薬vsプラセボ」となってしまい、何を比較したいのかわからなくなってしまいます。そのため、大抵の場合はプロトコールであらかじめ指定以外の介入をどうするかが定められています。

 

もう一つは治療に対するアドヒアランスの問題です。治療のアドヒアランスが不十分であれば、介入による実際の効果が確認できないと言えます。

 

3. bias due to missing outcome data

アウトカムのデータが欠測していることによる問題です。例えば、被験者が引っ越してしまったり、亡くなったり、試験を途中で拒否したり、様々な理由でアウトカムのデータが得られない場合があります。そうなると結果が歪んでしまいます。

 

例えば、治療薬とプラセボを比べたときに、治療薬の効果が得られる人とそうでない人に極端な差があったとします。効果が得られない人は途中で亡くなったり、試験の参加をやめてしまい、効果が得られる人だけ残ってしまうと、残った人だけで集めた結果は至極よいものになるでしょう。

 

実際、これらの欠測データはないままにして結果を計算するのではなく、何らかの方法で補完されることも多いです。

 

欠測データの種類やそれによる問題点は以前にまとめたので詳しくはこちらをどうぞ。

メタアナリシスについてより詳しく学ぶ②-欠測データの問題

 

4. bias in measurement of the outcome

アウトカムの計測方法によって起こりうるバイアスを検討します。例えば以下のような影響の出方が考えられます。

 

1、測定方法そのものの問題

精度が不十分な検査をアウトカムの測定に用いると、アウトカム発生と判定するかどうかに誤差が生じやすくなります。アウトカムの判定に適した精度の高い評価方法が必要です。

 

2、測定を誰がするかの問題

アウトカムの判定をするのが被験者なのか、治療者なのか、別の評価者なのかといったことでも結果の判定は変わり得ます。盲検化が不十分な者が評価すると、介入群に良い結果を出そうとしたり、結果に影響が出ることは容易に想像できます。

 

3、いつ測定するかの問題

アウトカムの評価を定期的にするのか、何らかの自覚症状があったら調べるのか、といった違いでも結果は影響を受けます。例えば、介入群の治療が疾患そのものの治療ではなく、あくまで自覚症状を和らげているだけであるといった可能性も出てきます。

 

5. bias in selection of the reported result

結果が良いものだけ選抜されて報告された場合に生じうるバイアスについて検討します。

 

前回の記事で出てきたreporting biasのselective outcome reporting biasにも似ていますが、前回の報告バイアスでは基本的に報告されていないことに着目していたのに対して、今回の話は何が報告されているか、に着目しています。

 

報告されているアウトカムがきちんと事前に決められていたものかどうか、またアウトカムの評価方法や解析方法が複数とられていた場合に全てそれらが出されているかどうか、を確認します。

 

後付け解析で出された結果だったり、評価方法や解析方法の一部が抜粋されていると良い結果だけ持ち出されている可能性が出てしまいます。

 

全体の評価をまとめる

この5つの項目をそれぞれ"low risk of bias", "some concerns", "high risk of bias"の3段階で評価して、最終的に全体を同じ3段階で評価します。

 

全ての項目がlow riskであればlow risk of bias

一つでもsome concernsがあればsome concerns

一つでもhigh riskがある、もしくは問題になるほど多くsome concernsがあればhigh risk

 

となっています。

 

総合して図にまとめるとこんな感じでしょうか。

f:id:medibook:20210928055744j:plain

図 全体の評価の流れ

 

なお、改訂されたRoB2やGRADEシステムは、研究全体のバイアスの評価ではなくメタアナリシスで統合するアウトカムのみの評価をしています。上記のバイアスリスクは同じ研究でもアウトカムごとに異なる可能性があります。例えば、割り付けがわかった後で後付け解析したアウトカムであれば、解析者の盲検は外れてしまう、などの例です。アウトカムごとに評価をするというのは合理的な評価であるように思います。

 

 

最初に出てきた表はこうやって作られるわけですね。今回扱ったRoB2以外にも評価方法は多数あります。読む側がそれぞれの評価方法を一つ一つ全部知る必要はないと思いますが、何を見ているのかは何となく把握しておいても良いのかなと思います。

 

まとめ

・バイアスリスクでは各研究のバイアスの程度を評価する

・様々なツールで、それぞれの項目ごとにバイアスの評価をしている

 

次回は結果のばらつきの程度を評価する「異質性」について調べていきます。

 

次の記事はこちら

メタアナリシスについてより詳しく学ぶ①-fixed effects model, random effects modelと異質性-