脳内ライブラリアン

脳内ライブラリアン

医療、統計、哲学、育児・教育、音楽など、学んだことを深めて還元するために。

MENU

代表的な確率分布を覚えやすいようにまとめてみる②-連続型・標本分布-【統計検定1級対策】

前回に引き続いて統計検定1級に出てきやすい連続型確率分布・標本分布について、関係性と式を簡単にまとめてみます。

 

前回の記事はこちら

medibook.hatenablog.com

 

 

 

図にしてみる

 

f:id:medibook:20210109054624j:plain

 

 

各分布の式など

モーメント母関数

M_X(t)=E[e^{tX}]\\M'_X(t)=E[X]\\M''_X(t)=E[X^2]

 

①連続一様分布

f(x;a,b)=\frac{1}{b-a} (a\leq x\leq b)

E[X]=\frac{a+b}{2}

V(X)=\frac{(a-b)^2}{12}

 

②コーシー分布

f(x)=\frac{1}{\pi}\frac{1}{x^2+1}

*自由度1のt分布と等しい

*平均と分散、モーメント母関数は存在しない

 

正規分布

f(x)=\frac{1}{\sqrt{2\pi}\sigma}exp\{-\frac{(x-\mu)^2}{2\sigma^2}\}

*超メジャー分布でありながら、ぱっと見が分かりにくい式ですが、expの手前にあるのは規格化(正規化)定数であり、expの部分を積分したときに、調整のため生じうるものと理解すると何となく意味が掴みやすいです。

 

f:id:medibook:20210109054109j:plain

 

M_X(t)=exp(\mu t+\frac{\sigma^2t^2}{2})

E[X]=\mu

V(X)=\sigma^2

 

N(\mu_X, \sigma^2_X)+N(\mu_Y, \sigma^2_Y)=N(\mu_X+\mu_Y, \sigma^2_X+\sigma^2_Y)

分布の再生性がある

 

④対数正規分布

f(x)=\frac{1}{\sqrt{2\pi}\sigma x}exp\{-\frac{(logx-\mu)^2}{2\sigma^2}\}

Y\sim(\mu, \sigma^2)の時、exp(Y)=Xと変数変換することで生み出される確率分布

*モーメント母関数は存在しない

 

E[X]=exp(\mu+\frac{1}{2}\sigma^2)

V(X)=exp(2\mu+\sigma^2)\{exp(\sigma^2)-1\} 

*変数変換とガウス積分を使って導出できる

 

⑤多変量正規分布

相変わらず行列が苦手すぎるのと文量も増えそうなのでいったん割愛します

 

⑥ガンマ分布

f(x; \alpha,\lambda)=\frac{\lambda^\alpha}{\Gamma(\alpha)}x^{\alpha-1}exp\{-\lambda x\}

(λでなくβをパラメータとして持ってくる式が多いですが、指数分布と比較しやすくなるようにλにしました。なお、愛用の『現代数理統計学の基礎』ではβの逆数をパラメータにしているため混乱します。)

*次に出てくる指数分布を一般化したもの、としてみると複雑な式も覚えやすい。α=1としたものが指数分布と一致する。

*つまり、ガンマ分布はある一定数の時間においてイベントが複数回起きる確率分布として理解できる。(指数分布は「単位時間あたりλ回起きるイベントが期間xのうちに1回起きる可能性を示す分布」であるので、ガンマ分布は「単位時間あたりλ回起きるイベントが期間xのうちにα回起きる可能性を示す分布である」と言える)

 

以下のブログの説明がわかりやすかったです。

ガンマ分布のはなし - 統計学といくつかのよしなしごと

 

M_X(t)=(\frac{\lambda}{\lambda-t})^\alpha

*定義通りに計算して、ガンマ分布の総和が1になることを利用して導出

E[X]=\frac{\alpha}{\lambda}

V(X)=\frac{\alpha}{\lambda^2} 

*モーメント母関数から導出可

 

Ga(\alpha_1, \lambda)+Ga(\alpha_2, \lambda)=Ga(\alpha_1+\alpha_2, \lambda)

分布の再生性がある

*上述したガンマ分布の意味を考えるとαはバラバラでも良いが、λは一緒でないといけない理由がよくわかる

 

<補足>

ガンマ関数とは→「階乗」を一般化したもの

定義は\Gamma(\alpha)=\int_0^\infty x^{\alpha-1}e^{-x}dx

性質として

\Gamma(\alpha+1)=\alpha\Gamma(\alpha)

\Gamma(\frac{1}{2})=\sqrt\pi, \Gamma(1)=1をもつ。

一つめの性質から、αが自然数を想定すれば階乗になることがわかる。

 

⑦指数分布

f(x)=\lambda exp(-\lambda x)

*ガンマ分布におけるα=1の場合となる

M_X(t)=\frac{\lambda}{\lambda-t}

E[X]=\frac{1}{\lambda}

V(X)=\frac{1}{\lambda^2}

 

*指数分布はハザード関数と関連しており、関係性を示す式変形については以下の記事の一部で以前にまとめました

medibook.hatenablog.com

 

⑧ワイブル分布

f(x; a,b)=abx^{b-1}exp(-ax^b) ただし、x\gt0

*指数分布においてイベントの発生確率と言えるλが、時間経過に伴って増えていくという仮定のもとに\lambda(x)=abx^{b-1}として得られる確率密度関数。λがずっと一定というのは確かに現実的ではないことの方が多いと思います。

*導出過程は以下

f(x)をハザード関数とすると

\lambda(x)=\frac{f(x)}{1-F(x)}

(ここまでの流れは上の記事と同様です)

両辺を積分して

\int_0^x\lambda(t)dt=\int_0^x\frac{f(t)}{1-F(t)}dt

これを変形すると

f(x)=\lambda(x)exp\{-\int_0^x\lambda(t)dt\} 

ここに\lambda(x)=abx^{b-1}を代入すると最初に出てきた確率密度関数の式が得られます。

 

平均と分散の計算は別記事にしました↓ 

medibook.hatenablog.com

 

カイ二乗分布

自由度をnとすると

f(x)=\frac{1}{\Gamma(\frac{n}{2})}(\frac{1}{2})^{\frac{n}{2}}x^{\frac{n}{2}-1}exp\{-\frac{x}{2}\}

*ガンマ分布の特殊形です。自由度nのカイ二乗分布

Ga(\frac{n}{2}, \frac{1}{2})と一致します。

 

*n個の標準正規分布の和は自由度nのカイ二乗分布に従います。過去記事で書きました。

medibook.hatenablog.com

 

E[X]=n

V(X)=2n

*ガンマ分布と同様に考えれば簡単に求められます

Ga(\frac{n}{2}, \frac{1}{2})+Ga(\frac{m}{2}, \frac{1}{2})=Ga(\frac{n+m}{2}, \frac{1}{2})

分布の再生性がある

 

⑩t分布

f(x)=\frac{\Gamma(\frac{m+1}{2})}{\Gamma(\frac{m}{2})}\frac{1}{\sqrt{\pi m}}\frac{1}{(1+\frac{x^2}{m})^{\frac{m+1}{2}}}

モーメント母関数はなし

E[X]=0

V(X)=\frac{m}{m-2}

ただし1≦m<2の時は無限大

 

定義としては

Z\sim N(0,1), U\sim\chi^2_mのとき

T=\frac{Z}{\sqrt{\frac{U}{m}}}

 

⑪F分布

自由度(m,n)のF分布の確率密度関数

 f(x)=\frac{\Gamma(\frac{m+n}{2})}{\Gamma(\frac{m}{2})\Gamma(\frac{n}{2})}\frac{(\frac{m}{n})^\frac{m}{2}x^{\frac{m}{2}-1}}{(1+(\frac{m}{n})x)^{\frac{m+n}{2}}}

 

E[X]=\frac{n}{n-2}

V(X)=\frac{2n^2(m+n-2)}{m(n-2)^2(n-4)}

定義としては

S\sim\chi^2_m, T\sim\chi^2_nのとき

X=\frac{\frac{S}{m}}{\frac{T}{n}}

 

*期待値・分散の導出の方法は以下のサイトが参考になります。定義に戻ってカイ二乗分布の期待値をもとに考えると、E[\frac{1}{T}]を考えればなんとかなることが分かります。自由度のm,nが当ブログと逆なのでご注意ください。

F分布の期待値・分散をカイ二乗分布を用いて導出 | AVILEN AI Trend

 

⑫ベータ分布

f(x; a,b)=\frac{1}{B(a,b)}x^{a-1}(1-x)^{b-1}

*ベータ関数の定義は

B(a,b)=\int_0^1x^{a-1}(1-x)^{b-1}dx

またガンマ関数と以下の式のような関連があります。

B(a,b)=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}

ベータ関数とガンマ関数の関係性の証明は以下にまとめました。 

medibook.hatenablog.com

 

E[X]=\frac{a}{a+b}

V(X)=\frac{ab}{(a+b)^2(a+b+1)}

*導出はややトリッキーでベータ関数の以下の性質が利用されます。

B(a+1, b)=\frac{a}{a+b}B(a, b)

上記の性質は以下のサイトが分かりやすいです。部分積分を使って変形していくことで導出します。

ベータ関数とは? ~ 性質と公式 ~ (証明付) - 理数アラカルト -

期待値と分散の詳しい導出方法は以下のサイトが参考になります。ただサイトの中のパラメータα'、βの「ガンマ分布」と書いてある部分は「ベータ分布」の間違いだと思います。

ベータ分布の期待値・分散の導出 | AVILEN AI Trend

 

参考文献: