脳内ライブラリアン

脳内ライブラリアン

医療、統計、哲学、育児・教育、音楽など、学んだことを深めて還元するために。

MENU

現代数理統計学の基礎 5章 問12

二項分布を変数変換したときの、確率収束及び分布収束の問題ですね。

 

今まで解答の意味がよくわからなかったのですが、確率変数X_nがn→∞となるときにどう動くかは、前提として二項分布の母比率と標本比率の話がわかっておいた方が良さそうであることに後で気がつきました。

 

標本比率は母比率に確率収束する

母比率は二項分布におけるpのことです。それに対して標本比率は今回の設問の設定において\frac{X_n}{n}で表されます。n回施行のうち、X_n回が成功と出るわけなので、意味はよく分かります。

 

で、X_nそのものがn→∞のとき、どうなるかはわからないのですが、標本比率であれば、母比率に確率収束することが分かります。

 

というのも、\frac{X_n}{n}はそもそもベルヌーイ分布の標本平均と考えることができるので、1回の試行の結果をY_1, Y_2, ...,Y_n i.i.d.とすれば

\frac{X_n}{n}=\frac{1}{n}\sum Y_i

と表すことができます。

 

確率変数Yの期待値はp, 分散はp(1-p)となるので大数の弱法則より、その平均はpに収束することが分かります。

 

というわけでn→∞のとき\frac{X_n}{n}\to pとなります。

 

Y_n\to _plogpを示す

 

以上の前提から問題に取り掛かります。

 

まず上記の収束を示すには十分に小さい適当な定数ε>0をとって

P(|Y_n-logp|)\gt\epsilon\to0

を示せば良いことが分かります。

 

P(|Y_n-logp|\gt\epsilon)\\=P(|Y_n-logp|\gt\epsilon|X_n=0)+P(|Y_n-logp|\gt\epsilon|X_n\geq1)

 

ここでまず第1項は

P(|Y_n-logp|\gt\epsilon|X_n=0)\\=P(|1-logp|\gt\epsilon|X_n=0)\\=P(X_n=0)\\=(1-p)^n

 となります。0<p<1なので、|1-logp|\gt\epsilonはいつでも成り立つことが分かります。

 

n→∞とすると0に収束します。

 

次に第2項をみていきます。

P(|Y_n-logp|\gt\epsilon|X_n\geq1)\\=P(|log\frac{X_n}{np}|\gt\epsilon|X_n\geq1)

Pの中身を検討すると

log\frac{X_n}{np}\lt-\epsilon, \epsilon\lt log\frac{X_n}{np}|\\\frac{X_n}{n}\lt pe^{-\epsilon}, pe^{\epsilon}\lt\frac{X_n}{n}\\\frac{X_n}{n}-p\lt p(e^{-eipsilon}-1), p(e^{\epsilon}-1)\lt\frac{X_n}{n}-p

となります。

 

n→∞のとき

\frac{X_n}{n}-pは0に収束しますが

p(e^{-\epsilon}-1)は負になり

p(e^{\epsilon}-1)は正になるため

不等号を満たす確率は0になります。

よって第2項も0に収束します。

 

以上から

P(|Y_n-logp|)\gt\epsilon\to0が示せました。

 

 

続いて

\sqrt n(Y_n-logp)\to_dN(0, \frac{1-p}{p})を示します。

 

前半の問題と同様に場合わけをまず行います。今回は連続型確率分布の話となるので定義関数Iを用いて

\sqrt n(Y_n-logp)=\sqrt n(Y_n-logp)I(X_n\geq1)+\sqrt n(Y_n-logp)I(X_n=0)

と表すことができます。

 

第2項については前半の問題と同様にみていくと

\sqrt n(Y_n-logp)I(X_n=0)\\=(1-logp)\sqrt nI(X_n=0)

ここで

P(\sqrt nI(X_n=0)\gt \epsilon)\\=P(I(X_n=0)\gt\frac{\epsilon}{\sqrt n})\\P(X_n=0)\\=(1-p)^n\to0

となります。

 

よって、第1項のみに着目して話を進めます。

ここで使うのがデルタ法です。目的となる確率密度関数テイラー展開していきます。二次の項まで展開して

 

log\frac{X_n}{n}\approx logp-\frac{1}{p}(\frac{X_n}{n}-p)\\\sqrt n(log\frac{X_n}{n}-logp)\approx\frac{\sqrt n}{p}(\frac{X_n}{n}-p)\\=\frac{1}{p}\sqrt n(\frac{X_n}{n}-p)

ここで、\frac{X_n}{n}は平均p、分散p(1-p)なので中心極限定理より

_dN(0, p(1-p))に収束します。

先程の式はそこに\frac{1}{p}がついてますので

_dN(0, \frac{1-p}{p})に収束することが分かりました。