現代数理統計学の基礎　5章　問12

二項分布を変数変換したときの、確率収束及び分布収束の問題ですね。

今まで解答の意味がよくわからなかったのですが、確率変数 $X_n$ がn→∞となるときにどう動くかは、前提として二項分布の母比率と標本比率の話がわかっておいた方が良さそうであることに後で気がつきました。

標本比率は母比率に確率収束する

母比率は二項分布におけるpのことです。それに対して標本比率は今回の設問の設定において $\frac{X_n}{n}$ で表されます。n回施行のうち、 $X_n$ 回が成功と出るわけなので、意味はよく分かります。

で、 $X_n$ そのものがn→∞のとき、どうなるかはわからないのですが、標本比率であれば、母比率に確率収束することが分かります。

というのも、 $\frac{X_n}{n}$ はそもそもベルヌーイ分布の標本平均と考えることができるので、1回の試行の結果を $Y_1, Y_2, ...,Y_n i.i.d.$ とすれば

$\frac{X_n}{n}=\frac{1}{n}\sum Y_i$

と表すことができます。

確率変数Yの期待値はp, 分散はp(1-p)となるので大数の弱法則より、その平均はpに収束することが分かります。

というわけでn→∞のとき $\frac{X_n}{n}\to p$ となります。

$Y_n\to _plogp$ を示す

以上の前提から問題に取り掛かります。

まず上記の収束を示すには十分に小さい適当な定数ε＞0をとって

$P(|Y_n-logp|)\gt\epsilon\to0$

を示せば良いことが分かります。

ここでまず第1項は

となります。0＜p＜1なので、 $|1-logp|\gt\epsilon$ はいつでも成り立つことが分かります。

n→∞とすると0に収束します。

次に第2項をみていきます。

$P(|Y_n-logp|\gt\epsilon|X_n\geq1)\\=P(|log\frac{X_n}{np}|\gt\epsilon|X_n\geq1)$

Pの中身を検討すると

$log\frac{X_n}{np}\lt-\epsilon, \epsilon\lt log\frac{X_n}{np}|\\\frac{X_n}{n}\lt pe^{-\epsilon}, pe^{\epsilon}\lt\frac{X_n}{n}\\\frac{X_n}{n}-p\lt p(e^{-eipsilon}-1), p(e^{\epsilon}-1)\lt\frac{X_n}{n}-p$

となります。

n→∞のとき

$\frac{X_n}{n}-p$ は0に収束しますが

$p(e^{-\epsilon}-1)$ は負になり

$p(e^{\epsilon}-1)$ は正になるため

不等号を満たす確率は0になります。

よって第2項も0に収束します。

以上から

$P(|Y_n-logp|)\gt\epsilon\to0$ が示せました。

続いて

$\sqrt n(Y_n-logp)\to_dN(0, \frac{1-p}{p})$ を示します。

前半の問題と同様に場合わけをまず行います。今回は連続型確率分布の話となるので定義関数Iを用いて

$\sqrt n(Y_n-logp)=\sqrt n(Y_n-logp)I(X_n\geq1)+\sqrt n(Y_n-logp)I(X_n=0)$

と表すことができます。

第2項については前半の問題と同様にみていくと

$\sqrt n(Y_n-logp)I(X_n=0)\\=(1-logp)\sqrt nI(X_n=0)$

ここで

$P(\sqrt nI(X_n=0)\gt \epsilon)\\=P(I(X_n=0)\gt\frac{\epsilon}{\sqrt n})\\P(X_n=0)\\=(1-p)^n\to0$

となります。

よって、第1項のみに着目して話を進めます。

ここで使うのがデルタ法です。目的となる確率密度関数をテイラー展開していきます。二次の項まで展開して

$log\frac{X_n}{n}\approx logp-\frac{1}{p}(\frac{X_n}{n}-p)\\\sqrt n(log\frac{X_n}{n}-logp)\approx\frac{\sqrt n}{p}(\frac{X_n}{n}-p)\\=\frac{1}{p}\sqrt n(\frac{X_n}{n}-p)$

ここで、 $\frac{X_n}{n}$ は平均p、分散p(1-p)なので中心極限定理より

$_dN(0, p(1-p))$ に収束します。

先程の式はそこに $\frac{1}{p}$ がついてますので

$_dN(0, \frac{1-p}{p})$ に収束することが分かりました。

当サイトに掲載されている広告について

当サイトでは、第三者配信の広告サービス（Googleアドセンス、を利用しています。
このような広告配信事業者は、ユーザーの興味に応じた商品やサービスの広告を表示するため、当サイトや他サイトへのアクセスに関する情報『Cookie』(氏名、住所、メールアドレス、電話番号は含まれません) を使用することがあります。
またGoogleアドセンスに関して、このプロセスの詳細やこのような情報が広告配信事業者に使用されないようにする方法については、こちらをクリックしてください。

当サイトが使用しているアクセス解析ツールについて

当サイトでは、Googleによるアクセス解析ツール「Googleアナリティクス」を利用しています。
このGoogleアナリティクスはトラフィックデータの収集のためにCookieを使用しています。
このトラフィックデータは匿名で収集されており、個人を特定するものではありません。
この機能はCookieを無効にすることで収集を拒否することが出来ますので、お使いのブラウザの設定をご確認ください。
この規約に関して、詳しくはこちら、またはこちらをクリックしてください。

当サイトへのコメントについて

当サイトでは、スパム・荒らしへの対応として、コメントの際に使用されたIPアドレスを記録しています。
これはブログの標準機能としてサポートされている機能で、スパム・荒らしへの対応以外にこのIPアドレスを使用することはありません。
また、メールアドレスとURLの入力に関しては、任意となっております。
全てのコメントは管理人であるmedibookが事前にその内容を確認し、承認した上での掲載となりますことをあらかじめご了承下さい。
加えて、次の各号に掲げる内容を含むコメントは管理人の裁量によって承認せず、削除する事があります。

特定の自然人または法人を誹謗し、中傷するもの。

極度にわいせつな内容を含むもの。

禁制品の取引に関するものや、他者を害する行為の依頼など、法律によって禁止されている物品、行為の依頼や斡旋などに関するもの。

その他、公序良俗に反し、または管理人によって承認すべきでないと認められるもの。

脳内ライブラリアン

医療、統計、哲学、育児・教育、音楽など、学んだことを深めて還元するために。

現代数理統計学の基礎　5章　問12

標本比率は母比率に確率収束する

$Y_n\to _plogp$ を示す