脳内ライブラリアン

脳内ライブラリアン

医療、統計、哲学、育児・教育、音楽など、学んだことを深めて還元するために。

MENU

相関係数①<共分散~ピアソンの相関係数まで>【統計検定1級対策】

今日は、公式を復習しつつ、共分散と相関係数に関連した事項と過去問をみてみようと思います。

 

2014-2017年の過去問をみる限りは意外と相関係数の問題はあまり出ていないんですよね。2017年の問5くらいでしょうか。

 

ただ出題範囲ではありますし、出てもおかしくないところではあるので、必要な公式と式変形を見直してみます。

 

定義とか概念はもっと分かりやすいページがいっぱいある(こことか→相関係数とは何か。その求め方・公式・使い方と3つの注意点|アタリマエ!)と思うので、検定対策という点とそれぞれの相関係数の特徴(パラメトリックかノンパラメトリックか)をみていく記事にしていきます。

 

目次:

 

 

共分散の式変形

相関係数を出すのに必要な共分散について、まず見直してみます。ある確率変数XとYの共分散Cov(X,Y)は以下の式で定義されます。

 

Cov(X, Y)=E[(X-E(X))(Y-E(Y))]\\=E[XY+XE(Y)-YE(X)+E(X)E(Y)]\\=E[XY]-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)\\=E[XY]-E[X]E[Y]

 

となります。最後の形のほうが使いやすいのでこちらを用いることが多いと思います。

 

ピアソンの相関係数

まずはこの共分散を使ってピアソンの相関係数の式をみていきます。

 

ピアソンの相関係数とはパラメトリックな分布をとる連続変数どうしの関連性を見る際に使われる相関係数です。ただ、「相関係数」と言う場合もこれを指します。

 

式としては分子に共分散、分母にそれぞれの標準偏差を持ってきます。

 

具体的な式として書くと

 

r=\frac{Cov(X,Y)}{\sigma_x\sigma_y}\\=\frac{Cov(X,Y)}{\sqrt{\frac{1}{n}\sum(X_i-E[X])^2}\sqrt{\frac{1}{n}\sum(Y_i-E[Y])^2}}

 

となります。

 

ここで実際の統計検定の問題を解くうえで注意が必要なのは、分子の標準偏差をnで割るかn-1で割るかということ。n-1で割る場合は不偏分散ですが、nで割る場合は標本分散です。

 

この式はnで割ったものを提示しています。というのも上記の式の共分散の定義は、期待値を用いている(期待値はnで割っている)ことから分かるように、標本分散と同様にnで割ったものだからです。

 

実際、分子分母間で統一されていれば、結局全部約分されるので、nでもn-1でもどちらでも同じです。ただ両方で統一しなければいけません。

 

何が困るかというところを、過去問で具体的にみてみます。

 

統計検定1級でみる過去問の事例

先日の記事でも書いた2015年の問2の続きである(2)を例にしてみてみます。

これは相関係数を求める問題です。

medibook.hatenablog.com

 

(2)は相関係数が以下の式で表せることを示す問題です。

r=\frac{\sqrt{n_1n_2}(\bar y_1-\bar y_2)}{\sqrt{n(n-1)s^2}}

 

ここで注意しなければいけないのは、最終的に示したい式で用いるs^2が不偏分散であることです。つまりn-1で割っています。そうするとこれを用いる以上は全てn-1で割る方向で統一した方が良いです。

 

あとは愚直に相関係数の公式に従って求めていきますが、n-1で割る形に補正をしていきます。

 

x_i=a(i=1,2,...,n_1), x_i=-a(i=n_1+1,...,n)とおいて考えていくと

 

例えば、相関係数の分子は

Cov(X,Y)=E[XY]-E[X]E[Y]となりますがn-1で割る形に補正して

\frac{n}{n-1}(E[XY]-E[X]E[Y])となります。

 

分母となる標準偏差の計算も以下の公式を使って出しますが

V(X)=E[X^2]-(E[X])^2

これも同様に不偏分散への変換が必要なので

\frac{n}{n-1}\{E[X^2]-(E[X])^2\}

という式にすることが必要です。

 

あとは相関係数の式に従って当てはめるだけ、となります。

 

うっかりここでnで割るか、n-1で割るかを間違えると答えにたどり着けなくなるので、同様の問題が出た時はちょっと落ち着いて考える必要がありそうですね。

 

統計検定で出るとしたら問題としても出しやすいので、今回紹介したピアソンの相関係数になると思いますが、続いて次回は範囲にはなっているので、スピアマンの相関係数をみていきます。

 

参考文献: 

日本統計学会公式認定 統計検定 1級 公式問題集[2014〜2015年]

日本統計学会公式認定 統計検定 1級 公式問題集[2014〜2015年]

  • 発売日: 2019/10/04
  • メディア: オンデマンド (ペーパーバック)
 

 

現代数理統計学の基礎 (共立講座 数学の魅力)

現代数理統計学の基礎 (共立講座 数学の魅力)

 

 

楽天ユーザーの方はこちら