役に立つ薬の情報~専門薬学 | 薬・薬学・専門薬学・薬理学など

役に立つ薬の情報~専門薬学

ピアソンの相関係数、Spearman(スピアマン)の順位相関係数

 

 回帰と相関
回帰とはxとyでどのような関係式で表すことができるかである。例えば、回帰直線はy=a+bxの式で表され、aとbに何の数値が入るかを調べる。それに対し、相関はxとyの相互関係の強さである。

 

 

 

 ピアソンの相関係数(パラメトリック法)
相関の強さは相関係数rで表し、|r|≦1である。|r|が1に近いほど相関が強い。ただし、この検定はデータが正規分布するときに使用できる。

 

・仮説の設定
帰無仮説(H0):「相関はない」と仮定する。
対立仮説(H1):「相関はある」と仮定する。

 

・確率を求める
rを求めるのに必要な計算は回帰を求めるときと似ており、次の5つの式を計算する。

 

Σxi

………

 xを全て足したもの

Σyi

………

 yを全て足したもの

Σxi2

………

 xの2乗を全て足したもの

Σyi2

………

 yの2乗を全て足したもの

Σxiyi 

………

 xとyの積を全て足したもの

 

上記の計算をしたら、下の式によってSxx,Sxy,Syyを求める。

 

 

 

次に下の式によって統計量rを求める。

 

 

 

rを求めたら、相関係数検定表(r表)からrαを求める。

 

・判定
|r|≦rαのとき、P>0.05となる → 帰無仮説を棄却できない。
|r|>rαのとき、P<0.05となる → 帰無仮説を棄却する。

 

………………………………………………………………………………………………………………

 

 例題
健康診断を行ったところ、年齢と酵素Xの値で下のような結果を得た。このとき、年齢と酵素Xの量には関連があるかどうかを検定せよ。ただし、「このデータは正規分布する」と仮定する。

 

年齢

酵素X

35

47

20

62

63

36

59

40

14

58

44

46

42

50

年齢

酵素X

25

57

73

38

38

44

56

40

69

32

28

54

46

48

 

(注:このデータは便宜的に作ったもので、実際のデータではない)

 

帰無仮説(H0):年齢と酵素Xの量には関連がない
対立仮説(H1):年齢と酵素Xの量には関連がある

 

・計算
まずΣxi,Σyi,Σxi2,Σyi2,Σxiyiを求めるためにx,y,x2,xy,y2の表を作る。

 

x

y

x2

xy

y2

35

47

1225

1645

2209

20

62

400

1240

3844

63

36

3969

2268

1296

59

40

3481

2360

1600

14

58

196

812

3364

44

46

1936

2024

2116

42

50

1764

2100

2500

25

57

625

1425

3249

73

38

5329

2774

1444

38

44

1444

1672

1936

56

40

3136

2240

1600

69

32

4761

2208

1024

28

54

784

1512

2916

46

48

2116

2208

2304

Σxi=612

Σyi=652

Σxi2=31166

Σxiyi=26488

Σyi2=31

 

Σxi,Σyi,Σxi2,Σyi2,Σxiyiを求めたら、今度は偏差平方和(Sxx,Syy)と偏差積和(Sxy)を求める。

 

 

 

偏差平方和を求めたら、次は統計量rを求める。

 

 

 

このときのr0.05はn=14のとき相関係数検定表(r表)から、r0.05=0.532であると分かる。

 

|r|=0.943>0.532=r0.05より、P<0.05となるので帰無仮説を棄却できる。つまり、「年齢と酵素Xの量には関連がある」ということができる。

 

 

 

………………………………………………………………………………………………………………

 

 Spearmanの順位相関係数(ノンパラメトリック法)
データが正規分布するならピアソンの相関係数rで検定すればいいが、正規分布しないならSpearmanの順位相関係数rsで検定する。

 

・仮説の設定
帰無仮説(H0):「相関はない」と仮定する。
対立仮説(H1):「相関はある」と仮定する。

 

・確率を求める
[計算法1]
まず、x,yごとに1→n番まで順位を付ける。順位を付けたら、対応するxの順位rxiとyの順位ryiの差diを求める。diを計算したら、その二乗di2を求める。

 

diとdi2を求めることができたら、下の計算式によってrsを導く。

 

 

 

[計算法2]
xの順位rxiとyの順位ryiから相関係数を求める。(ピアソンの相関係数のときと同じ計算)

 

Σrxi,Σryi,Σrxi2,Σryi2,Σrxiryiを求めた後、偏差平方和(Sxx,Syy)と偏差積和(Sxy)を計算して下の式に代入する。

 

 

 

n≦30のときSpearman検定表から判定する。

 

・判定
P≧αのとき帰無仮説を棄却できない。
P<αのとき帰無仮説を棄却する。

 

n>30のとき、t=が自由度df=n-2のt分布をする → t分布表から判定

 

・判定
|t|≦tαのとき、P≧αとなり帰無仮説を棄却できない。
|t|>tαのとき、P<αとなり帰無仮説を棄却する。有意差あり。

 

………………………………………………………………………………………………………………

 

健康診断を行ったところ、年齢とある酵素の値で下のような結果を得た。このとき、年齢と酵素Xの量には関連があるかどうかを検定せよ。ただし、「このデータは正規分布しない」と仮定する。

 

年齢

酵素X

35

47

20

62

63

36

59

40

14

58

44

46

42

50

年齢

酵素X

25

57

73

38

38

44

56

40

69

32

28

54

46

48

(注:このデータは便宜的に作ったもので、実際のデータではない)

 

帰無仮説(H0):年齢と酵素Xの量には関連がない
対立仮説(H1):年齢と酵素Xの量には関連がある

 

・計算
[計算法1]
x,yについて順位をつけてrxiとryiを導く。rxiとryiの差diとその二乗di2を求める。

 

年齢

酵素X

順位

順位差

x

y

rxi

ryi

di

di2

35

47

5

8

-3

9

20

62

2

14

-12

144

63

36

12

2

10

100

59

40

11

4.5

6.5

42.25

14

58

1

13

-12

144

44

46

8

7

1

1

42

50

7

10

-3

9

25

57

3

12

-9

81

73

38

14

3

11

121

38

44

6

6

0

0

56

40

10

4.5

5.5

30.25

69

32

13

1

12

144

28

54

4

11

-7

49

46

48

9

9

0

0

 

 Σdi2=874.5

 

di2の和(Σdi2)の値は874.5なので、下の式に代入してrsを求める。

 

 

 

[計算法2]
Σrxi,Σryi,Σrxi2,Σryi2,Σrxiryiを求めた後、偏差平方和(Sxx,Syy)と偏差積和(Sxy)を計算する。

 

rxi

ryi

rxi2

rxiryi

ryi2

5

8

25

40

64

2

14

4

28

196

12

2

144

24

4

11

4.5

121

49.5

20.25

1

13

1

13

169

8

7

64

56

49

7

10

49

70

100

3

12

9

36

144

14

3

196

42

9

6

6

36

36

36

10

4.5

100

45

20.25

13

1

169

13

1

4

11

16

44

121

9

9

81

81

81

Σxi=105

Σyi=105

Σxi2=1015

Σxiyi=577.5

Σyi2=1014.5

 

・Srxrx = 227.5
・Srxry = -210
・Sryry = 227

 

次に、下の式に代入してrsを求める。

 

 

 

n≦30なので、Spearman検定表から判定する。n=8のとき、P<0.05となる最小のrs値は0.539である。つまり、rsが0.539よりも値が大きければ帰無仮説を棄却できる。

 

ここでは|r|>0.539なので、P<0.05となり帰無仮説を棄却できる。つまり、「年齢と酵素Xの量には関連がある」と判断できる。

 

スポンサードリンク



スポンサードリンク