役に立つ薬の情報~専門薬学 | 薬・薬学・専門薬学・薬理学など

役に立つ薬の情報~専門薬学

直線回帰

 

 回帰と相関
回帰とはxとyでどのような関係式で表すことができるかである。例えば、回帰直線はy=a+bxの式で表され、aとbに何の数値が入るかを調べる。それに対し、相関はxとyの相互関係の強さである。

 

 

 

相関の強さは相関係数rで表し、|r|≦1である。|r|が1に近いほど相関が強い。

 

 直線回帰(最小二乗法)
平面に当てはめたn個の点からy=a+bxの式を導き出すのが直線回帰である。この直線を回帰直線という。

 

係数a,bを導くためには横軸をx,縦軸をyとしたとき、次の5つの式を計算しないといけない。

 

Σxi

………

 xを全て足したもの

Σyi

………

 yを全て足したもの

Σxi2

………

 xの2乗を全て足したもの

Σyi2

………

 yの2乗を全て足したもの

Σxiyi 

………

 xとyの積を全て足したもの

 

上記の計算をしたら、下の式に代入してa,bを求める。

 

 

 

ここでSxxはxの偏差平方和、Sxyはx,yの偏差平方和を表している。下に、Sxx,Sxy,Syyの求め方を示す。(Syyはyの偏差平方和)

 

 

 

・回帰の優位性を判断する
回帰直線を求めても、その回帰が有意(意味のあるもの)でなければならない。回帰の優位性を求めるには、傾きであるbが0から偏っているかどうかを検定する。bの信頼区間係数βに0が含まれていればその回帰は意味のないものであり、0が含まれていなければその回帰は意味のあるものである。

 

bの優位性を判定するには、まずbの標準偏差sbを求める必要がある。sbは下の式によって求めることができる。

 

 

 

ここで、sは回帰直線の標準偏差であり、下の式で求める。

 

 

 

Sbを求めたら今度はt0.05t分布表から求める。このときの自由度dfはn-2である。

 

Sbとt0.05を求めたらbの信頼区間係数βを求める。95%の信頼区間係数βは次の式によって求めることができる。

 

 

 

・判定
信頼区間係数βに0が含まれる → 回帰は有意でない
信頼区間係数βに0が含まれない → 回帰は有意である

 

………………………………………………………………………………………………………………

 

 例題
体重と身長の関係を調べると、表のような結果を得られた。
(1)最小二乗法によって回帰直線y=a+bxを求めよ。
(2)bの信頼区間を求めよ。
(3)回帰は有意かどうかを判断せよ。

 

体重

身長

65

170

80

182

72

174

57

162

78

172

67

166

58

158

体重

身長

92

182

68

177

65

175

58

164

70

169

62

177

84

182

 

(注:このデータは便宜的に作ったもので、実際のデータではない)

 

・問1
まずΣxi,Σyi,Σxi2,Σyi2,Σxiyiを求めるためにx,y,x2,xy,y2の表を作る。

 

x

y

x2

xy

y2

65

170

4225

11050

28900

80

182

6400

14560

33124

72

174

5184

12528

30276

57

162

3249

9234

26244

78

172

6084

13416

29584

67

166

4489

11122

27556

58

158

3364

9164

24964

92

182

8464

16744

33124

68

177

4624

12036

31329

65

175

4225

11375

30625

58

164

3364

9512

26896

70

169

4900

11830

28561

62

177

3844

10974

31329

84

182

7056

15288

33124

Σxi=976

Σyi=2410

Σxi2=69476

Σxiyi=168833

Σyi2=41

 

Σxi,Σyi,Σxi2,Σyi2,Σxiyiを求めたら、今度は偏差平方和(Sxx,Sxy,Syy)を求める。 (Syyは回帰の優位性を判断するときに使う)

 

 

 

偏差平方和を求めたら、次は係数a,bを求める。

 

 

 

よって、回帰直線は次のようになる。(下の式では)

 

 y = 132.2+0.573x

 

 

 

※直線に限らず、エクセルを使えば回帰を簡単に計算してくれます。

 

・問2
回帰の優位性を判断するため、回帰直線の標準偏差sを求める。

 

 

 

次にbの標準偏差sbを求める。

 

 

 

また、t0.05は自由度df=n-2=14-2=12のt分布表よりt0.05=2.179となる。信頼区間係数βはsbとt0.05を使って次の式で求める。

 

 

 

・問3
bの信頼区間の中にb=0を含まないので、「回帰は有意である」と判断することができる。

 

スポンサードリンク



スポンサードリンク