獨斷論

GLM을 이용한 공분산분석ANCOVA 수행하기 (SPSS 사용설명서 23) 본문

과학과 기술/SPSS

GLM을 이용한 공분산분석ANCOVA 수행하기 (SPSS 사용설명서 23)

부르칸 2015. 4. 15. 13:03

이제 공분산분석ANCOVA를 SPSS에서 실행하여보자 ANCOVA란 analysis of covariance의 약자이다.

앞서 배웠던 ANOVA는 analysis of variance의 약자이다.

ANCOVA를 공분산분석이라 하지 않고 공변량분석이라고 하는 사람도 있다.


공분산분석ANCOVA란 간단히 말해서 두 개의 선형회귀분석한 예측값을 이은 선 두개가 서로 얼마나 다른지 비교하는 것이다. 아래 그림을 보면 이해하기가 쉽다. 아래 그림은 두 동물 집단의 심장박동수를 측정한 가상의 데이터를 그래프로 나타낸 것이다.



Group1과 Group2는 두 동물집단사이에 심장박동수의 큰 차이가 보이지를 않는다.

하지만 이 두 동물집단은 주위 온도에 따라 심장박동수가 달라진다고 한다면 주위 온도와 심장박동을 그래프로 그리면 두 그룹사이에 확연한 차이를 보일수도 있을 것이다.


첫번째 그림처럼 생각하여 두 그룹의 차이를 보는 것이 ANOVA의 기본 개념이라면

두번째 그림처럼 생각하며 두 그룹의 차이를 보는 것은 ANCOVA이다.


이제 위 그림으 그린 데이터를 데이터를 내려받아서 SPSS에 읽고 pulse_temp.sav로 저장하자.


pulse_temp.csv


제대로 했으면 아래와 같이 된다.



Homogeneity of regression slopes

지금까지는 다루지 않았던 가정이 여기 하나 더 나오는데 ANCOVA의 중요한 가정 가운데 하나이다.

ANCOVA를 실행하기 위해서는 선형회귀분석한 모델의 기울기가 homogeneity를 가지고 있어야 한다는 것이다.

이를 알아보기 위해서는 ANCOVA를 수행하기에 앞서 covariates(연속변수)와 factor(범주형변수)끼리 interaction이 있는지 검사해보면 된다. 

Analyze > General Linear Model > Univariate... 를 클릭한다.



위와 같은 창이 뜨면

Dependent variables에 pulse를 지정하고

Fixed factors에 group,

Covariates에 temp를 지정한다.


Model 버튼을 클릭하여

Specify Model에서 Custom을 클릭하고

Build term Type에 Main effects를 선택한 후에 group과 temp를 변수로 지정한다.

Build term Type에 Interaction을 선택하고 group과 temp 두 변수를 마우스로 선택한 후에 화살표를 누르면 group*temp가 오른쪽으로 옮겨가 모델변수로 지정된다.

아래 그림과 같다.


Continue를 누른다.


다시 GLM Univariate 대화상자로 돌아가서 Options를 누른다.



Continue을 클릭한 후에

OK를 클릭한다.

위 표에서 보듯이 group * temp의 p-value가 0.635로 통계적으로 의미가 있지 않으므로 coefficients homogeneity를 만족한다고 볼수 있으므로 ANCOVA를 수행한다.


ANCOVA 실행하기

Analyze > General Linear Model > Univariate... 를 클릭한다.

한가지만 제외하고 앞서 수행한 것과 같다. 즉, group과 temp가 서로 interaction이 없다는 가정을 만족하였으므로 Model에서 이 둘 사이의 interaction을 제거해야한다.



변수는 앞서 지정한 것과 같고

Model을 클릭한 후에

Custom을 Full factorial로 바꾼다.

Continue를 클릭한다.



Options를 클릭하여 위와 같은 창이 뜨면

Descriptive statistics, Homogeity tests, Estimates of effect size, Spread vs. level plot, Parameter estimates를 클릭한 후에 Continue를 클릭하고 OK를 클릭한다.


ANCOVA 결과 분석하기

Homogeneity of Variances 알아보기

p-value가 0.149이므로 통계적으로 의미가 있지 않다.

따라서 null hypothesis인 종속변수의 error variance가 그룹끼리 서로 같다는 가설을 받아들일 수 있다.


Between-Subjects의 영향



temp와 group의 p-value가 모두 0.000으로 통계적으로 의미가 있다. 이는 pulse에 영향을 주는 것은 group과 temp라고 보여주는 것이다. 반면 아래 표는 pulse vs. group의 ANOVA 결과인데...



p-value가 0.110으로 두 그룹 사이의 pulse가 차이가 없다는 결과를 나타내었다.

이는 pulse에 영향을 미치는 temp라는 변수를 고려하지 않고 단순히 두 그룹사이의 차이만보았기때문이다.


Parameter estimates



위 표는 GLM의 parameter estimates 결과를 보여주는 것이다.

group0의 B값이 8.444이고 group1의 B가 0이므로 두 그룹 사이의 pulse 차이는 약 8.444로 볼수 있다는 것이다.






Comments