獨斷論

SPSS 사용법 - ANCOVA 본문

과학과 기술/SPSS

SPSS 사용법 - ANCOVA

부르칸 2013. 3. 26. 11:22

SPSS 사용법 - ANCOVA(Analysis of Covariance)

공변량분석법

 

ANCOVA를 한마디로 말하면 (ANOVA + regression)이다. ANCOVA는 종속변수(dependent variables, DV)의 평균이 독립변수(independent variable, IV)에 따라 변하는지 보는 것이지만, ANOVA와 다른 점은 DV와 IV 이외의 다른 변수의 영향을 고려한다는 점이며 이때 이 변수를 covariate variables(CV)라고 한다.

 

예를 들어 아래 그림을 보자

 

종속변수 Y는 subject에 따라 변화는 있지만  통계적으로 의미가 없음을 그림에서 짐작할수있다.

하지만  treatment를 covariate variable로 고려를 한다면 아래와 같은 그림을 얻을 수 있다.

 

 

즉, 종속변수 Y의 변화를 고려할때에 독립변수 X뿐만 아니라 covariate variable로  treatment를 사용한다면 통계적으로 의미있다고 결론을 내릴수 있다.

 

이제 위와 같은 ANCOVA를 SPSS에서 실행하기 위하여 아래 첨부파일을 받아 불러들이도록 하자. csv파일이므로 적절한 import과정을 거쳐야만 한다.

첨부파일:ancova.csv

위 파일에서

  • country - 나라이름
  • religion - 각 나라별 가장 많은 종교
  • lifeexpf - 여성들으 평균 수명
  • babymort - 유아의 사망률
  • gdp_cap - 국민 1일당 명목 국민총생산
  • region - 지역을 나타낸다. 즉, 1은 OECD, 2는 동유럽, 3은 아시아, 4는 아프리카, 5는 중동, 6은 라틴어메리카
  • climate - 기후를 나타낸다. 1은 사막, 2는 건조사막, 3은 건조, 5는 열대, 6은 지중해, 7은 해양성, 8은 온대, 9는 한대, 10은 극지방

ANCOVA를 수행하기 위하여 "Analyze >> General Linear Model >> Univariate.. "를 클릭하면 아래와 같은 대화창이 나타난다.

 

기후와 평균수명

우선 ANOVA를 통해 각 기후별 평균수명이 어떻게 차이가 나는지 알아보자.

 

위의 순서대로 실행하고 OK를 클릭하면 아래와 같은 결과를 얻을 수 있다.

 

climate의 p-value가 0.000이므로 climate는 lifeexpf를 예측하는데 통계적으로 의미있는 predictor라고 할 수 있다. 여기서 Corrected Model의 p-value(F 값)와 climate의 p-value(F 값)가 같은 것은 독립변수가 오직 한 개만 있기 때문이다.

위 결과를 좀더 생각해볼때 "추운날씨가 과연 장수하는데 더 도움이 되고 건강에도 도움이 되는가?"라고 질문할 수 있다. 그렇다면 건강과 추운날씨 사이에 연결관계가 있는 covariate를 규명할 수도 있을 것이다.

 

Covariate Variable을 추가하기

Covariate variable은 독립변수와는 달리 interval 또는 ratio scale이다.

다시 "Analyze >>General Linear Model >> Univariate.."를 클릭한다.

 

 

위 그림에서 두 개의 covariates를 선택했는데 그것은 아이의 사망률(babymort)과 국민총생산(gdp_cap)이다. 선진국은 더 나은 의료혜택등으로 인하여 평균수명이 연장될수도 있고 또한 아이의 사망률도 평균수명에 영향을 미칠 수 있으므로 이와 같이 선택하였다.

OK를 클릭하면 아래와 같은 결과를 얻을 수 있다.

 

전체 모델에 대한 p-value = 0.000이고 기후(climate)의 p-value = 0.206이며 통계적으로 의미가 없음을 보여준다. 이는 앞서 ANOVA만 실행했을때와는 다른 결과이다.

여성의 평균수명에 가장 영향을 미치는 변수는 아이의 사망률임을 알수있고

이는 ANOVA를 수행하였을때에는 얻을 수 없는 결과였다.

 

ANCOVA의 변수

  • 종속변수 - interval이나  scale변수
  • 독립변수 - categorical  변수
  • Covariate variables - interval이나  scale변수

 

Comments