獨斷論

SPSS 사용법 - Two Way ANOVA 본문

과학과 기술/SPSS

SPSS 사용법 - Two Way ANOVA

부르칸 2013. 3. 20. 02:18

SPSS 사용법 - Two Way ANOVA

이원분산분석

 

Two way ANOVA는 종속변수가 1개이고 독립변수가 2개일때 독립변수에 대한 종속변수의 영향이 통계적으로 의미가 있는지 알아보는 분석방법이다. 다른 말로는 two factor ANOVA 또는 factorial ANOVA라고도 부른다. 독립변수가 3개인 경우에는 three way ANOVA라고 하지만 매우 어려우므로 여기서는 생략하기로 한다.

가정

  1. 모든 observations(즉, subjects)가 독립이다.
  2. Group의 분산이 같아야만 한다. 이를 homogeneity라고 하는데 SPSS에서는 Levene statistic을 이용한다.
  3. 종속변수가 정규분포를 가져야 한다.

Two way ANOVA를 실행하기 위하여 아래 데이터파일을 받아 SPSS에서 불러들인다. 파일은 CSV형식이므로 적절한 import과정이 있어야만 한다.

첨부파일:2anova.csv

 

mathgr은 수학 점수를 나타내는데 0은 A나 B를 못받은 사람들을 나타내고 1은 A나 B를 맞은 사람들을 나타낸다.

mathach는 수학의 성취도를 나타내는 지표로 scale변수이어야만 한다.

faedRevis는 학생의 아버지 교육정도를 나타내는 지표로서 1은 고등학교이하, 2는 전문대수준, 3은 일반대학이상을 나타낸다.

 

이제 mathach를 종속변수로 삼고 mathgr과 faedRevis를 독립변수로 삼아 two way ANOVA를 실행하여 보도록 하자. 즉, 아버지의 교육수준과 학생의 수학성적에 따른 수학 성취도를 보고자 하는 것이다.

 

"Analyze >> General Linear Model >> Univariate"를 클릭하면 아래와 같은 대화상자가 나타난다.

 

 

위와같이 실행하고 나면 plots를 클릭할때 아래와 같은 대화상자가 나타난다. 이는 two way ANOVA에서 interaction를 더 쉽게 보고자 하는 것이다.

 

 

위 순서대로 실행하면 Options를 클릭할때 아래 대화창이 나타난다.

 

 

Options대화상자에서 Descriptive statistics, Homogeneity tests, Estimates of effect size를 클릭하고 continue와 OK를 클릭하면 아래와 같은 결과를 얻을 수 있다.

 

 

Between-Subjects Factors

데이터에 대한 기본적인 사항을 알려준다.

총 73명중에 mathgr이 0인사람은 43명이고 1인사람은 30명이다. 나머지 faedRevis도 쉽게 알수있다.

 

Descriptives Statistics

이 표에서는 독립변수의 변화에 따른 평균 표준편차 데이터갯수를 보여준다.

표의 첫번째 행으로부터 mathgr이 0이고 faedRevis가 1인 사람은 23명이고 mathach의 평균이 9.8임을 알수 있다.

표의 두번째 행으로부터 mathgr이 0이고 faedRevis가 2인 사람은 9명이고 mathach의 평균이 12.8임을 알수 있다.

위 표의 6개의 데이터 즉 9.8, 12.8, 12.4, 10.5, 16.4, 21.8이 앞서 선택한 profile plot에 그려질 것이다.

 

Levene's Test of Equality of Error Variances

이 표에서는 분산의 homogeneity를 볼 수 있다. 표에 나와 있듯이 H0는 분산의 에러가 모든 group에서 같다는 가정이고  p-value = 0.036 < 0.05이므로 homogeneity하지 않음을 알수 있다. 이럴때에는 ANOVA의 결과는 신뢰할 수 없으므로 weighted least square를 쓰던지 non-parametric test를 써야하지만 여기서는 ANOVA에 대해서 알아보는 것이므로 결과를 끝까지 훑어보기로 하자. 

 

 

 

Tests of Between-Subjects Effects

R2과 partial eta squared는 데이터의 variance를 얼마나 설명해 줄수 있는지를 보여준다.

faedRevis의 partial eta sqaured가 0.243이므로 mathach의 variance를 faedRevis가 설명해 준다고 볼수 있다.

R2이 0.339이므로 mathach의 variance를 3개의 독립변수 즉 mathgr, faedRevis, mathgr*faedRevis에서 설명해 준다고 볼수 있다..

mathgr, faedRevis, mathgr*faedRevis의 partial eta squared가 0.139, 0.243, 0.106이므로 partial eta는 0.37, 0.49, 0.33이다. R2의 값은 0.339이다.

Cohen(1988)에 따르면 아래와 같이 분석할 수 있다고 하였다.

R = 0.10 (small), 0.36(medium), 0.51(large)

eta = 0.10(small), 0.24(medium), 0.31(large)

 

mathgr, faedRevis, mathgr*faedRevis의 p-value가 0.002, 0.000, 0.024이므로 모두 mathach에 통계적으로 유의미한 영향을 미침을 알 수 있다. 하지만 interaction의 p-value가 0.05보다 작다면 profile plot을 볼 필요가 있고 simple effect를 분석해볼 필요가 있다(simple effect는 post hoc에서 자세히 알아볼 것이므로 여기서는 생략한다).

 

 

위 profile plot에서 알 수 있듯이 interaction이 통계적으로 유의미하므로 faedRevis가 작을때 mathgr에 0인 group과 1인 group이 mathach에 미치는 영향을 크게 다르지 않음을 볼수 있다. 따라서 어떤 변수가 얼마만큼 mathach에 영향을 미쳤는지는 post hoc test에서 simple effect를 보아야만 한다.

 

 

 

Comments