獨斷論

SPSS 사용법 - Hierarchical Multiple Regression 본문

과학과 기술/SPSS

SPSS 사용법 - Hierarchical Multiple Regression

부르칸 2013. 3. 8. 05:17

SPSS 사용법 - Hierarchical Multiple Regression (계층적 다중회귀)

Hierarchical multiple regression은 multiple regression의 변형이다. Multiple regression은 여러개의 독립변수를 선택하여 독립변수를 제거하거나 선택하지 않았다. Stepwise regression은 여러개의 독립변수를 수학적 알고리즘에 의하여 제거하거나 선택하여 최종 결과를 얻었다. 하지만 Hierarchical multiple regression은 여러개의 독립변수를 임으로적으로 차례로 더해가면서 regression한 결과를 비교하여 최종모델을 선택하는 것이다.

 

먼저 regression에 사용될 데이터파일을 http://dogmas.tistory.com/137에서 다운받아 SPSS에서 읽어들인다. CSV파일이므로 적절한 IMPORT과정을 거쳐야만 한다.

 

"Analyzie >> Regression >> Linear"를 선택하면 아래와 같은 대화창이 나타난다.

 

 

 Dependent에 FTW를 지정한 후에 Independent에 AP를 지정하고 Next버튼을 클릭한다.

 

 

BPD를 Independent로 지정한 후에 Next를 클릭한다.

이와같은 방법으로 순서에따라 MH, CP, MW를 independent에 각각 지정한 후에 OK를 클릭하면

AP --> BPD --> MH --> CP --> MW를 하나씩 더해감에따라 regression결과가 어떻게 달라지는지 SPSS에서 그 결과를 계산하여 출력해 준다.

 

 

 

Model Summary와 ANOVA table에서 모든 모델이 유의미하다고 볼수 있다.

하지만 coefficient의  significant를 보면 다르다는 것을 알수있다.

 

위 coefficient의 결과로부터 Model 3, 4, 5 모두의 경우에 있어서 은 MH가 significant하지 못하므로 Model2를 선택할 수 밖에 없다. 하지만 http://dogmas.tistory.com/138의 stepwise regression에서 보아 알수 있듯이 유의미한 독립변수는 AP, BPD, CP이다. 하지만 hierarchical regression은 변수를 선택하는 순서를 임으로 정하였으므로 유의미한 변수는 AP와 BPD밖에 선택되지 못함을 알수있다.

 

만약 위 5개의 변수를 stepwise regression을 사용하였다면 결과는 아래와 같았을 것이다.

 

즉, regression 모델로부터 MH는 제외되었다.

 

하지만 위 모든 결과에도 불구하고 가장 중요한 것은 독립변수가 종속변수에 실제적으로 영향을 미칠수 있는 인과관계가 있느냐는 점이다. 아무리 통계적으로 유의미한 결과를 얻었다고 할지라도 두 변수사이에 인과관계가 없으면 절대로 regression에 사용되어서는 안된다.

Comments