獨斷論

z-transform을 이용하여 선형회귀분석의 공선성collinearity 문제 해결하기 (SPSS 사용설명서 18) 본문

과학과 기술/SPSS

z-transform을 이용하여 선형회귀분석의 공선성collinearity 문제 해결하기 (SPSS 사용설명서 18)

부르칸 2015. 3. 28. 00:44

SPSS 사용설명서 17에서 우리는 독립변수들간에 공선성 문제를 보았다.

이제 그 문제를 어떻게 해결하는지 알아보자. 


z-transform한 값으로 선형회귀분석 실행하기

공선성multicollinearity의 문제는 독립변수를 z-transform하여 선형회귀분석을 실행하면 그 문제를 해결할 수 있다.

선형회귀분석에 사용되었던 모든 독립변수를 z-transform하여 저장하여 보자.

Analyze > Descriptive Statistics > Descriptives...를 클릭한다. 



Variables에 변환하고자 하는 독립변수를 설정하고

아래에 Save standardized values as variables를 클릭한 후에

OK를 클릭하면 설정해두었던 변수들의 변수명에 "Z"가 붙어서 새로운 변수가 생성된다.


Analyze > Regression > Linear...를 클릭한다.



위와 같은 창이 뜨면 Independent에 있던 모든 변수를 다시 왼쪽으로 옮기고

새롭게 만든 Z로 시작하는 변수들을 모두 Independent로 설정하고 OK를 누른다.

Reset을 눌렀거나 앞선 사용설명서 17을 실행하고 파일을 닫았다가 다시 열었다면 Statistics를 클릭하여 Part and partial correlations와 Collinearity diagnostic을 클릭한다.

Continue를 누른 후에 OK를 누른다.


이제 공선성의 문제를 어느정도 해결했는지 알아보자.

우선 eigenvalue를 먼저보면(필요한 부분만 잘라냈다)



Condition index가 매우 좋아졌다.

z transform하지 않고 구하였을때에는 15나 30보다 큰 것들이 매우 많았지만

여기서는 모두 15보다 작다.


이제 coefficients table을 보자.


여전히 Zero-order correlation보다 partial 또는 part correlation 값이 매우 작은 것들이 보이며 VIF 값도 하나도 개선되지 않았다. 이는 z-transform이 변수간의 상관관계를 없애주지 못하기때문이다. 어떻게 하여야 할까?

이는 다음번 사용설명서에서 알아보기로 한다.



附: SPSS에서 선형회귀분석을 실행할때 독립변수를 정규분포를 갖도록 rescaling을 하지 않는 것으로 보인다. 왜냐하면 여기 독립변수를 z-transform하였을때 eigen value가 달라지는 것을 보면 알수있다. 만약 선형회귀분석을 하였는데 SPSS가 계산못하겠다고 나몰라라 자빠지면 독립변수를 z-transform해보기를 추천한다.


Comments