獨斷論

통계 R 사용설명서 20 - 상관관계계수의 유의성 검정 본문

과학과 기술/R 통계

통계 R 사용설명서 20 - 상관관계계수의 유의성 검정

부르칸 2016. 6. 9. 00:21

http://dogmas.tistory.com/537 에서 설명한 상관계수 또는 상관관계계수의 유의성을 검정할 수도 있다.


사용함수는 cor.test이고 문법은 아래와 같다.

cor.test(x, y, alternative = c("two.sided", "less", "greater"), method = c("pearson", "kendall", "spearman"))

xy는 상관관계계수의 유의성을 검정하고자 하는 벡터이고

alternative에는 대립가설(alternative hypothesis)이 무엇이냐에 따라 "two.side" 또는 "less" 또는 "greater"를 사용한다. 보통 상관관계가 있는지 없는지 따지는 것이므로 "two.side"를 많이 사용한다. 아무것도 표시하지 않으면 two.side를 기본적으로 사용하게 되어 있다.

method는 상관관계를 구하는 방법을 무엇으로 할지 정하는 것인데, 아무것도 표시하지 않으면 pearson을 이용한다.

R에 내장되어 있는 state.x77 데이터를 이용하여 상관계수 유의성 검정을 해보자.  

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
 > x <- state.x77[, 3]
 > y <- state.x77[, 5]
 > plot(x,y)
 > cor.test(x, y)

        Pearson's product-moment correlation

 data:  x and y
 t = 6.8479, df = 48, p-value = 1.258e-08
 alternative hypothesis: true correlation is not equal to 0
 95 percent confidence interval:
  0.5279280 0.8207295
 sample estimates:
       cor
 0.7029752

1과 2번째 줄에서 xy에 각각 데이터를 넣고

3째 줄에서 두 데이터를 그래프로 그려봤다. 상관관계를 구하기 전에 그래프를 미리 그려보는 것이 결과를 이해하는데 도움이 되므로 항상 그림을 그려보는 습관을 기르는 것이 좋다.

4째 줄에서 상관관계계수의 유의성 검정을 실행하였다.
아무런 옵션도 넣지 않았으므로 alternative는 two.side이고 method는 pearson이다.

p-value가 거의 0에 가까우므로 귀무가설(null hypothesis)는 기각되고 대립가설(alternative hypothesis)인 두 변수의 상관관계가 0이 아님을 받아들일수 있다.

한꺼번에 여러개의 상관관계의 유의성검정을 실행할수도 있다. psych라는 패키지에 있는 corr.test인데 상관관계를 가지고 최종결론을 보는 것도 아니고 그냥 시험삼아 보는 경우가 많다. 이럴때는 변수 한개씩 한개씩 검토해 보는것이 데이터 전체를 이해하는데 도움이 되므로 별로 권장하지는 않는다.

Comments