獨斷論

Post Hoc 테스트 (통계 R 초급 - 8) 본문

과학과 기술/R 통계

Post Hoc 테스트 (통계 R 초급 - 8)

부르칸 2013. 8. 1. 21:20

ANOVA를 수행한 후에는 꼭 해야할 일이 post hoc 테스트인데 이것은 각 그룹들 사이에 어떤 한 쌍의 그룹이 가장 큰 차이를 보여주었는지를 알아보는 것이다. 

앞서 ANOVA는 단지 p-value만 보여주어 샘플 데이터의 그룹 평균값의 차이가 통계적으로 의미있는지 없는지 찾아봤다면, post hoc 테스트는 그 의미있는 통계적 차이가 어떤 특정 그룹에 의해서 생겨났는지를 보는 것이라고 이해하면 된다. 수행방법은 아래와 같다.

    > data(InsectSprays)                     # 데이터를 불러들인다

    > aov.results = aov(count ~ spray, data=InsectSprays)    # ANOVA 수행

    > summary(aov.results)                            # 결과 출력     

                Df Sum Sq Mean Sq F value Pr(>F)    

    spray        5   2669   533.8    34.7 <2e-16 ***

    Residuals   66   1015    15.4                   

    ---

    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    > TukeyHSD(aov.results)      # Post Hoc test 수행

      Tukey multiple comparisons of means

        95% family-wise confidence level


    Fit: aov(formula = count ~ spray, data = InsectSprays)


    $spray

               diff        lwr       upr     p adj

    B-A   0.8333333  -3.866075  5.532742 0.9951810

    C-A -12.4166667 -17.116075 -7.717258 0.0000000

    D-A  -9.5833333 -14.282742 -4.883925 0.0000014

    E-A -11.0000000 -15.699409 -6.300591 0.0000000

    F-A   2.1666667  -2.532742  6.866075 0.7542147

    C-B -13.2500000 -17.949409 -8.550591 0.0000000

    D-B -10.4166667 -15.116075 -5.717258 0.0000002

    E-B -11.8333333 -16.532742 -7.133925 0.0000000

    F-B   1.3333333  -3.366075  6.032742 0.9603075

    D-C   2.8333333  -1.866075  7.532742 0.4920707

    E-C   1.4166667  -3.282742  6.116075 0.9488669

    F-C  14.5833333   9.883925 19.282742 0.0000000

    E-D  -1.4166667  -6.116075  3.282742 0.9488669

    F-D  11.7500000   7.050591 16.449409 0.0000000

    F-E  13.1666667   8.467258 17.866075 0.0000000

위 결과에서 볼수 있듯이 p-value가 가장 큰것으로 보아 A와 B는 차이가 가장 작으며 그 다음으로 F-B이다. 이는 앞서 그린 boxplot과 비교해보면 쉽게 이해할수있다. 

기본적으로 신뢰구간을 95%로 계산을 핮만 이를 달리하려면 아래와 같이 수행하면 된다. 

> TukeyHSD(aov.results, conf.level=0.9)

 

 

 

Comments