Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 풍백
- R
- spss
- 지리지
- repeated measures ANOVA
- 기자조선
- 우분투
- 낙랑군
- Histogram
- 기자
- 단군
- 창평
- t test
- 한서지리지
- 한서
- 신라
- 고구려
- 통계
- 유주
- 태그를 입력해 주세요.
- linear regression
- 히스토그램
- 독사방여기요
- 후한서
- 통계학
- ANOVA
- categorical variable
- 선형회귀분석
- 패수
- post hoc test
Archives
- Today
- Total
獨斷論
Post Hoc 테스트 (통계 R 초급 - 8) 본문
ANOVA를 수행한 후에는 꼭 해야할 일이 post hoc 테스트인데 이것은 각 그룹들 사이에 어떤 한 쌍의 그룹이 가장 큰 차이를 보여주었는지를 알아보는 것이다.
앞서 ANOVA는 단지 p-value만 보여주어 샘플 데이터의 그룹 평균값의 차이가 통계적으로 의미있는지 없는지 찾아봤다면, post hoc 테스트는 그 의미있는 통계적 차이가 어떤 특정 그룹에 의해서 생겨났는지를 보는 것이라고 이해하면 된다. 수행방법은 아래와 같다.
> data(InsectSprays) # 데이터를 불러들인다
> aov.results = aov(count ~ spray, data=InsectSprays) # ANOVA 수행
> summary(aov.results) # 결과 출력
Df Sum Sq Mean Sq F value Pr(>F)
spray 5 2669 533.8 34.7 <2e-16 ***
Residuals 66 1015 15.4
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> TukeyHSD(aov.results) # Post Hoc test 수행
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = count ~ spray, data = InsectSprays)
$spray
diff lwr upr p adj
B-A 0.8333333 -3.866075 5.532742 0.9951810
C-A -12.4166667 -17.116075 -7.717258 0.0000000
D-A -9.5833333 -14.282742 -4.883925 0.0000014
E-A -11.0000000 -15.699409 -6.300591 0.0000000
F-A 2.1666667 -2.532742 6.866075 0.7542147
C-B -13.2500000 -17.949409 -8.550591 0.0000000
D-B -10.4166667 -15.116075 -5.717258 0.0000002
E-B -11.8333333 -16.532742 -7.133925 0.0000000
F-B 1.3333333 -3.366075 6.032742 0.9603075
D-C 2.8333333 -1.866075 7.532742 0.4920707
E-C 1.4166667 -3.282742 6.116075 0.9488669
F-C 14.5833333 9.883925 19.282742 0.0000000
E-D -1.4166667 -6.116075 3.282742 0.9488669
F-D 11.7500000 7.050591 16.449409 0.0000000
F-E 13.1666667 8.467258 17.866075 0.0000000
위 결과에서 볼수 있듯이 p-value가 가장 큰것으로 보아 A와 B는 차이가 가장 작으며 그 다음으로 F-B이다. 이는 앞서 그린 boxplot과 비교해보면 쉽게 이해할수있다.
기본적으로 신뢰구간을 95%로 계산을 핮만 이를 달리하려면 아래와 같이 수행하면 된다.
> TukeyHSD(aov.results, conf.level=0.9)
Comments