일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 선형회귀분석
- 통계
- 한서지리지
- 히스토그램
- 태그를 입력해 주세요.
- 통계학
- 창평
- repeated measures ANOVA
- 풍백
- 지리지
- linear regression
- 고구려
- ANOVA
- 단군
- categorical variable
- 유주
- 낙랑군
- post hoc test
- 기자조선
- 한서
- 신라
- 후한서
- 독사방여기요
- 패수
- spss
- 기자
- Histogram
- R
- t test
- 우분투
- Today
- Total
獨斷論
통계기초 정리 5. 가설검증 본문
3. One Sample Paired Means
신뢰구간 구하기
일반적으로 신뢰구간을 구하는 방법은 항상 같다.
$$\textrm{sample statistic} \pm \left( \textrm{multiplier} \right) \, \left( \textrm{standard error} \right) $$
Paired means의 신뢰구간을 구하기 위해서는 다음과 같이 구한다.
$$ CI = \bar{x}_d \pm t^* \left( \frac {s_d} {\sqrt{n}} \right) $$
예제)
100명의 학생을 샘플을 취하여 중간고사와 기말고사의 점수차이 평균이 4이고 표준편차가 6이었을때 95% 신뢰구간을 구하면
$x_d = 4$
$s_d = 6$
$n = 100$
$t^* = 1.984$
$CI = 4 \pm 1.984 * (6 / 10) = [2.810, 5.190] $
위 t*는 R에서 다음과 같이 구한다.
> qt(p=0.975, df=99, lower.tail=TRUE)
[1] 1.984217
가설검증
Paired means의 가설검증을 하기 위한 test statistic은 다음과 같다.
$$ t = \frac{ \bar{x}_d - \mu_0 } {s_d / \sqrt{n}} $$
여기서
$$\bar{x}_d = \frac {\sum{x_d}} {n}$$
$$s_d = \sqrt{\frac {\sum {\left( x_d - \bar{x}_d \right)^2}} {n-1} }$$
예제
모집단의 시험성적 차이가 정규분포를 따른다고 가정하고 9명의 샘플의 시험성적이 아래와 같을때
ID mid final
001 98 94
002 100 98
003 95 98
004 90 88
005 90 89
006 92 91
007 80 84
008 78 80
009 88 88
위 학생들의 중간고사와 기말고사의 성적차이가 존재하는지 구하여보자.
가설
$H_0 : \mu_d = 0$
$H_a : \mu_d \ne 0$
test statistic 구하기
ID mid final xd (xd - mu_d)^2
001 98 94 4 15.123
002 100 98 2 3.568
003 95 98 -3 9.680
004 90 88 2 3.568
005 90 89 1 0.790
006 92 91 1 0.790
007 80 84 -4 16.901
008 78 80 -2 4.457
009 88 88 0 0.012
합계 1 54.889
평균 1/9
$\bar{x}_d = 1/9$
$\bar{x}_d - \mu_0 = 1/9$
$s_d = \sqrt{ \frac {54.889}{(9-1)} } = 2.619$
$t = \frac {1/9 - 0} {2.619 / \sqrt{9}} = 0.127$
따라서 p-value를 구하면 약 0.902이다.
> 2 * pt(q=-0.127, df=8, lower.tail=TRUE)
[1] 0.9020745
R script로 편하게 구할수도 있다.
> x1 = c(98, 100, 95, 90, 90, 92, 80, 78, 88)
> x2 = c(94, 98, 98, 88, 89, 91, 84, 80, 88)
> t.test(x=x1, y=x2, alternative="two.sided", mu=0, paired=TRUE, var.equal=TRUE)
Paired t-test
data: x1 and x2
t = 0.12726, df = 8, p-value = 0.9019
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.902317 2.124539
sample estimates:
mean of the differences
0.1111111
p-value가 0.05보다 크므로 두 시험성적차이가 있다고 할만한 충분한 증거를 가지고 있지 못하다라고 결론내린다.
가설검증 요약