통계기초 정리 5. 가설검증

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

獨斷論

통계기초 정리 5. 가설검증 본문

과학과 기술/통계이론설명

통계기초 정리 5. 가설검증

부르칸 2021. 9. 30. 03:58

3. One Sample Paired Means

신뢰구간 구하기

일반적으로 신뢰구간을 구하는 방법은 항상 같다.

$\textrm{sample statistic} \pm \left( \textrm{multiplier} \right) \, \left( \textrm{standard error} \right)$

Paired means의 신뢰구간을 구하기 위해서는 다음과 같이 구한다.

$CI = \bar{x}_d \pm t^* \left( \frac {s_d} {\sqrt{n}} \right)$

예제)

100명의 학생을 샘플을 취하여 중간고사와 기말고사의 점수차이 평균이 4이고 표준편차가 6이었을때 95% 신뢰구간을 구하면

$x_d = 4$

$s_d = 6$

$n = 100$

$t^* = 1.984$

$CI = 4 \pm 1.984 * (6 / 10) = [2.810, 5.190]$

위 t*는 R에서 다음과 같이 구한다.

> qt(p=0.975, df=99, lower.tail=TRUE)
[1] 1.984217

가설검증

Paired means의 가설검증을 하기 위한 test statistic은 다음과 같다.

$t = \frac{ \bar{x}_d - \mu_0 } {s_d / \sqrt{n}}$

여기서

$\bar{x}_d = \frac {\sum{x_d}} {n}$

$s_d = \sqrt{\frac {\sum {\left( x_d - \bar{x}_d \right)^2}} {n-1} }$

예제

모집단의 시험성적 차이가 정규분포를 따른다고 가정하고 9명의 샘플의 시험성적이 아래와 같을때

ID      mid     final
001 	98      94
002 	100     98
003 	95      98
004 	90      88
005 	90      89
006 	92      91
007 	80      84
008 	78      80
009 	88      88

위 학생들의 중간고사와 기말고사의 성적차이가 존재하는지 구하여보자.

가설

$H_0 : \mu_d = 0$

$H_a : \mu_d \ne 0$

test statistic 구하기

ID      mid     final   xd    (xd - mu_d)^2
001 	98      94      4        15.123  
002 	100     98      2        3.568 
003 	95      98     -3        9.680 
004 	90      88      2        3.568
005 	90      89      1        0.790 
006 	92      91      1        0.790
007 	80      84     -4        16.901
008 	78      80     -2        4.457
009 	88      88      0        0.012 
합계                     1       54.889
평균                   1/9

$\bar{x}_d = 1/9$

$\bar{x}_d - \mu_0 = 1/9$

$s_d = \sqrt{ \frac {54.889}{(9-1)} } = 2.619$

$t = \frac {1/9 - 0} {2.619 / \sqrt{9}} = 0.127$

따라서 p-value를 구하면 약 0.902이다.

> 2 * pt(q=-0.127, df=8, lower.tail=TRUE)
[1] 0.9020745

R script로 편하게 구할수도 있다.

> x1 = c(98, 100, 95, 90, 90, 92, 80, 78, 88)
> x2 = c(94, 98, 98, 88, 89, 91, 84, 80, 88)
> t.test(x=x1, y=x2, alternative="two.sided", mu=0, paired=TRUE, var.equal=TRUE)

        Paired t-test

data:  x1 and x2
t = 0.12726, df = 8, p-value = 0.9019
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -1.902317  2.124539
sample estimates:
mean of the differences 
              0.1111111

p-value가 0.05보다 크므로 두 시험성적차이가 있다고 할만한 충분한 증거를 가지고 있지 못하다라고 결론내린다.

가설검증 요약