獨斷論

확률이론 정리10. 카이제곱분포(Chi-Square Distribution) 본문

과학과 기술/통계이론설명

확률이론 정리10. 카이제곱분포(Chi-Square Distribution)

부르칸 2021. 11. 12. 08:20

카이제곱분포

감마분포에서 θ=2이고 α=r2이고 이때 r은 양의 정수라고 할때 확률밀도함수 f(x)는

f(x)=1Γ(r/2)2r/2xr/21ex/2

이고 이때 확률변수 X는 자유도가 r인 카이제곱분포를 따른다고 말한다. 주로 χ2(r)로 나타낸다.

 

평균과 분산

μ=E(X)=r

σ2=2r

 

Upper 100αth percentile

α를 0과 1 사이의 확률이라고 생각할때(위 감마분포의 α가 아님), 자유도가 r인 카이제곱 분포의 upper 100αth percentile은 χ2α(r)로 나타내고 이때 α의 값은 아래 그림의 파란색 면적에 해당한다.

즉,

α=P(Xχ2α(r))

 

100αth percentile

자유도가 r인 카이제곱분포의  100αth percentile은 χ21α(r)로 나타내고 이때 1α는 아래 그림의 파란색 면적과 같다

1α=P(Xχ21α(r)

 

예제

X가 자유도 10인 카이제곱분포를 따르는 확률변수라고 할때 upper 5th percentile을 구하면?

 

P(Xχ2(r))=0.05가 되는 χ2(r)를 구하는 문제이다.

> qchisq(p=0.05, df=10, lower.tail=FALSE)
[1] 18.30704

 

예제

X가 자유도 10인 카이제곱분포를 따르는 확률변수라고 할때 10th percentile을 구하면?

 

P(Xχ2(r))=0.10가 되는 χ2를 구하면 되므로

> qchisq(p=0.10, df=10, lower.tail=TRUE)
[1] 4.865182

 

예제

자유도가 10인 카이제곱 확률변수가 15.99보다 클 확률은

> pchisq(q=15.99, df=10, lower.tail=FALSE)
[1] 0.09991902