獨斷論

확률이론 정리5. 이항분포(Binomial distribution) 본문

과학과 기술/통계이론설명

확률이론 정리5. 이항분포(Binomial distribution)

부르칸 2021. 11. 5. 02:33

이항확률변수 X의 p.m.f.는

$$f(x) = \dbinom{n}{x} \, p^x \, (1-p)^{n-x}$$

이고 아래와 같이 나타내기도 한다.

$$X \sim b(n, p)$$

 

이산확률변수 X는 다음조건을 만족하면 이항확률변수가 된다.

  • 실험이 똑같은 방법으로 n번 반복한다.
  • 각각의 n개의 실험은 두개의 결과만 갖는다(성공 또는 실패). 이러한 실험을 Bernoulli trial이라고 한다.
  • n개의 실험은 서로 독립이다.
  • 두개의 결과중 성공할 확률이 p이면 실패할 확률은 $1-p$이다.
  • 확률변수 X는 n번 실험에서 성공할 횟수이다.

표본크기 n이 모집단의 크기 N과 비슷하다면 Bernoulli trial의 확률 p가 변하므로 이항분포라고 말할수가 없다. 엄밀히 말하면 이는 hypergeometric distribution이다.

 

Cumulative Binomial Probabilities

다음 함수 F(x)를 누적분포함수(cumulative distribution function)이라고 부른다

$$F(x) = P(X \le x)$$

f(3)이라 하면 P(X=3)을 뜻하고 F(3)이라 하면 P(X <= 3)을 뜻한다. 

 

예제 1

건강보험이 없는 사람들의 전체인구비율이 0.2라고 가정하자. 이때 임의로 15명을 선택했을때 보험이 없는 사람수를 X로 나타낼때 X의 확률분포를 구하면

$p=0.2$이고 n=15인 이항분포를 이룬다. 따라서

$$P(X=x) = \dbinom{15}{x}(0.2)^x (0.8)^{15-x}$$

 

예제2

위 예제1의 확률분포를 기준으로 하여 15명을 뽑았을때 많아야 1명이 보험을 없을 확률을 구하면

$\begin{align} P(X \le 1) &= P(X=0) + P(X=1) \end{align}$

R script로 위 확률을 구할수 있다.

> pbinom(q=1, size=15, prob=0.2)
[1] 0.1671258

 

예제 3

7명보다 많은 사람이 보험이 없을 확률은

$P(X \le 7)$를 구하면

> pbinom(q=7, size=15, prob=0.2)
[1] 0.9957603

따라서 7보다 많은 사람이 보험이 없을 확률은

> 1- pbinom(q=7, size=15, prob=0.2)
[1] 0.00423975

 

예제4

정확히 3명이 보험이 없을 확률은

$P(X = 3) = P(X \le 3) - P(X\le 2)$

> pbinom(q=3, size=15, prob=0.2) - pbinom(q=2, size=15, prob=0.2)
[1] 0.2501389

 

예제5

적어도 1명이 보험이 없을 확률은

$P(X \ge 1) = 1 - P(X \le 0)$을 구한다

> 1- pbinom(q=0, size=15, prob=0.2)
[1] 0.9648156

예제 6

보험이 없는 사람들이 5보다 작을 확률은

$P(X \lt 5) = P(X \le 4) $

> pbinom(q=4, size=15, prob=0.2)
[1] 0.8357663

 

평균

X가 이항분포를 따르는 확률변수일때 평균값은

$$\mu = n p $$

증명

 

분산

X가 이항분포를 따르는 확률변수일때 분산은

$$\sigma^2 = np \left( 1 - p \right)$$

증명

위 1), 2), 3)을 각각 구한다.

1)을 먼저 구하면

따라서

$\begin{align} \sigma^2 &= n(n-1)p^2 + np - n^2p^2 \\ &= n^2p^2 -np^2 + np - n^2p^2 \\ &= np(1-p)\end{align}$

 

Comments