일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- repeated measures ANOVA
- 단군
- 선형회귀분석
- 패수
- R
- 지리지
- 히스토그램
- 우분투
- 고구려
- 태그를 입력해 주세요.
- t test
- 신라
- 창평
- 풍백
- 후한서
- 통계학
- 한서
- spss
- 기자조선
- Histogram
- 기자
- post hoc test
- ANOVA
- 한서지리지
- 낙랑군
- 독사방여기요
- linear regression
- 통계
- categorical variable
- 유주
- Today
- Total
獨斷論
확률이론 정리5. 이항분포(Binomial distribution) 본문
이항확률변수 X의 p.m.f.는
$$f(x) = \dbinom{n}{x} \, p^x \, (1-p)^{n-x}$$
이고 아래와 같이 나타내기도 한다.
$$X \sim b(n, p)$$
이산확률변수 X는 다음조건을 만족하면 이항확률변수가 된다.
- 실험이 똑같은 방법으로 n번 반복한다.
- 각각의 n개의 실험은 두개의 결과만 갖는다(성공 또는 실패). 이러한 실험을 Bernoulli trial이라고 한다.
- n개의 실험은 서로 독립이다.
- 두개의 결과중 성공할 확률이 p이면 실패할 확률은 $1-p$이다.
- 확률변수 X는 n번 실험에서 성공할 횟수이다.
표본크기 n이 모집단의 크기 N과 비슷하다면 Bernoulli trial의 확률 p가 변하므로 이항분포라고 말할수가 없다. 엄밀히 말하면 이는 hypergeometric distribution이다.
Cumulative Binomial Probabilities
다음 함수 F(x)를 누적분포함수(cumulative distribution function)이라고 부른다
$$F(x) = P(X \le x)$$
f(3)이라 하면 P(X=3)을 뜻하고 F(3)이라 하면 P(X <= 3)을 뜻한다.
예제 1
건강보험이 없는 사람들의 전체인구비율이 0.2라고 가정하자. 이때 임의로 15명을 선택했을때 보험이 없는 사람수를 X로 나타낼때 X의 확률분포를 구하면
$p=0.2$이고 n=15인 이항분포를 이룬다. 따라서
$$P(X=x) = \dbinom{15}{x}(0.2)^x (0.8)^{15-x}$$
예제2
위 예제1의 확률분포를 기준으로 하여 15명을 뽑았을때 많아야 1명이 보험을 없을 확률을 구하면
$\begin{align} P(X \le 1) &= P(X=0) + P(X=1) \end{align}$
R script로 위 확률을 구할수 있다.
> pbinom(q=1, size=15, prob=0.2)
[1] 0.1671258
예제 3
7명보다 많은 사람이 보험이 없을 확률은
$P(X \le 7)$를 구하면
> pbinom(q=7, size=15, prob=0.2)
[1] 0.9957603
따라서 7보다 많은 사람이 보험이 없을 확률은
> 1- pbinom(q=7, size=15, prob=0.2)
[1] 0.00423975
예제4
정확히 3명이 보험이 없을 확률은
$P(X = 3) = P(X \le 3) - P(X\le 2)$
> pbinom(q=3, size=15, prob=0.2) - pbinom(q=2, size=15, prob=0.2)
[1] 0.2501389
예제5
적어도 1명이 보험이 없을 확률은
$P(X \ge 1) = 1 - P(X \le 0)$을 구한다
> 1- pbinom(q=0, size=15, prob=0.2)
[1] 0.9648156
예제 6
보험이 없는 사람들이 5보다 작을 확률은
$P(X \lt 5) = P(X \le 4) $
> pbinom(q=4, size=15, prob=0.2)
[1] 0.8357663
평균
X가 이항분포를 따르는 확률변수일때 평균값은
$$\mu = n p $$
증명
분산
X가 이항분포를 따르는 확률변수일때 분산은
$$\sigma^2 = np \left( 1 - p \right)$$
증명
위 1), 2), 3)을 각각 구한다.
1)을 먼저 구하면
따라서
$\begin{align} \sigma^2 &= n(n-1)p^2 + np - n^2p^2 \\ &= n^2p^2 -np^2 + np - n^2p^2 \\ &= np(1-p)\end{align}$