일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 히스토그램
- spss
- 한서
- 후한서
- 선형회귀분석
- 우분투
- 단군
- 유주
- 통계학
- 풍백
- 창평
- post hoc test
- R
- 낙랑군
- linear regression
- Histogram
- t test
- 태그를 입력해 주세요.
- 고구려
- 지리지
- 패수
- repeated measures ANOVA
- categorical variable
- 신라
- 기자
- 통계
- 기자조선
- 한서지리지
- ANOVA
- 독사방여기요
- Today
- Total
獨斷論
베이즈 확률표 Bayesian probability table - 5 본문
Likelihood가 평균이 $\mu$이고 분산이 $\sigma^2$인 정규분포를 따른다면
$$ p(y | \mu) \propto e^{-\frac{1}{2 \sigma^2} (y - \mu)^2} $$
인데 여기서 중요한점은 $y$는 측정값으로 고정되어 있고 $\mu$가 가능한 모든 값에서 변한다는 것이다.
Prior는 2.0, 2.5, 3.0, 3.5, 4.0의 값만 가질수 있고 각각의 확률이 모두 0.2라고 가정한다.
실험으로부터 얻어진 $y| \mu$는 평균이 $\mu$이고 표준편차가 $\sigma = 1$인 정규분포를 따르는데 얻어진 $y$값은 3.2라고 가정할때 베이즈 표(Bayesian table)을 만들어 보자.
$\mu$ | Prior | Likelihood | Prior x Likelihood | Posterior |
2 2.5 3 3.5 4 |
0.2 0.2 0.2 0.2 0.2 |
|||
위 표에서 likelihood를 구하면
$\mu=2.0$일때 $e^{-\frac{(3.2-2.0)^2}{2}} = 0.4868$
$\mu=2.5$일때 $e^{-\frac{(3.2-2.5)^2}{2}} = 0.7827$
$\mu=3.5$일때 $e^{-\frac{(3.2-3.0)^2}{2}} = 0.9802$
$\mu=3.5$일때 $e^{-\frac{(3.2-3.5)^2}{2}} = 0.9560$
$\mu=4.5$일때 $e^{-\frac{(3.2-4.0)^2}{2}} = 0.7261$
이다.
표를 채우면
$\mu$ | Prior | Likelihood | Prior x Likelihood | Posterior |
2 2.5 3 3.5 4 |
0.2 0.2 0.2 0.2 0.2 |
0.4868 0.7827 0.9820 0.9560 0.7261 |
0.0974 0.1565 0.1960 0.1912 0.1452 |
0.1239 0.1990 0.2493 0.2432 0.1846 |
Sum | 0.7863 | 1.0000 |
위 표에서 Posterior는 Prior x Likelihood를 sum값으로 나눈 것이다.
Likelihood를 R함수를 이용하여 구할수도 있다.
> dnorm(x = 2, mean = 3.2, sd = 1)
[1] 0.1941861
> dnorm(x = 2.5, mean = 3.2, sd = 1)
[1] 0.3122539
> dnorm(x = 3, mean = 3.2, sd = 1)
[1] 0.3910427
> dnorm(x = 3.5, mean = 3.2, sd = 1)
[1] 0.3813878
> dnorm(x = 4, mean = 3.2, sd = 1)
[1] 0.2896916
이 값을 이용하여 likelihood를 채우고 posterior를 구하면 아래와 같다.
$\mu$ | Prior | Likelihood | Prior x Likelihood | Posterior |
2 2.5 3 3.5 4 |
0.2 0.2 0.2 0.2 0.2 |
0.1942 0.3123 0.3910 0.3814 0.2897 |
0.0388 0.0625 0.0782 0.0763 0.0579 |
0.1239 0.1990 0.2493 0.2432 0.1846 |
Sum | 0.3137 | 1.0000 |
이를 R을 이용하면 아래와 같다(결과가 약간 다른데 위 표는 소수점 4째자리까지만 계산했기때문이다). 아래 theta는 위 표에서 $\mu$이다.
> prob = 0.2
> theta = seq(from=2, to=4, by=0.5)
> theta
[1] 2.0 2.5 3.0 3.5 4.0
> prior = rep(prob, 5)
> prior
[1] 0.2 0.2 0.2 0.2 0.2
> likelihood = dnorm(theta, mean=3.2, sd=1)
> likelihood
[1] 0.1941861 0.3122539 0.3910427 0.3813878 0.2896916
> h = prior * likelihood
> posterior = h / sum(h)
> posterior
[1] 0.1237988 0.1990702 0.2493001 0.2431449 0.1846861