獨斷論

베이즈 확률표 Bayesian probability table - 5 본문

과학과 기술/통계이론설명

베이즈 확률표 Bayesian probability table - 5

부르칸 2021. 9. 5. 04:19

Likelihood가 평균이 $\mu$이고 분산이 $\sigma^2$인 정규분포를 따른다면

$$ p(y | \mu) \propto e^{-\frac{1}{2 \sigma^2} (y - \mu)^2} $$

인데 여기서 중요한점은 $y$는 측정값으로 고정되어 있고 $\mu$가 가능한 모든 값에서 변한다는 것이다.

Prior는 2.0, 2.5, 3.0, 3.5, 4.0의 값만 가질수 있고 각각의 확률이 모두 0.2라고 가정한다.

실험으로부터 얻어진 $y| \mu$는 평균이 $\mu$이고 표준편차가 $\sigma = 1$인 정규분포를 따르는데 얻어진 $y$값은 3.2라고 가정할때 베이즈 표(Bayesian table)을 만들어 보자.

 $\mu$  Prior  Likelihood  Prior x Likelihood  Posterior
 2
 2.5
 3
 3.5
 4
 0.2
 0.2
 0.2
 0.2
 0.2
     
         

 

위 표에서 likelihood를 구하면

$\mu=2.0$일때 $e^{-\frac{(3.2-2.0)^2}{2}} = 0.4868$

$\mu=2.5$일때 $e^{-\frac{(3.2-2.5)^2}{2}} = 0.7827$

$\mu=3.5$일때 $e^{-\frac{(3.2-3.0)^2}{2}} = 0.9802$

$\mu=3.5$일때 $e^{-\frac{(3.2-3.5)^2}{2}} = 0.9560$

$\mu=4.5$일때 $e^{-\frac{(3.2-4.0)^2}{2}} = 0.7261$

이다.

 

표를 채우면

 $\mu$  Prior  Likelihood  Prior x Likelihood  Posterior
 2
 2.5
 3
 3.5
 4
 0.2
 0.2
 0.2
 0.2
 0.2
 0.4868
 0.7827
 0.9820
 0.9560
 0.7261
 0.0974
 0.1565
 0.1960
 0.1912
 0.1452
 0.1239
 0.1990
 0.2493
 0.2432
 0.1846
 Sum      0.7863  1.0000

 

위 표에서 Posterior는 Prior x Likelihood를 sum값으로 나눈 것이다.

 

Likelihood를 R함수를 이용하여 구할수도 있다.

> dnorm(x = 2, mean = 3.2, sd = 1)
[1] 0.1941861

> dnorm(x = 2.5, mean = 3.2, sd = 1)
[1] 0.3122539

> dnorm(x = 3, mean = 3.2, sd = 1)
[1] 0.3910427

> dnorm(x = 3.5, mean = 3.2, sd = 1)
[1] 0.3813878

> dnorm(x = 4, mean = 3.2, sd = 1)
[1] 0.2896916

이 값을 이용하여 likelihood를 채우고 posterior를 구하면 아래와 같다.

 $\mu$  Prior  Likelihood  Prior x Likelihood  Posterior
 2
 2.5
 3
 3.5
 4
 0.2
 0.2
 0.2
 0.2
 0.2
 0.1942
 0.3123
 0.3910
 0.3814
 0.2897
 0.0388
 0.0625
 0.0782
 0.0763
 0.0579
 0.1239
 0.1990
 0.2493
 0.2432
 0.1846
 Sum      0.3137  1.0000

 

이를 R을 이용하면 아래와 같다(결과가 약간 다른데 위 표는 소수점 4째자리까지만 계산했기때문이다). 아래 theta는 위 표에서 $\mu$이다.

> prob = 0.2
> theta = seq(from=2, to=4, by=0.5)
> theta
[1] 2.0 2.5 3.0 3.5 4.0

> prior = rep(prob, 5)
> prior
[1] 0.2 0.2 0.2 0.2 0.2

> likelihood = dnorm(theta, mean=3.2, sd=1)
> likelihood
[1] 0.1941861 0.3122539 0.3910427 0.3813878 0.2896916

> h = prior * likelihood
> posterior = h / sum(h)
> posterior
[1] 0.1237988 0.1990702 0.2493001 0.2431449 0.1846861
Comments