일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- Histogram
- 고구려
- 우분투
- 한서지리지
- ANOVA
- 통계학
- post hoc test
- categorical variable
- R
- 낙랑군
- 패수
- t test
- linear regression
- 히스토그램
- 선형회귀분석
- 지리지
- 한서
- repeated measures ANOVA
- 창평
- spss
- 후한서
- 신라
- 풍백
- 독사방여기요
- 태그를 입력해 주세요.
- 기자조선
- 기자
- 유주
- 통계
- 단군
- Today
- Total
목록과학과 기술/통계이론설명 (31)
獨斷論
카이제곱분포 감마분포에서 $\theta=2$이고 $\alpha= \dfrac{r}{2}$이고 이때 $r$은 양의 정수라고 할때 확률밀도함수 f(x)는 $$f(x)=\dfrac{1}{\Gamma (r/2) 2^{r/2}}x^{r/2-1}e^{-x/2}$$ 이고 이때 확률변수 $X$는 자유도가 $r$인 카이제곱분포를 따른다고 말한다. 주로 $\chi^2 (r)$로 나타낸다. 평균과 분산 $$\mu = E(X) = r$$ $$\sigma^2 = 2r$$ Upper 100$\alpha^{th}$ percentile $\alpha$를 0과 1 사이의 확률이라고 생각할때(위 감마분포의 $\alpha$가 아님), 자유도가 r인 카이제곱 분포의 upper 100$\alpha^{th}$ percentile은 $\chi^..
일정한 시간(또는 거리 구간 같은 물리량)에서 사건이 $X$번 일어날 확률은 포아송분포로 나타낼수 있고 사건이 일어나는 비율 $\lambda$는 일정해야만 한다. $$f(x)=\dfrac{e^{-\lambda} \lambda^x}{x!}$$ 포아송분포와 같은 사건에 대하여 첫번째 사건이 일어나는데 걸리는 시간(또는 구간)을 확률변수 $W$라 하면, 이때 확률변수 $W$는 지수분포를 따른다. $$f(w)=\dfrac{1}{\theta} e^{-w/\theta}$$ 여기서 $\theta = \dfrac {1}{\lambda}$ 이제 $\alpha$번째 사건이 일어나는데 걸리는 시간을 확률변수 $W$로 나타내면 이 확률변수 $W$는 다음과 같은 확률분포를 따른다 $$f(w)=\dfrac{1}{(\alpha-1..
$X$가 포아송 확률변수이고 일정가간동안 은행에 도착하는 손님수라고 가정하자. 이때 $\lambda$를 일정기간( 또는 1기간)동안 도착하는 평균 손님수라고 하면 처음으로 손님이 도착하는데 걸리는 시간을 확률변수 $W$로 나타내면, 첫번째 손님이 도착하는데 걸리는 평균시간, $\theta$는 $1 / \lambda$와 같다. $$\theta = \frac {1}{\lambda}$$ 이때 첫번째 손님이 도착하는게 걸리는 시간은 지수분포(exponential distribution)를 따른다. 지수분포 $X$가 지수분포를 따르는 확률변수일때 확률밀도함수는 다음과 같다 $$f(x) = \frac {1}{\theta} e^{-x / \theta}$$ 여기서 $\theta \gt 0$이고 $x \ge 0$이다. ..
포아송 분포 $X$가 포아송 확률변수일때 p.m.f.는 다음과 같다. $$f(x) = \frac {e^{-\lambda} \lambda^x} {x !}$$ 여기서 $x = 0, 1, 2, \cdots$이고 $\lambda >0$ 평균과 분산 $E(X) = \lambda$ $\sigma^2 = \lambda$ 예제 $X$가 인쇄된 책 1쪽당 발생할 인쇄오류갯수라고 할때, 이 책에서 임으로 1쪽을 선택할때 적어도 1개 이상의 인쇄오류가 발생할 확률은? $\lambda = 3$ 적어도 한개이상 오류가 발생할 확률은 $P(X \ge\ 1) = 1 - P(X = 0)$이므로 $\begin{align} P(X \ge 1) &= 1 - \frac {e^{-3} 3^{0}} {0!} \\ &= 1 - e^{-3} \\..
기하분포(Geometric Distribution) 성공할 확률이 $p$이고 실패할 확률이 $1-p$인 시행에 있을때, $X$를 이 시행을 성공할때까지 수행한 횟수라고 하면 $X$의 probability mass function은 $$f(x)=P(X=x)=(1-p)^{x-1}p$$ 여기서 $x=1,2, \cdots $ 이때 X를 기하분포를 따른다고 말한다. 누적분포함수 $$F(x) = P(X \le x) = 1 - \left(1-p \right)^x$$ 평균 $$\mu = E(X) = \frac {1}{p}$$ 분산 $$\sigma^2 = \frac{1-p}{p^2}$$ 예제1 국가평균으로 박사의 비율이 0.2라고 가정하고, 길거리에서 임으로 사람을 선택하여 최종학력을 물어왔을때, 4명을 만나야만 박사학..
이항확률변수 X의 p.m.f.는 $$f(x) = \dbinom{n}{x} \, p^x \, (1-p)^{n-x}$$ 이고 아래와 같이 나타내기도 한다. $$X \sim b(n, p)$$ 이산확률변수 X는 다음조건을 만족하면 이항확률변수가 된다. 실험이 똑같은 방법으로 n번 반복한다. 각각의 n개의 실험은 두개의 결과만 갖는다(성공 또는 실패). 이러한 실험을 Bernoulli trial이라고 한다. n개의 실험은 서로 독립이다. 두개의 결과중 성공할 확률이 p이면 실패할 확률은 $1-p$이다. 확률변수 X는 n번 실험에서 성공할 횟수이다. 표본크기 n이 모집단의 크기 N과 비슷하다면 Bernoulli trial의 확률 p가 변하므로 이항분포라고 말할수가 없다. 엄밀히 말하면 이는 hypergeometri..
확률변수 X의 적률생성함수 X가 이산확률변수이고 pmf가 f(x)이고 support가 S일때 $$M(t) = E( e^{tX} ) = \sum_{x \in S} e^{tx} f(x)$$ 를 X의 적률생성함수라고 한다. 이때 t는 $-h \lt t \lt h$인 h가 존재해야만 한다. 예제 Binomial 확률변수의 적률생성함수 구하기 $\begin{align} M(t) &= E\left(e^{tx} \right)\\ &= \sum_{x=0}^n e^{tx} f(x) \\ &= \sum_{x=0}^n e^{tx} \dbinom{n}{x} p^x (1-p)^{(n-x)} \\ &= \sum_{x=0}^n \dbinom{n}{x} (p e^t )^x (1-p)^{(n-x)} \\ &= \left[ (1-p) ..
Probability Mass fucntion(p.m.f) 이산확률변수 $X$에 대하여 이산질량함수(probability mass function) $P(X = x) = f(x)$는 다음을 만족한다. $P(X = x) = f(x) \gt 0$ $\sum\limits_{x \in S} f(x) = 1$ $P(X \in A) = \sum\limits_{x \in A} f(x)$ Cumulative distribution function(CDF) 확률변수 $X$의 누적분포함수는 다음과 같이 정의된다. $$F_X (t) = P(X \le t)$$ CDF의 성질들 $F_X (t)$는 증가하는 함수이다. t의 범위는 $-\infty \lt t \lt \infty$ $0 \le F_X (t) \le 1$ 확률변수 X..