일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 패수
- 통계
- post hoc test
- 유주
- spss
- 독사방여기요
- 한서
- 창평
- 기자
- 고구려
- 신라
- 통계학
- t test
- categorical variable
- 지리지
- 단군
- 한서지리지
- 풍백
- 기자조선
- 우분투
- 후한서
- Histogram
- 낙랑군
- R
- 선형회귀분석
- repeated measures ANOVA
- ANOVA
- 태그를 입력해 주세요.
- linear regression
- 히스토그램
- Today
- Total
목록전체 글 (438)
獨斷論
기하분포(Geometric Distribution) 성공할 확률이 p이고 실패할 확률이 1−p인 시행에 있을때, X를 이 시행을 성공할때까지 수행한 횟수라고 하면 X의 probability mass function은 f(x)=P(X=x)=(1−p)x−1p 여기서 x=1,2,⋯ 이때 X를 기하분포를 따른다고 말한다. 누적분포함수 F(x)=P(X≤x)=1−(1−p)x 평균 μ=E(X)=1p 분산 σ2=1−pp2 예제1 국가평균으로 박사의 비율이 0.2라고 가정하고, 길거리에서 임으로 사람을 선택하여 최종학력을 물어왔을때, 4명을 만나야만 박사학..

이항확률변수 X의 p.m.f.는 f(x) = \dbinom{n}{x} \, p^x \, (1-p)^{n-x} 이고 아래와 같이 나타내기도 한다. X \sim b(n, p) 이산확률변수 X는 다음조건을 만족하면 이항확률변수가 된다. 실험이 똑같은 방법으로 n번 반복한다. 각각의 n개의 실험은 두개의 결과만 갖는다(성공 또는 실패). 이러한 실험을 Bernoulli trial이라고 한다. n개의 실험은 서로 독립이다. 두개의 결과중 성공할 확률이 p이면 실패할 확률은 1-p이다. 확률변수 X는 n번 실험에서 성공할 횟수이다. 표본크기 n이 모집단의 크기 N과 비슷하다면 Bernoulli trial의 확률 p가 변하므로 이항분포라고 말할수가 없다. 엄밀히 말하면 이는 hypergeometri..
확률변수 X의 적률생성함수 X가 이산확률변수이고 pmf가 f(x)이고 support가 S일때 M(t) = E( e^{tX} ) = \sum_{x \in S} e^{tx} f(x) 를 X의 적률생성함수라고 한다. 이때 t는 -h \lt t \lt h인 h가 존재해야만 한다. 예제 Binomial 확률변수의 적률생성함수 구하기 $\begin{align} M(t) &= E\left(e^{tx} \right)\\ &= \sum_{x=0}^n e^{tx} f(x) \\ &= \sum_{x=0}^n e^{tx} \dbinom{n}{x} p^x (1-p)^{(n-x)} \\ &= \sum_{x=0}^n \dbinom{n}{x} (p e^t )^x (1-p)^{(n-x)} \\ &= \left[ (1-p) ..

Probability Mass fucntion(p.m.f) 이산확률변수 X에 대하여 이산질량함수(probability mass function) P(X = x) = f(x)는 다음을 만족한다. P(X = x) = f(x) \gt 0 \sum\limits_{x \in S} f(x) = 1 P(X \in A) = \sum\limits_{x \in A} f(x) Cumulative distribution function(CDF) 확률변수 X의 누적분포함수는 다음과 같이 정의된다. F_X (t) = P(X \le t) CDF의 성질들 F_X (t)는 증가하는 함수이다. t의 범위는 -\infty \lt t \lt \infty 0 \le F_X (t) \le 1 확률변수 X..

예제 전등을 만드는 3개의 공장 A, B, C에서 결함이 있는 전등을 만들 확률이 아래와 같다고 가정하자. 임의로 선택한 전등이 결함이 있을때 ,공장 C에서 만들었을 확률은 얼마인가? 고장난 전등을 선택한 사건을 D라고 하면 위 문제는 P(C | D)를 구하면 된다. 베이즈 정리(Bayes' Theorem) m개의 사건 B1, B2, ..., Bm이 다음 두조건을 만족한다고 가정하자. Mutually exclusive B_i \cap B_j=\emptyset for i \ne j exhaustive \mathbf{S} = B_1 \cup B_2 \cup \cdots B_m 따라서 P(A)는 $\begin{align} P(A) &= P(A \cap B_1 ) + P(A \cap B_2 ) +..

모집단으로부터 표본을 취하여 모집단의 물리량을 추정한다. 표본공간(Sample space, outcome space), S) 모든 가능한 랜던샘플의 집합이다. "잠을 푹 잤는가?"라는 질문이라면 표본공간은 S= {yes, no} 질문이 하루에 잠을 몇시간 자는가라면 \textbf{S} = \left\{ h : h \ge 0 \right\} 한달에 여자들이 남자들보다 우는 날이 더 많은가라는 질문이라면 \textbf{S} = \left\{0, 1, 2, \cdots, 31 \right\} Events 무작위실험을 했을때 표본공간의 부분집합을 말한다. 주로 대문자 A, B, C 등으로 나타낸다. 무작위실험을 한번 했을때 나오는 결과는 outcome이라고 한다. $$A \subset \textbf{S}..

단순선형회귀모델 \hat{y} = b_0 + b_1 x 여기서 \hat{y} : y의 예측값 b_0 : y 절편 b_1 : 기울기 주로 사용되는 용어설명하면 Explanatory variable 독립변수 x를 지칭한다. predictor variable이라고도 부른다. Response variable 종속변수 y를 지칭한다. outcome variable이라고도 부른다. 잔차(Residual, e_i) 예측값과 측정값과의 차이를 말한다. e_i = y_i - \hat{y}_i Sum of squared residuals 위 잔차의 제곱의 합을 구하면 SSE = \sum_i { \left( y_i - \hat{y}_i \right)^2 } 단순선형회귀의 가정..