일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 독사방여기요
- 태그를 입력해 주세요.
- 통계
- 후한서
- linear regression
- 단군
- 기자조선
- 고구려
- 선형회귀분석
- 지리지
- R
- 신라
- 히스토그램
- post hoc test
- 한서지리지
- ANOVA
- 낙랑군
- repeated measures ANOVA
- 풍백
- categorical variable
- 기자
- 유주
- t test
- Histogram
- spss
- 우분투
- 한서
- 통계학
- 창평
- 패수
- Today
- Total
목록과학과 기술 (233)
獨斷論

Pearson's correlation 모집단의 상관관계는 rho로 나타내고 샘플의 상관관계는 r로 나타낸다. 두 샘플 x와 y에 대한 상관관계를 구하려면 r=1n−1∑(x−ˉxsx)(y−ˉysy) 여기서 sx는 샘플 x의 표준편차이고 sy는 샘플 y의 표준편차이다. ˉx는 샘플 x의 평균이다. 이제 두 샘플의 상관관계를 구해보자 데이터 exam.df = read.csv("d:/tmp/exam.csv", header = TRUE) x = exam.dfQuizAveragey=exam.dfFinal mean_x = ..
어떤 사건이 시간당 발생할 속도(비율)이 평균적으로 이미 알려져 있고 이 값을 r라고 가정하자. 즉 일정시간 N당 이 사건이 k번 일어난다고 이미 알려져 있다면 r=k/N이다. 이때 이 사건이 t라는 시간동안 x번 일어날 확률을 구하면 이는 Poisson distribution에 해당되며 아래와 같이 구한다. Pr(x)=(rt)xe−rtx! 여기서 rt를 λ로 주로 나타내고 rate parameter라고도 부른다. Probability mass function을 λ와 같이 나타내면 f(x;λ)=Pr(X=x)=λxe−λx! ..

SAS 라이브러리 파일을 받아서 원하는 디렉토리에 저장한다. 일원빈도표(one-way frequency table) libname icdb 'd:\tmp'; proc freq data=icdb.back; tables sex race; run; 위 SAS 코드를 실행하면 sex와 race 두 범주형변수에 대하여 일원빈도표(일원도수표)를 만든다. tables sex와 race를 넣지 않으면 모든변수에 대하여 도수표를 만들게 된다. 범주형변수의 각 수준(level)에 대하여 빈도표를 만들려면 proc sort를 수행한 후에 proc freq 안에 by 문장을 넣어서 SAS 코드를 수행하면 된다. proc sort data=icdb.back out=s_back; by sex; run; proc freq data..

4. Two Independent Proportions 신뢰구간 신뢰구간을 구하는 일반적인 형태는 항상 같다. sample statistic±(multiplier) (standard error) np≥10이고 n(1−p)≥10이면 정규분포로 근사할수 있고, 독립된 샘플이 2개일때 신뢰구간은 아래와 같이 구한다. standard error만 독립된 2개의 샘플에 맞게 고쳐주면 된다. (ˆp1−ˆp2)±z∗√ˆp1(1−ˆp1)n1+ˆp2(1−ˆp2)n2 예제) 동성간..

3. One Sample Paired Means 신뢰구간 구하기 일반적으로 신뢰구간을 구하는 방법은 항상 같다. sample statistic±(multiplier)(standard error) Paired means의 신뢰구간을 구하기 위해서는 다음과 같이 구한다. CI=ˉxd±t∗(sd√n) 예제) 100명의 학생을 샘플을 취하여 중간고사와 기말고사의 점수차이 평균이 4이고 표준편차가 6이었을때 95% 신뢰구간을 구하면 xd=4 sd=6 n=100 $t^* = 1.984..

신뢰구간 일반적인 형태 sample statistic±(multiplier)(standard error) 여기서 (multiplier) x (standard error)를 margin of error라고도 한다. 검정통계량 일반적인 test statistic=sample statistic−null parameterstandard error 1. One Sample Proportion 신뢰구간 구하기 샘플의 비율 ˆp=Xn이라고 할때 nˆp≥10이고 $n(1-\hat{p}) \ge ..
신뢰구간 Population의 parameter는 보통 알수없는 값이므로 일정한 신뢰수준(confidence level, 1−α)으로 원하는 sample statistic의 영역을 구하는데 이를 신뢰구간이라고 한다. 95%의 신뢰수준으로 신뢰구간을 구하고자 한다면 (Sample statistic)±2(standard error) 가 된다. p-value p-value>α이면 H0를 기각하지 못한다. 그러나 이것이 H0가 사실이라는 말은 아니고 H0가 거짓이라고 할만한 충분한 증거가 있지 못하다는 의미이다. p-value≤α이면 H0를 기각하고 H1은 통계적으로 유의미하다고 말..

X가 연속인 확률변수이고 누적분포함수(cumulative distribution function, CDF)가 FX(x)일때 Y=FX(X)로 정의되는 확률변수 Y는 (0, 1) 사이의 균일분포를 따른다. X가 정규분포를 따른다고 할때 정규분포를 갖는 난수 10 000개를 생성하고 이 난수 10 000개에 대한 누적정규분포함수값을 구하면 이 10 000개의 누적정규분포함수값들은 0과 1사이의 균일분포를 따른다는 말이다. # 1만개의 정규분포를 따르는 난수 발생 x