Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 통계학
- 기자
- Histogram
- 신라
- 태그를 입력해 주세요.
- 고구려
- t test
- 후한서
- 기자조선
- 지리지
- 우분투
- ANOVA
- 창평
- 풍백
- 유주
- repeated measures ANOVA
- 히스토그램
- post hoc test
- 낙랑군
- linear regression
- 단군
- categorical variable
- 한서
- 독사방여기요
- R
- 선형회귀분석
- spss
- 한서지리지
- 패수
- 통계
Archives
- Today
- Total
獨斷論
통계기초 정리 1 본문
1. Mean
- Population Mean
μ=∑xN
- Sample Mean
ˉx=∑xn
Median
중간에 있는 값
Mode
가장 많은 frequency를 갖는 값
Skew left

Skew right

2. Standard deviation
- Sample standard deviation
s=√∑(x−ˉx)2n−1
- Population standard deviation
σ=√∑(x−μ)2N
3. Empirical rule

정규분포 데이터의 95%는 평균의 2σ 범위 안에 들어온다.
4. z-score
표준정규분포를 따르는 데이터로 만들수는 있지만 항상 표준정규분포를 따르지는 않는다.
z=x−ˉxs
여기서
x= 데이터변수
ˉx= x의 평균
s= x의 표준편차
5. Five Number
- Minimum: 가장 작은 값을 의미하지만 보통 Q1−1.5×IQR 로 사용
- First quartile Q1: 25th percentile
- Median: Q2, 50th percentile
- Third quartile Q3: 75th percentile
- Maximum 가장 큰값을 의미하지만 보통 Q3+1.5×IQR
Minimum과 Maximum 밖의 값을 outlier이다.
Interquartile range
IQR=Q3−Q1
6. Box plot

가운데 네모로 된건 Q1에서 Q3의 값들이고 그 중간에 Median이다.
위아래 선으로 연결된것은 최대값과 최소값을 나타내고
별표는 Outlier이다.
7. Pearson's Correlation
rxy=∑(xi−ˉx)(yi−ˉy)√∑(xi−ˉx)2√∑(yi−ˉy)2
Properties
- −1≤r≤1
- r이 양수이면 x가 증가할때 y도 증가, r이 음수이면 x가 증가할때 y가 감소
r의 값 | |
0 ~ 0.2 | Very weak |
0.2 ~ 0.4 | Weak |
0.4 ~ 0.6 | Moderate |
0.6 ~ 0.8 | Strong |
0.8 ~ 1.0 | Very strong |
Outlier에 민감하게 변화한다.