일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- t test
- 신라
- ANOVA
- 낙랑군
- post hoc test
- 태그를 입력해 주세요.
- 기자조선
- 후한서
- spss
- linear regression
- categorical variable
- 통계
- 유주
- 풍백
- 우분투
- 지리지
- 창평
- 한서
- 단군
- R
- 기자
- 독사방여기요
- 선형회귀분석
- Histogram
- 히스토그램
- 고구려
- 패수
- 한서지리지
- repeated measures ANOVA
- 통계학
- Today
- Total
獨斷論
통계 R 사용설명서 14 - 수학함수와 통계함수와 확률함수 본문
자주 사용하는 함수들을 정리해보았다.
수학함수
그냥 한번씩 R console에 입력해보면 뭔지 알것이다.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 |
> abs(-5.5) #절대값 |
통계함수
평균 중간값 표준편차 분산 합 최소 최대값 등등
별 설명도 필요 없음.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
> x <- 1:10 |
확률함수
확률함수는 앞에 d, p, q, r 등의 약자를 쓰고 뒤에 분포 이름이 붙는다.
- d는 density
- p는 distribution function (cummulative)
- q는 quantile function
- r은 random generation
들을 뜻한다.
즉, uniform distribution(unif)을 갖는 random generation(r)은 runif( )라고 한다.
dqpr을 제외한 distribution function의 이름들은 아래와 같다.
Distribution |
distribution function |
Distribution |
distribution function |
Beta |
beta |
Logistic |
logis |
Binomial |
binom |
Multinomial |
multinom |
Cauchy |
cauchy |
Negative binomial |
nbinom |
Chi-squared |
chisq |
Normal |
norm |
Exponential |
exp |
Poisson |
pois |
F |
f |
Wilcoxon Signed Rank |
signrank |
Gamma |
gamma |
T |
t |
Geometric |
geom |
Uniform |
unif |
Hypergeometric |
hyper |
Weibull |
weibull |
Lognormal |
lnorm |
Wilcoxon Rank Sum |
wilcox |
예를 들어 표준정규분포곡선을 그리고자한다면
1 2 3 |
> x <- seq(-3.5, 3.5, 0.1) |
와 같이 하면된다.
그래프는 다음과 같이 그려진다.
또한 다변수정규분포(multivariate normal distribution)를 갖는 데이터를 만들려면 MASS 패키지에 있는 mvrnorm( )을 이용한다.
사용방법은 아래와 같다.
mvrnorm(샘플크기, 평균, 분산-공분산행렬)
이제 위 함수를 이용하여 다변수정규분포를 갖는 데이터를 만들어보자.
우선 평균과 분산공분산행렬은 아래와 같다고 가정한다.
평균 |
99 |
40 |
3 |
분산공분산행렬 |
1266.2 583 -48 |
583 7896 -25 |
-48 -25 5 |
mvrnorm()을 이용하기 위해서는 MASS패키지를 맨먼저 불러와야한다. .
1 2 3 4 5 6 7 8 9 10 11 12 13 |
> library(MASS) |
생성된 데이터의 열에 변수명을 부여하려면 다음과 같이 하면 된다.
1 2 3 4 5 6 7 8 9 10 |
> mydat <- data.frame(mydat) |