일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 히스토그램
- t test
- 지리지
- 고구려
- ANOVA
- 유주
- post hoc test
- 통계
- 기자조선
- 우분투
- 태그를 입력해 주세요.
- 창평
- repeated measures ANOVA
- 기자
- 한서지리지
- spss
- 단군
- linear regression
- 패수
- 풍백
- Histogram
- R
- 선형회귀분석
- 통계학
- 신라
- 한서
- 낙랑군
- 독사방여기요
- 후한서
- categorical variable
- Today
- Total
목록과학과 기술/R 통계 (70)
獨斷論
http://dogmas.tistory.com/190에서 one-way ANOVA를 수행하였는데 여기서는 이에 대한 power analysis를 수행하도록 하자. 기본적인 문법은 아래와 같다. 각 인자에 대한 설명은 help(power.anova.test)를 수행하면 자세하게 볼수있다. power.anova.test(groups = NULL, n = NULL, between.var = NULL, within.var = NULL, sig.level = 0.05, power = NULL) 가장 중요한 사항은 기본값이 NULL로 표시된 인자들 중에서 하나는 반드시 값이 계산되어지는 변수이어야만 한다는 것이다. 간단한 예를 들면. > power.anova.test(groups = 4, n = 5, between..
전통적인 paramtric analysis의 일반적인 가정은 다음과 같다. random sampling 특정 observation의 종속변수 값이 다른 observation의 종속변수의 값에 영향을 받지 아니한다. 분산이 homogeneity를 가져야 한다. 대개의 경우 세번째 가정을 만족시키지 못하여 nonparametric analysis를 쓰는 경우가 많다. 통계 R은 ANOVA를 수행하기 위한 여러가지 함수를 제공하고 있는데 여기서는 가장 간단한 형태인 oneway.test()에 대해서 알아보기로 하자. 이 함수는 간단한 between subjects design에 사용된다. 사용방법은 다음과 같으며 R terminal에서 help(oneway.test)라고 치면 자세한 것을 볼수 있다. onew..
http://dogmas.tistory.com/186에서 사용된 데이터를 이용할 것이므로 데이터를 지웠다면 다시 수행해야 한다. t test의 가장 큰 문제는 데이터가 정규분포를 가지냐는 점이다. 정규분포의 제약이 없는 방법으로 Wilcoxon test가 있는데 dependent sample에서 어떻게 수행하는지 알아보자. 기본적인 문법은 아래와 같은데 wilcox.test(x, y = NULL, alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, exact = NULL, correct = TRUE, conf.int = FALSE, conf.level = 0.95, ...) Formula를 사용하지 않고 수행하려면 아래와 같이..
Dependent measures t test는 하나의 그룹의 측정값을 시간에 따라 측정했을때 얼마나 차이가 나는지 보는 것이며 repeated measures의 한 종류이다. 예를들어 식욕부진환자가 가족치료요법 전후로 몸무게가 어떻게 변화하였는지 본다면 dependent measures t test를 사용하여야만 할 것이다. 이를 R에서 수행해보자. R에는 많은 데이터베이스를 제공하는데 MASS 패키지에 anorexia가 식욕부진환자의 데이터이다. 이를 불러들이기 위하여 아래와 같이 수행한다. > data(anorexia, package="MASS") > anorexia Treat Prewt Postwt 1 Cont 80.7 80.2 2 Cont 89.4 80.1 3 Cont 91.8 86.4 4 Co..
지난시간에는 Independent samples t test를 R에서 어떻게 수행하는지 알아보았는데 이번에는 이에 대한 power analysis를 어떻게 수행하는지 알아보자. R 터미널에서 help(power.t.test)라고 치면 이에 대한 도움말을 볼수있으니 참고하도록 하자. 대개 아래와 같은데... power.t.test(n = NULL, delta = NULL, sd = 1, sig.level = 0.05, power = NULL, type = c("two.sample", "one.sample", "paired"), alternative = c("two.sided", "one.sided"), strict = FALSE) n은 샘플의 observation 갯수이고 delta는 비교하고자 하는 두 ..
서로 다른 두 그룹의 차이를 비교하는 것이 independent samples t test이다. 예를 들어 담배를 피는 사람들과 안피는 사람들 사이의 단기 기억력을 비교한다고 하자. 각각의 그룹에 대해서 단기간 기억력을 조사한 것을 각각의 변수에 저장하면 아래와 같다. > nonsmokers = c(18,22,21,17,20,17,23,20,22,21) > smokers = c(16,20,14,21,20,18,13,15,17,21) 대략의 결과를 예측해보려면 두 데이터에 대해서 boxplot을 그려보면 된다. > boxplot(nonsmokers,smokers,ylab="Scores on Digit Span Task", names=c("nonsmokers","smokers")) 그냥 한눈으로 봐도 두 평..
Student's t-test를 수행하는 통계R의 명령어는 t.test()이다. R console에서 help("t.test")라고 치면 이에 대한 설명을 볼수 있다. 우선 첨부된 파일을 내려받아 통계R에서 불러들인다. 첨부파일: 이제 위 데이터파일을 R에서 불러오는데 다음과 같이 하면 된다. > temp.dat = read.csv("bodyt_heartr.csv") > temp.dat > names(temp.dat) 위와같이 실행하면 temp.dat라는 변수에 csv의 파일에 있던 데이터가 들어가게 된다. 주의할점은 현재 디렉토리와 bodyt_heartr.csv가 있는 디렉토리가 같아야 하는데 현재 R의 작업디렉토리는 getwd()를 실행하면 얻을 수 있다. 작업디릭토리를 바꾸러면 setwd("c:/t..
R에서 간단한 linear regression을 수행하는 방법을 알아보자. 우선 종속변수를 y라 하고 독립변수를 x라 했을때 두 변수에 임의 값을 지정하자. > x = c(1.1, 2.5, 3.1, 4.9, 5.9, 8.1) > y = c(1.2, 6.4, 9.0, 23.5, 38, 61.1) 이 두 변수를 이용하여 linear regression을 수행하는 방법은 아주 간단하고 아래와 같다. > lm(y ~ x) Call: lm(formula = y ~ x) Coefficients: (Intercept) x -14.552 8.848 위 선형회귀분석의 결과를 저장하고자 한다면 아래와 같이 수행하면 된다. > lm.results = lm(y ~ x) > summary(lm.results) Call: lm(..