일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 신라
- 기자조선
- 창평
- 태그를 입력해 주세요.
- 한서
- 패수
- ANOVA
- 유주
- 풍백
- R
- 독사방여기요
- 낙랑군
- linear regression
- 우분투
- 단군
- repeated measures ANOVA
- 선형회귀분석
- 히스토그램
- 한서지리지
- categorical variable
- 후한서
- 지리지
- spss
- post hoc test
- 통계
- 고구려
- t test
- 기자
- 통계학
- Histogram
- Today
- Total
목록과학과 기술 (233)
獨斷論
전통적인 paramtric analysis의 일반적인 가정은 다음과 같다. random sampling 특정 observation의 종속변수 값이 다른 observation의 종속변수의 값에 영향을 받지 아니한다. 분산이 homogeneity를 가져야 한다. 대개의 경우 세번째 가정을 만족시키지 못하여 nonparametric analysis를 쓰는 경우가 많다. 통계 R은 ANOVA를 수행하기 위한 여러가지 함수를 제공하고 있는데 여기서는 가장 간단한 형태인 oneway.test()에 대해서 알아보기로 하자. 이 함수는 간단한 between subjects design에 사용된다. 사용방법은 다음과 같으며 R terminal에서 help(oneway.test)라고 치면 자세한 것을 볼수 있다. onew..
http://dogmas.tistory.com/186에서 사용된 데이터를 이용할 것이므로 데이터를 지웠다면 다시 수행해야 한다. t test의 가장 큰 문제는 데이터가 정규분포를 가지냐는 점이다. 정규분포의 제약이 없는 방법으로 Wilcoxon test가 있는데 dependent sample에서 어떻게 수행하는지 알아보자. 기본적인 문법은 아래와 같은데 wilcox.test(x, y = NULL, alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, exact = NULL, correct = TRUE, conf.int = FALSE, conf.level = 0.95, ...) Formula를 사용하지 않고 수행하려면 아래와 같이..
Dependent measures t test는 하나의 그룹의 측정값을 시간에 따라 측정했을때 얼마나 차이가 나는지 보는 것이며 repeated measures의 한 종류이다. 예를들어 식욕부진환자가 가족치료요법 전후로 몸무게가 어떻게 변화하였는지 본다면 dependent measures t test를 사용하여야만 할 것이다. 이를 R에서 수행해보자. R에는 많은 데이터베이스를 제공하는데 MASS 패키지에 anorexia가 식욕부진환자의 데이터이다. 이를 불러들이기 위하여 아래와 같이 수행한다. > data(anorexia, package="MASS") > anorexia Treat Prewt Postwt 1 Cont 80.7 80.2 2 Cont 89.4 80.1 3 Cont 91.8 86.4 4 Co..
지난시간에는 Independent samples t test를 R에서 어떻게 수행하는지 알아보았는데 이번에는 이에 대한 power analysis를 어떻게 수행하는지 알아보자. R 터미널에서 help(power.t.test)라고 치면 이에 대한 도움말을 볼수있으니 참고하도록 하자. 대개 아래와 같은데... power.t.test(n = NULL, delta = NULL, sd = 1, sig.level = 0.05, power = NULL, type = c("two.sample", "one.sample", "paired"), alternative = c("two.sided", "one.sided"), strict = FALSE) n은 샘플의 observation 갯수이고 delta는 비교하고자 하는 두 ..
서로 다른 두 그룹의 차이를 비교하는 것이 independent samples t test이다. 예를 들어 담배를 피는 사람들과 안피는 사람들 사이의 단기 기억력을 비교한다고 하자. 각각의 그룹에 대해서 단기간 기억력을 조사한 것을 각각의 변수에 저장하면 아래와 같다. > nonsmokers = c(18,22,21,17,20,17,23,20,22,21) > smokers = c(16,20,14,21,20,18,13,15,17,21) 대략의 결과를 예측해보려면 두 데이터에 대해서 boxplot을 그려보면 된다. > boxplot(nonsmokers,smokers,ylab="Scores on Digit Span Task", names=c("nonsmokers","smokers")) 그냥 한눈으로 봐도 두 평..
Student's t-test를 수행하는 통계R의 명령어는 t.test()이다. R console에서 help("t.test")라고 치면 이에 대한 설명을 볼수 있다. 우선 첨부된 파일을 내려받아 통계R에서 불러들인다. 첨부파일: 이제 위 데이터파일을 R에서 불러오는데 다음과 같이 하면 된다. > temp.dat = read.csv("bodyt_heartr.csv") > temp.dat > names(temp.dat) 위와같이 실행하면 temp.dat라는 변수에 csv의 파일에 있던 데이터가 들어가게 된다. 주의할점은 현재 디렉토리와 bodyt_heartr.csv가 있는 디렉토리가 같아야 하는데 현재 R의 작업디렉토리는 getwd()를 실행하면 얻을 수 있다. 작업디릭토리를 바꾸러면 setwd("c:/t..
R에서 간단한 linear regression을 수행하는 방법을 알아보자. 우선 종속변수를 y라 하고 독립변수를 x라 했을때 두 변수에 임의 값을 지정하자. > x = c(1.1, 2.5, 3.1, 4.9, 5.9, 8.1) > y = c(1.2, 6.4, 9.0, 23.5, 38, 61.1) 이 두 변수를 이용하여 linear regression을 수행하는 방법은 아주 간단하고 아래와 같다. > lm(y ~ x) Call: lm(formula = y ~ x) Coefficients: (Intercept) x -14.552 8.848 위 선형회귀분석의 결과를 저장하고자 한다면 아래와 같이 수행하면 된다. > lm.results = lm(y ~ x) > summary(lm.results) Call: lm(..
R에서 제공하는 상관관계(correlation)은 아래 세가지이다. Pearson's product moment correlation coefficient Kendall's tau rank correlation coefficient Spearman's rank correlation coefficient(Spearman's rho statistic) 위 세 가지 상관관계를 구하기 위해서 우선 변수 x와 y에 데이터를 입력한다. > x = rnorm(100, 50, 10) # 평균이 50이고 표준편차가 10인 100개의 정규분포를 갖는 난수발생 > y = rnorm(100, 75, 20) # 평균이 75리고 표준편차가 20인 100개의 정규분포를 갖는 난수발생 두 데이터를 한번 그래프로 나타내면 아래와 같다..