일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 지리지
- R
- 기자
- 선형회귀분석
- 낙랑군
- 한서
- 후한서
- 단군
- 한서지리지
- 창평
- ANOVA
- 고구려
- 풍백
- spss
- linear regression
- repeated measures ANOVA
- 독사방여기요
- 유주
- Histogram
- t test
- 태그를 입력해 주세요.
- 히스토그램
- post hoc test
- 신라
- 통계
- 기자조선
- 우분투
- 패수
- categorical variable
- 통계학
- Today
- Total
목록독단론 (438)
獨斷論
지난시간에는 Independent samples t test를 R에서 어떻게 수행하는지 알아보았는데 이번에는 이에 대한 power analysis를 어떻게 수행하는지 알아보자. R 터미널에서 help(power.t.test)라고 치면 이에 대한 도움말을 볼수있으니 참고하도록 하자. 대개 아래와 같은데... power.t.test(n = NULL, delta = NULL, sd = 1, sig.level = 0.05, power = NULL, type = c("two.sample", "one.sample", "paired"), alternative = c("two.sided", "one.sided"), strict = FALSE) n은 샘플의 observation 갯수이고 delta는 비교하고자 하는 두 ..
서로 다른 두 그룹의 차이를 비교하는 것이 independent samples t test이다. 예를 들어 담배를 피는 사람들과 안피는 사람들 사이의 단기 기억력을 비교한다고 하자. 각각의 그룹에 대해서 단기간 기억력을 조사한 것을 각각의 변수에 저장하면 아래와 같다. > nonsmokers = c(18,22,21,17,20,17,23,20,22,21) > smokers = c(16,20,14,21,20,18,13,15,17,21) 대략의 결과를 예측해보려면 두 데이터에 대해서 boxplot을 그려보면 된다. > boxplot(nonsmokers,smokers,ylab="Scores on Digit Span Task", names=c("nonsmokers","smokers")) 그냥 한눈으로 봐도 두 평..
Student's t-test를 수행하는 통계R의 명령어는 t.test()이다. R console에서 help("t.test")라고 치면 이에 대한 설명을 볼수 있다. 우선 첨부된 파일을 내려받아 통계R에서 불러들인다. 첨부파일: 이제 위 데이터파일을 R에서 불러오는데 다음과 같이 하면 된다. > temp.dat = read.csv("bodyt_heartr.csv") > temp.dat > names(temp.dat) 위와같이 실행하면 temp.dat라는 변수에 csv의 파일에 있던 데이터가 들어가게 된다. 주의할점은 현재 디렉토리와 bodyt_heartr.csv가 있는 디렉토리가 같아야 하는데 현재 R의 작업디렉토리는 getwd()를 실행하면 얻을 수 있다. 작업디릭토리를 바꾸러면 setwd("c:/t..
R에서 간단한 linear regression을 수행하는 방법을 알아보자. 우선 종속변수를 y라 하고 독립변수를 x라 했을때 두 변수에 임의 값을 지정하자. > x = c(1.1, 2.5, 3.1, 4.9, 5.9, 8.1) > y = c(1.2, 6.4, 9.0, 23.5, 38, 61.1) 이 두 변수를 이용하여 linear regression을 수행하는 방법은 아주 간단하고 아래와 같다. > lm(y ~ x) Call: lm(formula = y ~ x) Coefficients: (Intercept) x -14.552 8.848 위 선형회귀분석의 결과를 저장하고자 한다면 아래와 같이 수행하면 된다. > lm.results = lm(y ~ x) > summary(lm.results) Call: lm(..
R에서 제공하는 상관관계(correlation)은 아래 세가지이다. Pearson's product moment correlation coefficient Kendall's tau rank correlation coefficient Spearman's rank correlation coefficient(Spearman's rho statistic) 위 세 가지 상관관계를 구하기 위해서 우선 변수 x와 y에 데이터를 입력한다. > x = rnorm(100, 50, 10) # 평균이 50이고 표준편차가 10인 100개의 정규분포를 갖는 난수발생 > y = rnorm(100, 75, 20) # 평균이 75리고 표준편차가 20인 100개의 정규분포를 갖는 난수발생 두 데이터를 한번 그래프로 나타내면 아래와 같다..
R에서 ANOVA(analysis of variance, 분산분석)를 실행하기 위해 데이터를 아래와 같이 입력한다. > x1 = c(18, 25, 17, 20, 23) > x2 = c(20, 30, 22, 25, 28, 30) > x3 = c(35, 27, 27, 30, 40, 33) x1, x2, x3의 그룹변화에 따라 데이터가 얼마나 변화하는지 알아보는 것이다. 그러기 위해서는 x1, x2, x3의 데이터를 하나의 변수에 넣고 x1, x2, x3를 factor로 변환하여 ANOVA를 수행한다. > all.scores = c(x1, x2, x3) # 데이터를 합친다 > grp = c("x1", "x2", "x3") # 여기서 x1, x2, x3는 문자열로 group의 이름이다 > n = c(5, 6, ..
이제 t-test를 R에서 어떻게 실행하는지 알아보자. Simple t-test 가장 간단한 simple t-test를 수행해보자. 데이터는 아래와 같이 입력한다. > the.data = c(7, 7, 7, 5, 5, 4, 4, 4, 4, 4, 4, 4, 3, 3, 3, 3, 3, 2, 1) > the.data [1] 7 7 7 5 5 4 4 4 4 4 4 4 3 3 3 3 3 2 1 이제 위 the.data 평균값이 5와 얼마나 차이가 나는지 알아보려면 아래와 같이 t-test를 수행하면 된다. 아래 첫번째 수행은 평균값이 5와 같은지 다른지 알아보는 것이며 두번째 수행은 평균값이 5보다 큰지 알아보는 것이고 세번째 수행은 평균값이 5보다 작은지 알아보는 것이다. 95% 신뢰구간을 가정했을때 p-val..
앞서 했던 통계 R의 명령어 입문 (1) 의 데이터를 이용할 것이다. 기술통계(Descriptive statistics) 샘플의 크기(sample size)를 알려면 아래와 같이 한다. > length(my.dat) [1] 5 > length(hair.color) [1] 78 중간값(median) 또는 중앙값은 다음과 같이 구한다. > median(my.dat) [1] 30 평균값은 아래과 같이 구한다. > mean(my.dat) [1] 36.6 표준편차(standard deviation)은 아래와 같이 구한다. > sd(my.dat) [1] 37.2129 데이터에 대해서 정리한 것을 보려면 아래과 같이 한다. > summary(my.dat) Min. 1st Qu. Median Mean 3rd Qu. M..