일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 기자
- 단군
- 후한서
- 태그를 입력해 주세요.
- 독사방여기요
- 신라
- R
- linear regression
- ANOVA
- repeated measures ANOVA
- 우분투
- 선형회귀분석
- 패수
- 고구려
- spss
- 지리지
- Histogram
- t test
- 풍백
- 낙랑군
- 통계
- 유주
- categorical variable
- post hoc test
- 한서지리지
- 히스토그램
- 통계학
- 기자조선
- 한서
- 창평
- Today
- Total
목록과학과 기술/R 통계 (70)
獨斷論
R에서 제공하는 상관관계(correlation)은 아래 세가지이다. Pearson's product moment correlation coefficient Kendall's tau rank correlation coefficient Spearman's rank correlation coefficient(Spearman's rho statistic) 위 세 가지 상관관계를 구하기 위해서 우선 변수 x와 y에 데이터를 입력한다. > x = rnorm(100, 50, 10) # 평균이 50이고 표준편차가 10인 100개의 정규분포를 갖는 난수발생 > y = rnorm(100, 75, 20) # 평균이 75리고 표준편차가 20인 100개의 정규분포를 갖는 난수발생 두 데이터를 한번 그래프로 나타내면 아래와 같다..
R에서 ANOVA(analysis of variance, 분산분석)를 실행하기 위해 데이터를 아래와 같이 입력한다. > x1 = c(18, 25, 17, 20, 23) > x2 = c(20, 30, 22, 25, 28, 30) > x3 = c(35, 27, 27, 30, 40, 33) x1, x2, x3의 그룹변화에 따라 데이터가 얼마나 변화하는지 알아보는 것이다. 그러기 위해서는 x1, x2, x3의 데이터를 하나의 변수에 넣고 x1, x2, x3를 factor로 변환하여 ANOVA를 수행한다. > all.scores = c(x1, x2, x3) # 데이터를 합친다 > grp = c("x1", "x2", "x3") # 여기서 x1, x2, x3는 문자열로 group의 이름이다 > n = c(5, 6, ..
이제 t-test를 R에서 어떻게 실행하는지 알아보자. Simple t-test 가장 간단한 simple t-test를 수행해보자. 데이터는 아래와 같이 입력한다. > the.data = c(7, 7, 7, 5, 5, 4, 4, 4, 4, 4, 4, 4, 3, 3, 3, 3, 3, 2, 1) > the.data [1] 7 7 7 5 5 4 4 4 4 4 4 4 3 3 3 3 3 2 1 이제 위 the.data 평균값이 5와 얼마나 차이가 나는지 알아보려면 아래와 같이 t-test를 수행하면 된다. 아래 첫번째 수행은 평균값이 5와 같은지 다른지 알아보는 것이며 두번째 수행은 평균값이 5보다 큰지 알아보는 것이고 세번째 수행은 평균값이 5보다 작은지 알아보는 것이다. 95% 신뢰구간을 가정했을때 p-val..
앞서 했던 통계 R의 명령어 입문 (1) 의 데이터를 이용할 것이다. 기술통계(Descriptive statistics) 샘플의 크기(sample size)를 알려면 아래와 같이 한다. > length(my.dat) [1] 5 > length(hair.color) [1] 78 중간값(median) 또는 중앙값은 다음과 같이 구한다. > median(my.dat) [1] 30 평균값은 아래과 같이 구한다. > mean(my.dat) [1] 36.6 표준편차(standard deviation)은 아래와 같이 구한다. > sd(my.dat) [1] 37.2129 데이터에 대해서 정리한 것을 보려면 아래과 같이 한다. > summary(my.dat) Min. 1st Qu. Median Mean 3rd Qu. M..
통계 R 설치하기 통계프로그램 R은 www.r-project.org에 가서 다운받아 설치하면 된다. Windows용은 쉬우니 그냥 내려받아 두번클릭하면 프로그램 그룹에 R이 보인다. R 프롬프트 이 프로그램은 인터프리터 방식과 비슷하여 ">" 같은 프롬프트를 갖는다. 프로그램을 중지하려면 다음과 같이 한다. > quit() 변수에 데이터 입력 변수에 값을 입력하려면 c() 함수를 이용하면 되는데 벡터 데이터 형태를 갖는다. 변수명은 대소문자를 구분하니 조심하여야 한다. > my.dat = c(30, 12, 34, 9, 10) > my.dat [1] 30 12 34 9 10 my.dat라는 벡터변수이며 첫번째 원소값이 30이고 두번째 원소값이 12이 된다. 이중 두번째 값을 바꿔보자. > my.dat[2]..
통계프로그램 R은 윈도우(windows)와 리눅스(linux)에 설치할 수 있다. 1) 윈도우에 설치하는 방법 아주 쉽다. http://www.r-project.org/으로 이동하여 왼쪽 메뉴에 cran을 선택하면 오른쪽 화면에 여러 서버들이 나타난다. 그러면 자신이 위치한 곳에서 가장 가까운 서버의 주소를 클릭한다. Windows라고 되어 있는 곳을 선택하여 파일을 내려받아 설치하면 된다. 한국에서 제공하는 곳은 2곳인데 http://biostat.cau.ac.kr/CRAN/ http://cran.nexr.com/ 에 가서 내려받으면 된다. 2) 리눅스 서버에서 설치하는 방법 리눅스는 각자 배포판에 R을 제공한다. 우분투는 터미널에서 아래와 같이 하면 된다. sudo apt-get install bui..