일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 후한서
- 통계학
- t test
- 선형회귀분석
- 태그를 입력해 주세요.
- Histogram
- 기자
- post hoc test
- ANOVA
- 낙랑군
- 기자조선
- 독사방여기요
- 신라
- 유주
- 고구려
- repeated measures ANOVA
- 우분투
- spss
- 패수
- 단군
- categorical variable
- 풍백
- 지리지
- 한서
- 히스토그램
- R
- 창평
- 통계
- linear regression
- 한서지리지
- Today
- Total
목록R (8)
獨斷論
무료 통계프로그램 R에서 사용할수 있는 GUI 중에 사용하기 좋은것이 RStudio말고 하나 더 있다. 주로 리눅스 KDE용으로 개발된 Rkward인데 이제 이것을 windows에서도 사용할수 있다. 사용방법은 간단. 아래 링크로 이동한 후에 최신버전 bundle로 다운받는다. http://sourceforge.net/projects/rkwardextras/files/Windows/ 현재 2013년 11월 8일 최신버전은 0.6.1 self-extracting파일로 되어 있으므로 실행시키면 프로그램 압축이 저절로 풀린다. 재밌는건 bundle이다보니 설치도 필요 없고 R 프로그램까지 같이 딸려 온다는거... 그러니깐 설치가 아니라 하드디스크에 그냥 복사해서 쓰는거다. 다운받은걸 실행하면 아래같이 뜨는데 ..
http://dogmas.tistory.com/186에서 사용된 데이터를 이용할 것이므로 데이터를 지웠다면 다시 수행해야 한다. t test의 가장 큰 문제는 데이터가 정규분포를 가지냐는 점이다. 정규분포의 제약이 없는 방법으로 Wilcoxon test가 있는데 dependent sample에서 어떻게 수행하는지 알아보자. 기본적인 문법은 아래와 같은데 wilcox.test(x, y = NULL, alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, exact = NULL, correct = TRUE, conf.int = FALSE, conf.level = 0.95, ...) Formula를 사용하지 않고 수행하려면 아래와 같이..
Dependent measures t test는 하나의 그룹의 측정값을 시간에 따라 측정했을때 얼마나 차이가 나는지 보는 것이며 repeated measures의 한 종류이다. 예를들어 식욕부진환자가 가족치료요법 전후로 몸무게가 어떻게 변화하였는지 본다면 dependent measures t test를 사용하여야만 할 것이다. 이를 R에서 수행해보자. R에는 많은 데이터베이스를 제공하는데 MASS 패키지에 anorexia가 식욕부진환자의 데이터이다. 이를 불러들이기 위하여 아래와 같이 수행한다. > data(anorexia, package="MASS") > anorexia Treat Prewt Postwt 1 Cont 80.7 80.2 2 Cont 89.4 80.1 3 Cont 91.8 86.4 4 Co..
Student's t-test를 수행하는 통계R의 명령어는 t.test()이다. R console에서 help("t.test")라고 치면 이에 대한 설명을 볼수 있다. 우선 첨부된 파일을 내려받아 통계R에서 불러들인다. 첨부파일: 이제 위 데이터파일을 R에서 불러오는데 다음과 같이 하면 된다. > temp.dat = read.csv("bodyt_heartr.csv") > temp.dat > names(temp.dat) 위와같이 실행하면 temp.dat라는 변수에 csv의 파일에 있던 데이터가 들어가게 된다. 주의할점은 현재 디렉토리와 bodyt_heartr.csv가 있는 디렉토리가 같아야 하는데 현재 R의 작업디렉토리는 getwd()를 실행하면 얻을 수 있다. 작업디릭토리를 바꾸러면 setwd("c:/t..
R에서 간단한 linear regression을 수행하는 방법을 알아보자. 우선 종속변수를 y라 하고 독립변수를 x라 했을때 두 변수에 임의 값을 지정하자. > x = c(1.1, 2.5, 3.1, 4.9, 5.9, 8.1) > y = c(1.2, 6.4, 9.0, 23.5, 38, 61.1) 이 두 변수를 이용하여 linear regression을 수행하는 방법은 아주 간단하고 아래와 같다. > lm(y ~ x) Call: lm(formula = y ~ x) Coefficients: (Intercept) x -14.552 8.848 위 선형회귀분석의 결과를 저장하고자 한다면 아래와 같이 수행하면 된다. > lm.results = lm(y ~ x) > summary(lm.results) Call: lm(..
R에서 ANOVA(analysis of variance, 분산분석)를 실행하기 위해 데이터를 아래와 같이 입력한다. > x1 = c(18, 25, 17, 20, 23) > x2 = c(20, 30, 22, 25, 28, 30) > x3 = c(35, 27, 27, 30, 40, 33) x1, x2, x3의 그룹변화에 따라 데이터가 얼마나 변화하는지 알아보는 것이다. 그러기 위해서는 x1, x2, x3의 데이터를 하나의 변수에 넣고 x1, x2, x3를 factor로 변환하여 ANOVA를 수행한다. > all.scores = c(x1, x2, x3) # 데이터를 합친다 > grp = c("x1", "x2", "x3") # 여기서 x1, x2, x3는 문자열로 group의 이름이다 > n = c(5, 6, ..
통계 R 설치하기 통계프로그램 R은 www.r-project.org에 가서 다운받아 설치하면 된다. Windows용은 쉬우니 그냥 내려받아 두번클릭하면 프로그램 그룹에 R이 보인다. R 프롬프트 이 프로그램은 인터프리터 방식과 비슷하여 ">" 같은 프롬프트를 갖는다. 프로그램을 중지하려면 다음과 같이 한다. > quit() 변수에 데이터 입력 변수에 값을 입력하려면 c() 함수를 이용하면 되는데 벡터 데이터 형태를 갖는다. 변수명은 대소문자를 구분하니 조심하여야 한다. > my.dat = c(30, 12, 34, 9, 10) > my.dat [1] 30 12 34 9 10 my.dat라는 벡터변수이며 첫번째 원소값이 30이고 두번째 원소값이 12이 된다. 이중 두번째 값을 바꿔보자. > my.dat[2]..
통계프로그램 R은 윈도우(windows)와 리눅스(linux)에 설치할 수 있다. 1) 윈도우에 설치하는 방법 아주 쉽다. http://www.r-project.org/으로 이동하여 왼쪽 메뉴에 cran을 선택하면 오른쪽 화면에 여러 서버들이 나타난다. 그러면 자신이 위치한 곳에서 가장 가까운 서버의 주소를 클릭한다. Windows라고 되어 있는 곳을 선택하여 파일을 내려받아 설치하면 된다. 한국에서 제공하는 곳은 2곳인데 http://biostat.cau.ac.kr/CRAN/ http://cran.nexr.com/ 에 가서 내려받으면 된다. 2) 리눅스 서버에서 설치하는 방법 리눅스는 각자 배포판에 R을 제공한다. 우분투는 터미널에서 아래와 같이 하면 된다. sudo apt-get install bui..