일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- R
- 단군
- 독사방여기요
- 통계학
- 한서
- 신라
- 낙랑군
- 통계
- 히스토그램
- 후한서
- repeated measures ANOVA
- 고구려
- 선형회귀분석
- 우분투
- 태그를 입력해 주세요.
- 창평
- 한서지리지
- spss
- 기자조선
- 기자
- post hoc test
- 풍백
- categorical variable
- linear regression
- 패수
- t test
- ANOVA
- Histogram
- 지리지
- 유주
- Today
- Total
목록과학과 기술/R 통계 (70)
獨斷論
R에서 사용되는 데이터형으로는 벡터(vector), 행렬(matrix), 배열(array), 데이터프레임(data frame), 리스트(list), 인자(factor) 등이 있다. 스칼라라고 그냥 쓰이는 일반적인 하나의 숫자도 있기는 하지만 쉬운거니깐 생략,, a a b c d d [1] "1" "2" "one" > class(d) [1] "character" 위에서 보는 바와 같이 벡터 d는 문자벡터가 되어 1과 2는 더이상 숫자가 아니라 문자가 된다. 벡터 안에 각각의 값을 이용하려면 대괄호를 사용한다. 1 2 3 4 5 6 > a[3] > a[5] > asum asum > a[c(1, 3, 5)] > a[3:5] 2. 행렬, matrix 행렬 데이터 입력 데이터가 행과 열로 들어가 있는 것이다. 따..
GNU R을 가지고 뭔가 분석해보기전에 꼭 필요한 기본 명령어부터 정리해보자. 수동으로 데이터 입력 c()라는 함수를 이용한다. 1 2 > height age mean(age) > sd(age) > cor(age, height) > plot(age, height) R의 도움말 기능들 아래 명령어들을 하나씩 실행해보면 무엇이 다른지 알수 있다. 1 2 3 4 5 > help.start() > help("mean") > help.search("mean") > example("mean") > apropos("mean", mode="function") 1번째줄은 도움말 시작페이지로 이동하고, 2번째줄은 mean()에 대한 도움말을 보여주며, 3번째줄은 mean이 포함된 모든 함수의 도움말을 보여준다. 4번째줄은..
GNU R에서는 SPSS같은 메뉴방식의 소프트웨어와는 달리 데이터를 불러오는데 주의를 요한다. SPSS는 데이터를 불러오면서 각 단계마다 제대로 불러왔는지 확인할수있지만 R은 그렇지 못하다. R에서 텍스트 파일로 작성된 데이터 파일을 읽어들이기 전에 notepad같은 프로그램으로 열어서 다음 두 가지를 기억해 두어야 한다. 각 변수값들을 구별하는 문자는 무엇인가? 예를 들어 쉼표, 공백, 탭문자.. 데이터파일의 첫줄에 변수명이 들어가 있는가 없는가? 이는 R에서 header라고 명명할 것이다. 우선 아래 데이터 파일을 내려받아서 각자의 컴퓨터 하드디스크에 저장하자. 이때 저장한 디렉토리 경로명은 기억해두어야만 한다. 파일: 위 파일을 notepad같은 텍스트 편집기에서 열면 아래와 같은 형태이다. 첫줄은..
첫시간에는 무작정 따라하기부터 해보자. 1. R 설치 통계 GNU R을 설치하려면 https://cran.r-project.org/mirrors.html로 가서 자신이 사는 곳에 가까운 곳의 서버를 선택하여 설치하면 된다. 서울대 서버의 주소는 http://healthstat.snu.ac.kr/CRAN/이다. 리눅스와 OSX와 윈도우에서 모두 사용할수 있다. R은 한번 설치한 후에 새로운 업그레이드가 나와도 업그레이드 하는 기능이 없으므로 기존버전을 지우고 새로운 업그레이드 버전을 설치해야 한다. 2. 간단한 명령 따라해보기 윈도우의 경우에는 시작버튼을 누르고 R 메뉴에서 R-i386-3.x.x나 R-x64-3.x.x를 클릭하면 된다. 리눅스는 console에서 R이라고 입력하면 된다. OSX는 써본적이..
덧셈 뺄셈 등등 R MATLAB Description a b a > b 크다 a = b 크거나 같다l a != b a ~= b 같지 않다 루트와 로그 R MATLAB Description sqrt(a) sqrt(a) 루트, 제곱근 log(a) log(a) 자연로그 log10(a) log10(a) 상용로그 log2(a) log2(a) 밑이 2인 로그 exp(a) exp(a) 자연대수 e의 a제곱 또는 a승 Round off R MATLAB Description round(a) round(a) Round ceil(a) ceil(a) Round up floor(a) floor(a) Round down fix(a) Round towards zero 많이 사용하는 상수 R MATLAB Description pi ..
Data file을 통계 R에 어떻게 불러와야만 할까? SPSS같은것만 쓰다가 이런 명령어를 손으로 쳐야만 하는 프로그램을 쓰려면 힘든 것이 데이터 파일 불러오는 것이다. 다른 하급프로그램 언어와는 달리 통계 R은 데이터 파일을 불러 오는 것이 그렇게 어렵지 않다. 주로 사용하는 명령어는 아래와 같다. read.table(file_name, header = FALSE, sep = "", stringsAsFactors = system_default) read.csv(file_name, header = TRUE, sep = ",") # 이외에 여러가지 option arguments가 있지만 주로 많이 사용하는 것만 위에 표시하였다. 주로 read.table()과 read.csv()를 이용한다. read.ta..
R에서 사용되는 데이터 구조의 종류와 사용방법에 대해서 알아보자. 벡터Vector 벡터에 데이터를 입력하기 위해서는 c()라는 함수를 이용하는데 여기서 c는 concatenate의 약자이다. > a b c c벡터 각각의 원소는 아래와 같이 참조가 가능하다. > a[2] > a[c(1,3)] > a[3:5]위 R script의 첫번째 줄은 a의 두번째 원소값이고, 두번째 줄은 a의 1번째와 3번째 원소값이고 세번째 줄은 a의 3에서 5번째 원소값을 의미한다. 행렬matrix 행과 열로 이루어진 2차원 변수이다. 데이터 입력은 matrix()라는 함수를 이용한다. > y y [,1] [,2] [1,] 1 9 [2,] 3 11 [3,] 5 13 [4,] 7 15아무런 옵션이 주어지지 않는다면 열방향으로 데이터..
통계처리를 하기 위해 데이터를 모으다보면 missing value가 있는 subject 또는 observation이 있는 경우가 많다. 이를 해결하기 위해 가장많이 행하는 방법은 row-wise deletion 즉 어떤 변수에 결측값이 있기만 하면 그 행 전체를 버리는 것이다. SUBJECTS, x1, x2, y 1, 1, 34, 103 2, 3, NA, 54 3, 5, 54, NA 4, 7, 43, 49 만약 데이터가 위와 같다면 subjects 1과 4만 남기고 2와 3은 버린다. 이를 통계 R에서 complete.cases()라는 함수를 이용하면 쉽게 해결할수 있다. > x = c(1, 2, NA, 4, 5, 6) > y = c('a', 'b', 'c', NA, 'e', 'f') > mvindex ..