일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 유주
- linear regression
- 신라
- spss
- 후한서
- 독사방여기요
- 낙랑군
- 선형회귀분석
- 기자
- repeated measures ANOVA
- 고구려
- 히스토그램
- R
- 우분투
- 태그를 입력해 주세요.
- post hoc test
- 한서지리지
- 패수
- Histogram
- 지리지
- 창평
- ANOVA
- 한서
- 통계학
- 통계
- categorical variable
- 풍백
- 기자조선
- t test
- 단군
- Today
- Total
獨斷論
통계 R의 명령어 입문 (1) 본문
통계 R 설치하기
통계프로그램 R은 www.r-project.org에 가서 다운받아 설치하면 된다.
Windows용은 쉬우니 그냥 내려받아 두번클릭하면 프로그램 그룹에 R이 보인다.
R 프롬프트
이 프로그램은 인터프리터 방식과 비슷하여 ">" 같은 프롬프트를 갖는다.
프로그램을 중지하려면 다음과 같이 한다.
> quit()
변수에 데이터 입력
변수에 값을 입력하려면 c() 함수를 이용하면 되는데 벡터 데이터 형태를 갖는다.
변수명은 대소문자를 구분하니 조심하여야 한다.
> my.dat = c(30, 12, 34, 9, 10)
> my.dat
[1] 30 12 34 9 10
my.dat라는 벡터변수이며 첫번째 원소값이 30이고 두번째 원소값이 12이 된다.
이중 두번째 값을 바꿔보자.
> my.dat[2] = 100
> my.dat
[1] 30 100 34 9 10
간단한 Frequency distribution
다음과 같은 간단한 frequency distribution을 입력해보자.
X f
-----------
7 3
6 0
5 2
4 7
3 5
2 1
1 1
아래와 같이 R의 화면에 입력한다.
> X=7:1
> f = c(3, 0, 2, 7, 5, 1, 1)
> my.freq = rep(X,f)
> my.freq
[1] 7 7 7 5 5 4 4 4 4 4 4 4 3 3 3 3 3 2 1
7이 3개 만들어졌고 6은 0개, 5는 2개, 4는 7개, 3은 5개, 2는 1개, 1은 1개
히스토그램(histogram)
위에서 만든 데이터를 가지고 히스토그램을 그려보자
> hist(my.freq)
위와같이 입력하면 아래와 같은 히스토그램을 얻을 수 있다.
범주형 데이터(Categorical data)
머리색깔이 빨간색, 검은색, 갈색, 노란색인 사람이 각각 8, 22, 30, 18명이라고 가정하면 아래와 같이 입력할수 있다.
> colors=c("red", "black", "brown", "blonde")
> freqs = c(8, 22, 30, 18)
> hair.color = rep(colors, freqs)
> table(hair.color)
hair.color
black blonde brown red
22 18 30 8
이들을 그래프로 그려보자
> barplot(table(hair.color))
> barplot(table(hair.color), col=c("black", "yellow", "brown", "red"))
데이터합계
앞서 입력한 my.dat의 합을 구해보면
> my.dat
[1] 30 100 34 9 10
> sum(my.dat)
[1] 183
> sum(my.dat)^2
[1] 33489
> sum(my.dat^2)
[1] 12237
> my.dat^2
[1] 900 10000 1156 81 100
> x = c(2, 3, 5)
> y = c(3, 8, 9)
> x * y
[1] 6 24 45
> sum(x * y)
[1] 75