獨斷論

통계 R의 명령어 입문 (1) 본문

과학과 기술/R 통계

통계 R의 명령어 입문 (1)

부르칸 2013. 6. 12. 14:57

통계 R 설치하기

통계프로그램 R은 www.r-project.org에 가서 다운받아 설치하면 된다.

Windows용은 쉬우니 그냥 내려받아 두번클릭하면 프로그램 그룹에 R이 보인다.

 

R 프롬프트

이 프로그램은 인터프리터 방식과 비슷하여 ">" 같은 프롬프트를 갖는다.

프로그램을 중지하려면 다음과 같이 한다.

> quit()

 

변수에 데이터 입력

변수에 값을 입력하려면 c() 함수를 이용하면 되는데 벡터 데이터 형태를 갖는다.

변수명은 대소문자를 구분하니 조심하여야 한다.

> my.dat = c(30, 12, 34, 9, 10)
> my.dat
[1] 30 12 34  9 10

my.dat라는 벡터변수이며 첫번째 원소값이 30이고 두번째 원소값이 12이 된다.

이중 두번째 값을 바꿔보자.

> my.dat[2] = 100
> my.dat
[1]  30 100  34   9  10

 

간단한 Frequency distribution

다음과 같은 간단한 frequency distribution을 입력해보자.

      X     f
    -----------
      7     3
      6     0
      5     2
      4     7
      3     5
      2     1
      1     1

아래와 같이 R의 화면에 입력한다.

> X=7:1
> f = c(3, 0, 2, 7, 5, 1, 1)
> my.freq = rep(X,f)
> my.freq
 [1] 7 7 7 5 5 4 4 4 4 4 4 4 3 3 3 3 3 2 1

7이 3개 만들어졌고 6은 0개, 5는 2개, 4는 7개, 3은 5개, 2는 1개, 1은 1개

 

 

히스토그램(histogram)

위에서 만든 데이터를 가지고 히스토그램을 그려보자

> hist(my.freq)

 위와같이 입력하면 아래와 같은 히스토그램을 얻을 수 있다.

범주형 데이터(Categorical data)

머리색깔이 빨간색, 검은색, 갈색, 노란색인 사람이 각각 8, 22, 30, 18명이라고 가정하면 아래와 같이 입력할수 있다.

> colors=c("red", "black", "brown", "blonde")
> freqs = c(8, 22, 30, 18)
> hair.color = rep(colors, freqs)
> table(hair.color)
hair.color
 black blonde  brown    red
    22     18     30      8

이들을 그래프로 그려보자

> barplot(table(hair.color))
> barplot(table(hair.color), col=c("black", "yellow", "brown", "red"))

 

데이터합계

앞서 입력한 my.dat의 합을 구해보면

> my.dat
[1]  30 100  34   9  10
> sum(my.dat)
[1] 183
> sum(my.dat)^2
[1] 33489
> sum(my.dat^2)
[1] 12237
> my.dat^2
[1]   900 10000  1156    81   100
> x = c(2, 3, 5)
> y = c(3, 8, 9)
> x * y
[1]  6 24 45
> sum(x * y)
[1] 75

 

 

Comments