일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- R
- 태그를 입력해 주세요.
- 유주
- 히스토그램
- 낙랑군
- 패수
- spss
- post hoc test
- 선형회귀분석
- 기자
- Histogram
- 한서지리지
- linear regression
- 기자조선
- 신라
- 창평
- 통계
- 통계학
- 지리지
- repeated measures ANOVA
- 우분투
- 독사방여기요
- 단군
- 고구려
- t test
- 풍백
- 후한서
- 한서
- categorical variable
- ANOVA
- Today
- Total
獨斷論
통계 R 사용설명서 13 - subset을 이용하여 열(변수)와 행(관측치) 선택 본문
데이터 행렬이나 데이터프레임에서 원하는 행과 열만 선택할때 subset()을 이용하면 편하다.
쓰는 방법은 아래와 같다.
subset(데이터변수, 행선택조건식, 열선택)
데이터 변수로는 행렬 벡터 데이터프레임 등이 사용될수 있고, 행선택조건식은 논리식을 사용하며, 열선택에는 select라는 옵션을 사용하게 된다.
어떻게 사용하는지 예를 들기위해 아래와 같은 데이터를 가정하고
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
> id <- c(1, 2, 3, 4, 5) |
이 중에서 여자이며 나이가 40인 사람만 선택하고
변수는 id, q1, q5만 선택하여 데이터를 다시 만들고싶다면 아래와 같이 한다.
1 2 3 4 5 |
> mydat_n1 <- subset(mydat, gender == "F" & age >= 40, select = c(id, q1, q5)) |
조심해야할 것은 조건식이 여러개일 경우에 이들을 쉼표로 구분하면 안되고 & 즉 AND나 | 즉 OR로 구분해야한다는 것이다. 위 스크립트에서는 AND를 사용하였고 OR를 사용하는 예를 들면 아래와 같다.
1 2 3 4 5 6 |
> mydat_n2 <- subset(mydat, gender == "F" | age >= 40, select = id:q5) |
select = id:q5를 사용하였기에 id에서 q5까지의 변수를 모두 선택하였다.