일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 창평
- 태그를 입력해 주세요.
- 단군
- 풍백
- 히스토그램
- 후한서
- 신라
- 한서지리지
- spss
- t test
- 지리지
- 독사방여기요
- 통계학
- 기자조선
- post hoc test
- 고구려
- Histogram
- 한서
- ANOVA
- 통계
- 우분투
- 패수
- linear regression
- 선형회귀분석
- repeated measures ANOVA
- 기자
- 유주
- R
- 낙랑군
- categorical variable
- Today
- Total
목록독단론 (438)
獨斷論
R에서 사용되는 산술연산자와 논리연산자이다.특별한 예제가 필요없고 그냥 외우면 된다. 산술연산자 연산자 + 더하기 - 빼기 * 곱하기 / 나누기 ^ 또는 ** 거듭제곱 x %% y x를 y로 나눈 나머지 값 x %/% y 정수형 나눗셈. 7 %/% 3 하면 2가 나온다. 논리 연산자 연산자 = ~보다 크거나 같은 == 같은 != 같지 않은 !x x가 아닌 x | y x OR y x & y x AND Y isTRUE(x) x가 참인지 거짓인지 확인
data frame에 새로운 변수 만들어 넣기 데이터 형 가운데 data frame이 있다는건 앞서 다뤘고 여기서는 data frame안에 변수를 하나 더 만드는 방법을 알아보자. 만드는 방법은 그냥 연산을 해서 새로운 변수에 그 연산값을 입력하면 된다. 예를 들어 mydat1이라는 data frame에 이미 x1과 x2라는 변수가 존재할때 이들 두 값의 평균과 합을 새로운 변수로 만든다고 가정하면 아래와 같이 실행하면 된다. > x1 x2 mydat1 mydat1$ssum mydat1$mmean mydat1 x1 x2 ssum mmean 1 1 5 6 3 2 2 6 8 4 3 3 7 10 5 4 4 8 12 6 1과 2번 줄에서 x1과 x2에 값을 넣고 3번 줄에 이들 두 변수를 mydat1이라는 da..
R에서 그릴수 있는 간단한 그래프를 그리는 방법을 알아보자 산점도(scatter plot)과 선형회귀선 일단 아래 명령줄을 실행한다. 1 2 3 4 5 6 > str(cars) > attach(cars) > plot(speed, dist) > abline(lm(dist ~ speed)) > title("Regression of car speed and stopping distance") > detach(cars) cars라는 데이터는 내장된 것으로 자동차의 정지거리와 속도와의 관계를 나타낸 것이다. 3째 줄에서 cars$speed를 X축, cars$dist를 Y축으로 하여 산점도를 그렸다. 4번째 줄에서 dist = a * speed + b의 형식으로 하는 선형회귀선을 그렸다. 주의할 것은 plot에서 ..
A5 즉 피아노 가운데 음의 '라'를 440Hz로 할때 (현대 음악)악 음표별 주파수와 파장 피아노 가운데 도, 그러니깐 악보에서 밑에 줄 하나 더 긋고 걸쳐놓은 '도'가 C4 음임 NoteFrequency (Hz)Wavelength (cm) C0 16.35 2109.89 C#0/Db0 17.32 1991.47 D0 18.35 1879.69 D#0/Eb0 19.45 1774.20 E0 20.60 1674.62 F0 21.83 1580.63 F#0/Gb0 23.12 1491.91 G0 24.50 1408.18 G#0/Ab0 25.96 1329.14 A0 27.50 1254.55 A#0/Bb0 29.14 1184.13 B0 30.87 1117.67 C1 32.70 1054.94 C#1/Db1 34.65 99..
앞서 벡터 행렬 배열을 했고 여기서는 좀더 복잡한 data frame과 리스트와 인자에 대해서 알아보자. 1. 데이터프레임형 변수, data frame 데이터프레임의 데이터 입력 행렬과 배열은 같은 형태의 데이터만 들어갈수있지만 data frame은 다른 종류의 데이터가 들어갈수 있다는 점이 다르다. 예를 들어 대학 졸업생들의 현재 취업과 사는 곳과 나이를 조사했다고 가정한다면 다음과 같은 형태의 데이터가 존재하게 된다. ID age location company 1 30 Seoul Samsung 2 24 Pusan Baeksu 3 28 Daejon LG 4 29 Yosu LG 5 27 Ulsan Hyundai 이제 위 데이터를 R에서 입력하면 다음과 같이 할수 있다. 1 2 3 4 5 6 7 8 9 1..
R에서 사용되는 데이터형으로는 벡터(vector), 행렬(matrix), 배열(array), 데이터프레임(data frame), 리스트(list), 인자(factor) 등이 있다. 스칼라라고 그냥 쓰이는 일반적인 하나의 숫자도 있기는 하지만 쉬운거니깐 생략,, a a b c d d [1] "1" "2" "one" > class(d) [1] "character" 위에서 보는 바와 같이 벡터 d는 문자벡터가 되어 1과 2는 더이상 숫자가 아니라 문자가 된다. 벡터 안에 각각의 값을 이용하려면 대괄호를 사용한다. 1 2 3 4 5 6 > a[3] > a[5] > asum asum > a[c(1, 3, 5)] > a[3:5] 2. 행렬, matrix 행렬 데이터 입력 데이터가 행과 열로 들어가 있는 것이다. 따..
GNU R을 가지고 뭔가 분석해보기전에 꼭 필요한 기본 명령어부터 정리해보자. 수동으로 데이터 입력 c()라는 함수를 이용한다. 1 2 > height age mean(age) > sd(age) > cor(age, height) > plot(age, height) R의 도움말 기능들 아래 명령어들을 하나씩 실행해보면 무엇이 다른지 알수 있다. 1 2 3 4 5 > help.start() > help("mean") > help.search("mean") > example("mean") > apropos("mean", mode="function") 1번째줄은 도움말 시작페이지로 이동하고, 2번째줄은 mean()에 대한 도움말을 보여주며, 3번째줄은 mean이 포함된 모든 함수의 도움말을 보여준다. 4번째줄은..
GNU R에서는 SPSS같은 메뉴방식의 소프트웨어와는 달리 데이터를 불러오는데 주의를 요한다. SPSS는 데이터를 불러오면서 각 단계마다 제대로 불러왔는지 확인할수있지만 R은 그렇지 못하다. R에서 텍스트 파일로 작성된 데이터 파일을 읽어들이기 전에 notepad같은 프로그램으로 열어서 다음 두 가지를 기억해 두어야 한다. 각 변수값들을 구별하는 문자는 무엇인가? 예를 들어 쉼표, 공백, 탭문자.. 데이터파일의 첫줄에 변수명이 들어가 있는가 없는가? 이는 R에서 header라고 명명할 것이다. 우선 아래 데이터 파일을 내려받아서 각자의 컴퓨터 하드디스크에 저장하자. 이때 저장한 디렉토리 경로명은 기억해두어야만 한다. 파일: 위 파일을 notepad같은 텍스트 편집기에서 열면 아래와 같은 형태이다. 첫줄은..