일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 한서
- 단군
- 신라
- 통계
- linear regression
- ANOVA
- 우분투
- 고구려
- 독사방여기요
- 한서지리지
- spss
- 기자조선
- repeated measures ANOVA
- R
- 통계학
- 히스토그램
- 유주
- 창평
- 후한서
- t test
- post hoc test
- categorical variable
- Histogram
- 기자
- 낙랑군
- 태그를 입력해 주세요.
- 패수
- 지리지
- 풍백
- 선형회귀분석
- Today
- Total
목록과학과 기술/SAS (27)
獨斷論
1. 기본문법 IF (조건식) THEN (조건식이 참일때 수행); ELSE (조건식이 거짓일때 수행); 예를들어 아래와 같이 AVG값이 65보다 크면 STATUS에 FAILED를 넣고 그렇지 않으면 STATUS에 PASSED를 넣도록 할수 있다. data grades; input name $ 1-15 e1 e2 e3 e4 p1 f1; avg = mean(e1, e2, e3, e4); if avg < 65 then status = 'Failed'; else status = 'Passed'; datalines; Alexander Smith 78 82 86 69 97 80 John Simon 88 72 86 50 100 85 Patricia Jones 98 92 92 99 99 93 Jack Benedict ..
1. 값을 할당하기 원본 데이터에 4개의 시험 점수가 존재할때 총점을 계산하여 데이터에 넣어보자. DATA grades; INPUT name $ 1-15 e1 e2 e3 e4 p1 f1; examtotal = e1 + e2 + e3 + e4; DATALINES; Alexander Smith 78 82 86 69 97 80 John Simon 88 72 86 . 100 85 Patricia Jones 98 92 92 99 99 93 Jack Benedict 54 63 71 49 82 69 Rene Porter 100 62 88 74 98 92 ; RUN; PROC PRINT DATA = grades; VAR name e1 e2 e3 e4 examtotal; RUN; 위 SAS코드에서 e1, e2, e3 e..
Formatted Input Formatted input은 문자나 숫자가 아닌 천단위에 쉼표가 들어갔거나, 날짜를 나타낼때 슬래쉬가 들갔거나, %단위가 들어간 경우 등의 여러가지 경우의 데이터를 불러들일때 사용한다. 형식은 아래와 같다. INPUT variable informat.; pinter-control은 어디서부터 읽어야할지 나타내고 variable은 변수명 informat.은 어떤형식으로 읽을지를 나타낸다. 이를들어 informat.이 mmddyy8.이면 10/27/21과 같이 총 8자리(2개의 슬래시 포함)의 날자형식이다. comma6.이면 11,235과 같이 쉼표가 들어간 총 6자리(쉼표 포함)의 숫자형식이다. 주의할건 마지막에 점( . )을 꼭 찍도록 해야한다. data mydat; inp..
SAS에서는 데이터파일 안의 각 열이 어떻게 구분되냐에 따라 column input list input formatted input 으로 구분한다. Column input란 각 열의 크기를 숫자로 정해주어 변수에 지정하는 방법이고 List input이란 각 열이 공백으로 나누어져 있을때 데이터를 불러들이는 방법이고 Formatted input은 데이터 특별한 형식을 가지고 있을때 사용하는 방법이다. Column input 데이터가 아래와 같을때 1024 Alice Smith 1 65 125 1167 Maryann White 1 68 140 1168 Thomas Jones 2 68 190 1201 Benedictine Arnold 2 68 190 1302 Felicia Ho 1 63 115 각 변수의 데이..
SAS로 데이터를 불어들일때 데이터 파일을 읽어들이는 방법과 SAS 코드 안에 직접 입력하는 방법이 있다. 1. SAS 코드에 데이터 입력 일단 아래 코드를 입력하고 실행한다. DATA mydata; INPUT subj 1-4 gender 6 height 8-9 weight 11-13; DATALINES; 1024 1 65 125 1167 1 68 140 1168 2 68 190 1201 2 72 190 1302 1 63 115 ; RUN; PROC PRINT data=mydata; TITLE 'Output dataset: mydata'; RUN; 첫째줄: DATA mydat는 mydata라는 이름의 데이터를 만들겠다는 뜻이고 둘째줄: INPUT 키워드 뒤로 데이터에 들어가는 변수명이 주어졌는데 여기서는..
SAS statement의 기본 규칙 모든 SAS statement는 세미콜론( ; )으로 끝난다. SAS statement는 SAS keyword로 시작한다. 예를들어 data, proc, run과 같은 키워드로 시작하여야만 한다. 세미콜론으로 statement의 끝을 구분하므로 statement 중간에 엔터를 쳐서 줄을 바꿀수도 있다. 하지만 키워드나 변수 등등의 중간에 엔터를 넣어서는 안된다. 대문자와 소문자를 구별하지 않는다. 그러나 따옴표 안의 문자들은 대소문자를 구별한다. 여러줄 주석은 슬래쉬와 별표(예를들어 /* 주석 */)를 이용하거나 한줄짜리 주석은 별표와 세미콜론(예를들어 * 주석 ;)를 이용한다. 변수명과 데이터명 변수명과 데이터명을 지을때 문자의 갯수는 1~32개여야만 한다. 꼭 문..
1. 데이터 고혈압 환자들에게 3가지 처치를 하였을때 혈압을 측정하였다. treat1에서는 약을 3가지 종류로 주었고(Drug I, J, K) treat2에서는 biofeedback를 사용하였으며(Present, Absent) treat3에서는 diet에 변화를 주었다(Yes, No) 3 x 2 x 2 ANOVA가 된다. 측정된 데이터의 형태는 위와 같은데 이를 통계분석을 위하여 각 변수를 열로 놓고 observations를 행으로 놓아 변형하면 아래 데이터파일과 같다. 위 파일의 데이터를 아래와 같이 SAS에서 불러들인다. cell이라는 새로운 변수를 만들어 factor변수를 한데 합치었다. ||는 concatenation 명령이다. data hyperdat; infile "d:\tmp\hyper.cs..
1. 데이터 미국 범죄율 Rate: 범죄율 Age: 평균나이 Southern: 남부인지 북부인지 나타내는 변수 Edu: 교육수준 PoliceExp0: 경찰 예산 1960년 PoliceEXp1: 경찰 예산 1959년 Labor: 노동력 Male: 남녀비율 Population: 인구 NonWhite: 백인이외의 인종 Unemploy1: 젊은이 실업율 Unemploy2: 중년층 실업율 Wealth: 소득 IncomeInequa: 소득불평등 data uscrime; infile "d:\tmp\uscrime.csv" delimiter="," firstobs=2; input Rate Age Southern Edu PoliceExp0 PoliceEXp1 Labor Male Population NonWhite Unem..