일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- R
- 통계
- post hoc test
- 통계학
- 패수
- 우분투
- t test
- Histogram
- 기자
- 선형회귀분석
- 풍백
- 히스토그램
- 창평
- 단군
- 독사방여기요
- 한서
- 유주
- 낙랑군
- 기자조선
- spss
- 고구려
- ANOVA
- 지리지
- 태그를 입력해 주세요.
- linear regression
- categorical variable
- 한서지리지
- 후한서
- repeated measures ANOVA
- 신라
- Today
- Total
목록과학과 기술 (233)
獨斷論
출생일과 나이를 계산하고자하는 시점의 데이터가 날짜 형식일때 나이를 계산하려면 yrdiff( )를 이용한다. name은 1부터 7열까지 문자열로 읽고 birthdate는 9번째열에서 mmddyy10.의 형식으로 읽고 currentdate는 20번째 열에서 mmddyy10.의 형식으로 읽은 후 yrdiff 함수를 이용하여 나이를 계산한다. data yearage; input name $ 1-7 @9 birthdate mmddyy10. @20 currentdate mmddyy10.; age = yrdif(birthdate, currentdate, "age"); datalines; Smith 11/01/1999 02/01/2020 Thomson 05/21/1989 01/09/2005 John 01/21/195..
Data step을 실행하였는데 원하는대로 변수값이 들어가지 않았을 때에는 SAS 코드를 한줄씩 실행해 가면서 어느 변수에 코딩이 잘못되어서 원하는 값이 들어가지 않았는지 확인하는 방법이 필요하다. DATA hospitaldat; input subj 1-4 name $ 6-23 no_vis 25 expense 27-34; totalexp = no_vis * expense; DATALINES; 1024 Alice Smith 7 1001.98 1167 Maryann White 2 29O9.34 1168 Thomas Jones 10 3904.89 1201 Benedictine Arnold 1 1450.23 1302 Felicia Ho 7 1209.94 1471 John Smith 6 1763.09 1980 J..
데이터를 여러가지 방법으로 불러들이기 위해서는 data step에서 사용되는 내부변수 _N_을 잘 활용하여야만 한다. SAS에서 데이터파일을 읽어들일때에 data에서 run까지 한번만 수행하는것이 아니라 data~run을 한번 수행할때마다 데이터파일의 1번째 행을 불러들인다(이때 _N_ = 1이다). 그리고 다시 data 첫줄로 가서 run까지 다시 실행하면서 데이터파일의 2번째 행을 불러들인다( _N_ = 2). 이러한 반복과정을 데이터파일의 마지막 행까지 실행하게 된다. 이때 내부변수 _N_은 data~run을 몇번째 실행하였는지 알려주며 대개 현재읽어들이는 데이터파일의 행과 일치한다. 쉽게 예를들어보자. DATA hospitaldat; input subj 1-4 name $ 6-23 no_vis 2..
데이터의 일부 행(observation)만 프린트하려면 firstobs와 obs를 추가한다. DATA mydat; input subj 1-4 name $ 6-23 clinic $ 25-28 gender 30 no_vis 32-33 type_vis 35-37 expense 39-45; DATALINES; 1024 Alice Smith LEWN 1 7 101 1001.98 1167 Maryann White LEWN 1 2 101 2999.34 1168 Thomas Jones ALTO 2 10 190 3904.89 1201 Benedictine Arnold ALTO 2 1 190 1450.23 1302 Felicia Ho MNMC 1 7 190 1209.94 1471 John Smith MNMC 2 6 187..
1. 기본문법 IF (조건식) THEN (조건식이 참일때 수행); ELSE (조건식이 거짓일때 수행); 예를들어 아래와 같이 AVG값이 65보다 크면 STATUS에 FAILED를 넣고 그렇지 않으면 STATUS에 PASSED를 넣도록 할수 있다. data grades; input name $ 1-15 e1 e2 e3 e4 p1 f1; avg = mean(e1, e2, e3, e4); if avg < 65 then status = 'Failed'; else status = 'Passed'; datalines; Alexander Smith 78 82 86 69 97 80 John Simon 88 72 86 50 100 85 Patricia Jones 98 92 92 99 99 93 Jack Benedict ..
1. 값을 할당하기 원본 데이터에 4개의 시험 점수가 존재할때 총점을 계산하여 데이터에 넣어보자. DATA grades; INPUT name $ 1-15 e1 e2 e3 e4 p1 f1; examtotal = e1 + e2 + e3 + e4; DATALINES; Alexander Smith 78 82 86 69 97 80 John Simon 88 72 86 . 100 85 Patricia Jones 98 92 92 99 99 93 Jack Benedict 54 63 71 49 82 69 Rene Porter 100 62 88 74 98 92 ; RUN; PROC PRINT DATA = grades; VAR name e1 e2 e3 e4 examtotal; RUN; 위 SAS코드에서 e1, e2, e3 e..
Formatted Input Formatted input은 문자나 숫자가 아닌 천단위에 쉼표가 들어갔거나, 날짜를 나타낼때 슬래쉬가 들갔거나, %단위가 들어간 경우 등의 여러가지 경우의 데이터를 불러들일때 사용한다. 형식은 아래와 같다. INPUT variable informat.; pinter-control은 어디서부터 읽어야할지 나타내고 variable은 변수명 informat.은 어떤형식으로 읽을지를 나타낸다. 이를들어 informat.이 mmddyy8.이면 10/27/21과 같이 총 8자리(2개의 슬래시 포함)의 날자형식이다. comma6.이면 11,235과 같이 쉼표가 들어간 총 6자리(쉼표 포함)의 숫자형식이다. 주의할건 마지막에 점( . )을 꼭 찍도록 해야한다. data mydat; inp..
SAS에서는 데이터파일 안의 각 열이 어떻게 구분되냐에 따라 column input list input formatted input 으로 구분한다. Column input란 각 열의 크기를 숫자로 정해주어 변수에 지정하는 방법이고 List input이란 각 열이 공백으로 나누어져 있을때 데이터를 불러들이는 방법이고 Formatted input은 데이터 특별한 형식을 가지고 있을때 사용하는 방법이다. Column input 데이터가 아래와 같을때 1024 Alice Smith 1 65 125 1167 Maryann White 1 68 140 1168 Thomas Jones 2 68 190 1201 Benedictine Arnold 2 68 190 1302 Felicia Ho 1 63 115 각 변수의 데이..