일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 통계학
- R
- 통계
- post hoc test
- 기자조선
- 우분투
- Histogram
- 한서
- 유주
- 선형회귀분석
- 고구려
- 후한서
- 기자
- 창평
- 단군
- 독사방여기요
- 히스토그램
- repeated measures ANOVA
- 패수
- 풍백
- categorical variable
- 태그를 입력해 주세요.
- ANOVA
- spss
- 지리지
- 신라
- t test
- 한서지리지
- linear regression
- 낙랑군
- Today
- Total
목록독단론 (438)
獨斷論
Likelihood가 평균이 $\mu$이고 분산이 $\sigma^2$인 정규분포를 따른다면 $$ p(y | \mu) \propto e^{-\frac{1}{2 \sigma^2} (y - \mu)^2} $$ 인데 여기서 중요한점은 $y$는 측정값으로 고정되어 있고 $\mu$가 가능한 모든 값에서 변한다는 것이다. Prior는 2.0, 2.5, 3.0, 3.5, 4.0의 값만 가질수 있고 각각의 확률이 모두 0.2라고 가정한다. 실험으로부터 얻어진 $y| \mu$는 평균이 $\mu$이고 표준편차가 $\sigma = 1$인 정규분포를 따르는데 얻어진 $y$값은 3.2라고 가정할때 베이즈 표(Bayesian table)을 만들어 보자. $\mu$ Prior Likelihood Prior x Likelihood P..
출생일과 나이를 계산하고자하는 시점의 데이터가 날짜 형식일때 나이를 계산하려면 yrdiff( )를 이용한다. name은 1부터 7열까지 문자열로 읽고 birthdate는 9번째열에서 mmddyy10.의 형식으로 읽고 currentdate는 20번째 열에서 mmddyy10.의 형식으로 읽은 후 yrdiff 함수를 이용하여 나이를 계산한다. data yearage; input name $ 1-7 @9 birthdate mmddyy10. @20 currentdate mmddyy10.; age = yrdif(birthdate, currentdate, "age"); datalines; Smith 11/01/1999 02/01/2020 Thomson 05/21/1989 01/09/2005 John 01/21/195..
Data step을 실행하였는데 원하는대로 변수값이 들어가지 않았을 때에는 SAS 코드를 한줄씩 실행해 가면서 어느 변수에 코딩이 잘못되어서 원하는 값이 들어가지 않았는지 확인하는 방법이 필요하다. DATA hospitaldat; input subj 1-4 name $ 6-23 no_vis 25 expense 27-34; totalexp = no_vis * expense; DATALINES; 1024 Alice Smith 7 1001.98 1167 Maryann White 2 29O9.34 1168 Thomas Jones 10 3904.89 1201 Benedictine Arnold 1 1450.23 1302 Felicia Ho 7 1209.94 1471 John Smith 6 1763.09 1980 J..
데이터를 여러가지 방법으로 불러들이기 위해서는 data step에서 사용되는 내부변수 _N_을 잘 활용하여야만 한다. SAS에서 데이터파일을 읽어들일때에 data에서 run까지 한번만 수행하는것이 아니라 data~run을 한번 수행할때마다 데이터파일의 1번째 행을 불러들인다(이때 _N_ = 1이다). 그리고 다시 data 첫줄로 가서 run까지 다시 실행하면서 데이터파일의 2번째 행을 불러들인다( _N_ = 2). 이러한 반복과정을 데이터파일의 마지막 행까지 실행하게 된다. 이때 내부변수 _N_은 data~run을 몇번째 실행하였는지 알려주며 대개 현재읽어들이는 데이터파일의 행과 일치한다. 쉽게 예를들어보자. DATA hospitaldat; input subj 1-4 name $ 6-23 no_vis 2..
데이터의 일부 행(observation)만 프린트하려면 firstobs와 obs를 추가한다. DATA mydat; input subj 1-4 name $ 6-23 clinic $ 25-28 gender 30 no_vis 32-33 type_vis 35-37 expense 39-45; DATALINES; 1024 Alice Smith LEWN 1 7 101 1001.98 1167 Maryann White LEWN 1 2 101 2999.34 1168 Thomas Jones ALTO 2 10 190 3904.89 1201 Benedictine Arnold ALTO 2 1 190 1450.23 1302 Felicia Ho MNMC 1 7 190 1209.94 1471 John Smith MNMC 2 6 187..
1. 기본문법 IF (조건식) THEN (조건식이 참일때 수행); ELSE (조건식이 거짓일때 수행); 예를들어 아래와 같이 AVG값이 65보다 크면 STATUS에 FAILED를 넣고 그렇지 않으면 STATUS에 PASSED를 넣도록 할수 있다. data grades; input name $ 1-15 e1 e2 e3 e4 p1 f1; avg = mean(e1, e2, e3, e4); if avg < 65 then status = 'Failed'; else status = 'Passed'; datalines; Alexander Smith 78 82 86 69 97 80 John Simon 88 72 86 50 100 85 Patricia Jones 98 92 92 99 99 93 Jack Benedict ..
1. 값을 할당하기 원본 데이터에 4개의 시험 점수가 존재할때 총점을 계산하여 데이터에 넣어보자. DATA grades; INPUT name $ 1-15 e1 e2 e3 e4 p1 f1; examtotal = e1 + e2 + e3 + e4; DATALINES; Alexander Smith 78 82 86 69 97 80 John Simon 88 72 86 . 100 85 Patricia Jones 98 92 92 99 99 93 Jack Benedict 54 63 71 49 82 69 Rene Porter 100 62 88 74 98 92 ; RUN; PROC PRINT DATA = grades; VAR name e1 e2 e3 e4 examtotal; RUN; 위 SAS코드에서 e1, e2, e3 e..
Formatted Input Formatted input은 문자나 숫자가 아닌 천단위에 쉼표가 들어갔거나, 날짜를 나타낼때 슬래쉬가 들갔거나, %단위가 들어간 경우 등의 여러가지 경우의 데이터를 불러들일때 사용한다. 형식은 아래와 같다. INPUT variable informat.; pinter-control은 어디서부터 읽어야할지 나타내고 variable은 변수명 informat.은 어떤형식으로 읽을지를 나타낸다. 이를들어 informat.이 mmddyy8.이면 10/27/21과 같이 총 8자리(2개의 슬래시 포함)의 날자형식이다. comma6.이면 11,235과 같이 쉼표가 들어간 총 6자리(쉼표 포함)의 숫자형식이다. 주의할건 마지막에 점( . )을 꼭 찍도록 해야한다. data mydat; inp..