일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- linear regression
- spss
- 단군
- R
- 유주
- repeated measures ANOVA
- t test
- 패수
- 통계
- 낙랑군
- 후한서
- 기자조선
- 창평
- 우분투
- 태그를 입력해 주세요.
- 한서
- 히스토그램
- 통계학
- 풍백
- ANOVA
- 선형회귀분석
- Histogram
- 고구려
- 기자
- 신라
- 독사방여기요
- 지리지
- post hoc test
- categorical variable
- 한서지리지
- Today
- Total
목록과학과 기술 (233)
獨斷論
1. 데이터파일 3가지 종류의 두통약의 효과를 알아보기 위하여 각각 9명씩 두통약을 먹은후 두통의 정도를 측정 변수간에 공백으로 분리된 파일이 아니라 쉼표로 분리된 CSV파일을 열때에 SAS에서 dlm 옵션을 이용한다. data drugpain; infile 'd:\tmp\drugpain.csv' dlm = "," firstobs = 2; input drug $ pain; run; 2. ANOVA ANOVA를 수행하기 전에 boxplot을 그려보아 그 대략을 알아보는것이 좋다. boxplot을 그리기 전에 읽어들인 데이터의 group 변수(drug)에 따라 정렬하여야 한다. proc sort data = drugpain; by drug; run; proc boxplot data = drugpain; pl..
1. One-sample t-test 각 연도별 옥수수의 생산량과 강수량 옥수수 yield가 30과 같은지 t-test수행 data corndat; infile 'd:\tmp\corn.txt' firstobs = 2; input year rain yield; run; proc univariate mu0 = 30 data = corndat; var yield; run; proc univariate의 옵션으로 mu0 = 30을 추가한다. 2. Two-sample t-test 총 12명의 실험참가자 중 6명은 control group (placebo)이고 나머지 6명은 treatment group (a drug)일때 가상의 효과가 아래와 같이 나타났다고 가정하고 가상의 효과가 control group과 tre..
1. 데이터 각 연도별 옥수수의 생산량과 강수량 2. 데이터 읽기 filename fnstr 'd:\tmp\corn.txt'; data corndat; infile fnstr firstobs = 2; input year rain yield; run; corn.txt의 첫번째 행에 각 열의 변수명이 포함되어 있으므로 firstobs = 2를 이용하여 두번째 행부터 읽도록 하였다. 3. 평균값 구하기 proc means data = corndat; var rain yield; run; proc means를 이용하여 rain과 yield의 평균값을 구하였다. 명령어가 mean이 아니라 means이다. 4. 기술통계 descriptive statistics의 값들은 proc univariate으로 구한다. pr..
1. SAS의 기본 문법 형태 DATA step DATA mydata; INPUT variables; DATALINES; data1 data2 ; RUN; PROC step PROC procedure options; options; RUN; 2. SAS에 직접입력 아래와 같은 데이터가 있다고 가정하자. Joe 84 79 Sue 94 97 Betty 93 89 전체학생은 3명이고 두번째 열은 중간고사 성적 그리고 세번째 열은 기말고사 성적이다. SAS의 File --> New Program을 클릭하고 아래와 같이 입력한다. data mydat; input name $ midterm final; datalines; Joe 84 79 Sue 94 97 Betty 93 89 ; run; 첫번째행은 mydat라는..
100명을 무작위로 나이와 심장병이 있는지 조사하였을때 데이터가 아래와 같다고 가정하자. 데이터파일: 위 데이터파일을 내려받고 아래 R script를 실행 chd_df = read.csv("chdage.csv", header = TRUE) plot(CHD ~ Age, data = chd_df) 대략 20대에서 9명은 심장병이 없고 1명만 심장병을 가지고 있는 반면, 60대에서는 심장병이 없는 사람은 2명이고 심장병을 가지고 있는 사람은 8명이다. 달리말하면 20대에서 심장병을 갖고 있을 확률은 0.1이고 60대가 심장병을 가질 확률은 0.8이다. 40대 초반이 심장병을 가질 확률은 대략 0.5이다. 이러한 확률은 아래와 같은 함수로 나타낼수가 있다(https://en.wikipedia.org/wiki/L..
There are a number of extractor functions (functions that extract or derive specific information from a model) available including: residuals() Extracts the residuals from the model rstandard() Extracts the standardized residuals from the model rstudent() Extracts the studentized residuals from the model fitted() Extracts the predicted (expected) response values (on the link scale) at the observ..
rare disease bayesian probability구하는데 기호가 하두 이상하여 따로 정리해보았다
9M1 풀이 9장 본문의 R 스크립트 중 sigma 부분만 바꾸면 된다. 아래 m91과 m911을 비교 library(rethinking) rm(list=ls()) data(rugged) d = rugged d$log_gdp = log(d$rgdppc_2000) dd = d[complete.cases(d$rgdppc_2000), ] dd$log_gdp_std = dd$log_gdp / mean(dd$log_gdp) dd$rugged_std = dd$rugged / max(dd$rugged) dd$cid = ifelse(dd$cont_africa == 1, 1, 2) dat_slim = list( log_gdp_std = dd$log_gdp_std, rugged_std = dd$rugged_std, cid..