과학과 기술/SAS
SAS 초급4: GLM을 이용한 ANOVA
부르칸
2021. 7. 6. 07:33
1. 데이터파일
3가지 종류의 두통약의 효과를 알아보기 위하여 각각 9명씩 두통약을 먹은후 두통의 정도를 측정
변수간에 공백으로 분리된 파일이 아니라 쉼표로 분리된 CSV파일을 열때에 SAS에서 dlm 옵션을 이용한다.
data drugpain;
infile 'd:\tmp\drugpain.csv' dlm = "," firstobs = 2;
input drug $ pain;
run;
2. ANOVA
ANOVA를 수행하기 전에 boxplot을 그려보아 그 대략을 알아보는것이 좋다. boxplot을 그리기 전에 읽어들인 데이터의 group 변수(drug)에 따라 정렬하여야 한다.
proc sort data = drugpain;
by drug;
run;
proc boxplot data = drugpain;
plot pain * drug;
run;
boxplot을 그릴때 두변수를 *로 분리하며 첫번째로 나올 변수명은 종속변수인 pain이고 두번째로 나올 변수는 독립변수인 drug이어야만 한다.
proc glm data = drugpain;
class drug;
model pain = drug;
means drug / bon;
contrast 'drugA vs. (drugB + drugC)' drug 1 - 0.5 - 0.5;
run;
quit;
class 명령어를 이용하여 group 변수를 drug으로 지정하고 model은 독립변수와 종속변수의 관계를 나타낸다. means 명령어는 posthoc test를 수행할때 Bonferroni t-tests를 수행하도록 하였다.
durgB와 drugC는 비슷한 효과를 나타내며 drugA가 이 둘과 현저한 차이를 보인다는 정보를 미리 알고 있다면 mA - (mB + mC)/2와 같은 contrast를 이용하여 비교할수도 있다.