Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- repeated measures ANOVA
- categorical variable
- ANOVA
- 태그를 입력해 주세요.
- 한서지리지
- 기자조선
- 기자
- 통계학
- 히스토그램
- linear regression
- 우분투
- 낙랑군
- 패수
- 고구려
- 유주
- 신라
- 창평
- t test
- 통계
- spss
- 독사방여기요
- R
- post hoc test
- 후한서
- 한서
- 단군
- Histogram
- 선형회귀분석
- 지리지
- 풍백
Archives
- Today
- Total
獨斷論
SAS 다중회귀분석 multiple regression 본문
1. 데이터
미국 범죄율
uscrime.csv
0.00MB
Rate: 범죄율
Age: 평균나이
Southern: 남부인지 북부인지 나타내는 변수
Edu: 교육수준
PoliceExp0: 경찰 예산 1960년
PoliceEXp1: 경찰 예산 1959년
Labor: 노동력
Male: 남녀비율
Population: 인구
NonWhite: 백인이외의 인종
Unemploy1: 젊은이 실업율
Unemploy2: 중년층 실업율
Wealth: 소득
IncomeInequa: 소득불평등
data uscrime;
infile "d:\tmp\uscrime.csv" delimiter="," firstobs=2;
input Rate Age Southern Edu PoliceExp0 PoliceEXp1 Labor
Male Population NonWhite Unemploy1 Unemploy2 Wealth IncomeInequal;
run;
2. 공선성(multicolinearity) 확인
vif를 확인하는데 10이상이면 공선성이 크다고 본다.
proc reg data = uscrime;
model Rate = Age--IncomeInequal /vif;
run;
종속변수를 Rate, 독립변수로 모든 변수를 첨가하여 vif(variance inflation factor)를 보았다.

PoliceExp0와 PoliceExp1의 vif가 10보다 월등히 크므로 이 두변수사이에 공선성이 존재한다고 볼수 있다.이 두 변수중 하나를 제거하여 나머지 변수사이에도 공선성이 있는지 확인해 본다.
3. Stepwise regression
PoliceExp0를 제거한 나머지 변수를 가지고 stepwise regression을 수행한다. entering과 stay를 위한 significant level을 0.05로 잡았다.
proc reg data = uscrime;
model Rate = Age--Edu PoliceExp1--IncomeInequal /selection=stepwise sle=0.05 sls=0.05;
plot student. * (PoliceExp1 IncomeInequal Edu Age Unemploy2);
plot student. * (predicted. cookd. obs.);
plot cookd. * obs.;
plot npp. * residual.;
run; quit;

Comments