일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 단군
- 선형회귀분석
- 한서지리지
- 통계학
- 통계
- 기자
- 낙랑군
- categorical variable
- R
- 고구려
- 우분투
- 지리지
- 히스토그램
- 후한서
- 기자조선
- linear regression
- Histogram
- ANOVA
- 풍백
- 신라
- 태그를 입력해 주세요.
- repeated measures ANOVA
- 독사방여기요
- 패수
- 한서
- post hoc test
- 유주
- spss
- t test
- 창평
- Today
- Total
목록과학과 기술 (233)
獨斷論

1. 데이터 미국 범죄율 Rate: 범죄율 Age: 평균나이 Southern: 남부인지 북부인지 나타내는 변수 Edu: 교육수준 PoliceExp0: 경찰 예산 1960년 PoliceEXp1: 경찰 예산 1959년 Labor: 노동력 Male: 남녀비율 Population: 인구 NonWhite: 백인이외의 인종 Unemploy1: 젊은이 실업율 Unemploy2: 중년층 실업율 Wealth: 소득 IncomeInequa: 소득불평등 data uscrime; infile "d:\tmp\uscrime.csv" delimiter="," firstobs=2; input Rate Age Southern Edu PoliceExp0 PoliceEXp1 Labor Male Population NonWhite Unem..
아래와 같은 데이터가 있다고 가정할때 age weight 23 28 39 31 41 26 49 25 50 31 SAS에서 데이터를 불러들인 후에 ratio라는 새로운 변수를 만들었다고 하면 data bodyfat; input age fat ; ratio = fat / age; datalines; 23 28 39 31 41 26 49 25 50 31 ; run; 이를 자신의 하드디스크에 SAS library로 저장하고 나중에 계속 사용할수도 있다. 아래와 같이 수행하면 자신의 하드디스크 d:\tmp에 bfratio.sas7bdat라는 파일이 생성된다. 이진파일이므로 notepad같은 프로그램으로 열어도 내용을 알아볼수는 없다. data "d:\tmp\bfratio"; set bodyfat; run; 이제 ..

1. 데이터 자동차제조회사에서 사람들의 현재수입과 자동차연식에 따라 그해에 새차를 구입할지 말지 예측할수 있는 모델을 만들고자 한다고 가정하자. 과거에 새차를 구입한 사람들의 수입과 자동차연식을 조사하여 데이터로 만들수 있고 이를 예측모델에 사용할수 있다. 첫번째열(buynew)의 값이 1이면 새차를 구입하였음을 나타내고 0이면 구입하지 않았음을 나타낸다. 두번째열(income)은 수입을 나타낸다. 세번째열(carage)은 지금가지고 있는 차가 얼마나 오래되었는지를 나타낸다. 이때 buynew의 값을 income과 carage로 회귀분석하는데 buynew의 값이 1과 0의 값만 가지므로 로지스틱회귀분석을 이용하여야만 한다. data newcardat; infile "d:\tmp\newcar.csv" dl..

영어로 random and mixed effect ANOVA. 1. 데이터 설명 베어링은 주위를 싸고 있는 Casing의 재질에 따라 진동이 달라지며 플라스틱, 알루미늄, 철로 만들수 있다. Casing의 재질에 따라 진동의 정도를 조사하기 위하여 전국 1000개의 모든 베이링 공장에서 임으로 5 공장을 선택하여 각 공장에서 2개씩 샘플링 했다고 가정하자. 이때 공장A, 공장B, 공장C, 공장D, 공장E는 random-effect factor가 된다. 왜냐하면 전국1000개의 베어링 공장이 베어링을 만드는 숙련도에따라 10개의 레벨이 있다고 가정할때, 위에서 임으로 선택한 A, B, C, D, E 공장들이 10개의 레벨중에 어느 레벨에 들어가는지 위와같은 램덤샘플링을 통해서는 알수가 없기때문이다. 첫번째..

1. 문제설명 슈퍼마켓에서 맛동산의 판매를 높이기 위하여 3가지 다른 진열방법을 썼다고 가정하자 진열방법1: 공짜로 맛볼수 있도록 진열 진열방법2: 계산대에 진열 진열방법3: 구석진 곳 이때 위 진열방법을 썼을때 판매량과 위 진열방법을 쓰지 않았을때 판매량의 데이터가 아래와 같이 존재한다고 가정하면 data snackdat; infile 'd:\tmp\snack.csv' firstobs=2 dlm=","; input arrMethod Sale preSale; run; symbol1 value=square color=black interpol=none; symbol2 value=circle color=red interpol=none; symbol3 value=triangle color=blue interp..

SAS GLM을 이용하여 이원분산분석(two-way ANOVA)를 수행해보도록 한다. 1. 데이터파일: 쉼표로 구분된 csv파일이고 첫번째 행에 변수가 포함되어 있다. data hdlchol; infile 'd:\work\statistics\book\sas\tutorial\drugeffect.csv' dlm="," firstobs=2; input treat age response; run; HDL콜레스테롤을 증가시키는 약을 개발하여 t1 group에는 가짜약을 넣고 t2에는 5mg을 투약하고 t3에는 10mg을 투약한 후에 나이대별로 HDL콜레스테롤이 어떻게 변화하는지 알아본 데이터이다. 데이터파일의 첫번째 열은 t1, t2, t3 그룹을 나타내고 두번째 열은 연령별 그룹이고 세번째 열은 콜레스테..

1. 데이터파일 첫째열: 세금 둘째열: 방 갯수 세째열: 목욕탕 갯수 네째열: 집 가격 다섯째열: 건물크기 여섯째열: 땅 크기 2. 데이터읽기 data houses; infile 'd:\tmp\houses.txt' firstobs = 2; input tax bedroom bath price size lot; run; 3. 다중선형회귀 proc reg data = houses; model price = size lot; plot residual. * (predicted. size lot); run; 종속변수를 price, 독립변수를 size와 lot로 놓고 선형회귀하였고 residual값을 predicted, size, lot에 대하여 각각 그래프로 그리도록 하엿다. 4. Partial F-test 다중회..
1. 데이터파일 허리둘레와 체지방 데이터 첫번째열: 허리둘레 두번째열: 체지방 2. 데이터 읽기 data waistfat; infile 'd:\tmp\waistfat.txt' firstobs=2; input waist bodyfat; run; 3. PROC REG을 이용한 선형회귀 proc reg data = waistfat; model bodyfat = waist; plot bodyfat * waist; plot residual. * waist; plot residual. * nqq. /noline; plot bodyfat * waist / conf; run; residual과 nqq의 뒤에 점( . )을 꼭 찍어야만 한다.