일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 통계
- 낙랑군
- 유주
- 선형회귀분석
- 후한서
- Histogram
- 단군
- 신라
- categorical variable
- 통계학
- linear regression
- ANOVA
- 태그를 입력해 주세요.
- 지리지
- t test
- post hoc test
- 패수
- spss
- R
- 한서
- 창평
- 히스토그램
- 고구려
- 한서지리지
- 기자조선
- 풍백
- 독사방여기요
- 우분투
- 기자
- repeated measures ANOVA
- Today
- Total
목록독단론 (438)
獨斷論
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/YiteU/btraXRFUXWo/UIifaz2R0ELxDkvZFpJGYK/img.png)
1. 데이터 고혈압 환자들에게 3가지 처치를 하였을때 혈압을 측정하였다. treat1에서는 약을 3가지 종류로 주었고(Drug I, J, K) treat2에서는 biofeedback를 사용하였으며(Present, Absent) treat3에서는 diet에 변화를 주었다(Yes, No) 3 x 2 x 2 ANOVA가 된다. 측정된 데이터의 형태는 위와 같은데 이를 통계분석을 위하여 각 변수를 열로 놓고 observations를 행으로 놓아 변형하면 아래 데이터파일과 같다. 위 파일의 데이터를 아래와 같이 SAS에서 불러들인다. cell이라는 새로운 변수를 만들어 factor변수를 한데 합치었다. ||는 concatenation 명령이다. data hyperdat; infile "d:\tmp\hyper.cs..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/xDEr9/btraTcI03EW/loafInCDAPIM4jlCngOf00/img.png)
1. 데이터 미국 범죄율 Rate: 범죄율 Age: 평균나이 Southern: 남부인지 북부인지 나타내는 변수 Edu: 교육수준 PoliceExp0: 경찰 예산 1960년 PoliceEXp1: 경찰 예산 1959년 Labor: 노동력 Male: 남녀비율 Population: 인구 NonWhite: 백인이외의 인종 Unemploy1: 젊은이 실업율 Unemploy2: 중년층 실업율 Wealth: 소득 IncomeInequa: 소득불평등 data uscrime; infile "d:\tmp\uscrime.csv" delimiter="," firstobs=2; input Rate Age Southern Edu PoliceExp0 PoliceEXp1 Labor Male Population NonWhite Unem..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/b4T7ck/btq98urYXRW/2kEHJu9GYF1yl7UlWEwcTk/img.png)
Lance Lambert Wed, July 21, 2021, 4:00 AM In the early weeks of the COVID-19 recession it looked like the housing market was headed for a slump—or worse a crash. After all, how could the market stay afloat amid Great Depression-era level joblessness and state-issued shutdowns that kept agents from doing in-person showings? What transpired next shocked the industry: Instead of sinking, housing we..
아래와 같은 데이터가 있다고 가정할때 age weight 23 28 39 31 41 26 49 25 50 31 SAS에서 데이터를 불러들인 후에 ratio라는 새로운 변수를 만들었다고 하면 data bodyfat; input age fat ; ratio = fat / age; datalines; 23 28 39 31 41 26 49 25 50 31 ; run; 이를 자신의 하드디스크에 SAS library로 저장하고 나중에 계속 사용할수도 있다. 아래와 같이 수행하면 자신의 하드디스크 d:\tmp에 bfratio.sas7bdat라는 파일이 생성된다. 이진파일이므로 notepad같은 프로그램으로 열어도 내용을 알아볼수는 없다. data "d:\tmp\bfratio"; set bodyfat; run; 이제 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/crEr0U/btq9yNeJ11W/kO3ijlfy3Ep7EjQ6OqgMm1/img.png)
1. 데이터 자동차제조회사에서 사람들의 현재수입과 자동차연식에 따라 그해에 새차를 구입할지 말지 예측할수 있는 모델을 만들고자 한다고 가정하자. 과거에 새차를 구입한 사람들의 수입과 자동차연식을 조사하여 데이터로 만들수 있고 이를 예측모델에 사용할수 있다. 첫번째열(buynew)의 값이 1이면 새차를 구입하였음을 나타내고 0이면 구입하지 않았음을 나타낸다. 두번째열(income)은 수입을 나타낸다. 세번째열(carage)은 지금가지고 있는 차가 얼마나 오래되었는지를 나타낸다. 이때 buynew의 값을 income과 carage로 회귀분석하는데 buynew의 값이 1과 0의 값만 가지므로 로지스틱회귀분석을 이용하여야만 한다. data newcardat; infile "d:\tmp\newcar.csv" dl..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/yMq9K/btq9xKORf7C/mMZwbkR1uTYXKI9kKUKGMK/img.png)
영어로 random and mixed effect ANOVA. 1. 데이터 설명 베어링은 주위를 싸고 있는 Casing의 재질에 따라 진동이 달라지며 플라스틱, 알루미늄, 철로 만들수 있다. Casing의 재질에 따라 진동의 정도를 조사하기 위하여 전국 1000개의 모든 베이링 공장에서 임으로 5 공장을 선택하여 각 공장에서 2개씩 샘플링 했다고 가정하자. 이때 공장A, 공장B, 공장C, 공장D, 공장E는 random-effect factor가 된다. 왜냐하면 전국1000개의 베어링 공장이 베어링을 만드는 숙련도에따라 10개의 레벨이 있다고 가정할때, 위에서 임으로 선택한 A, B, C, D, E 공장들이 10개의 레벨중에 어느 레벨에 들어가는지 위와같은 램덤샘플링을 통해서는 알수가 없기때문이다. 첫번째..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/VUQkj/btq9weIeE8V/frPOMykiJpvKMTv3KN4od1/img.png)
1. 문제설명 슈퍼마켓에서 맛동산의 판매를 높이기 위하여 3가지 다른 진열방법을 썼다고 가정하자 진열방법1: 공짜로 맛볼수 있도록 진열 진열방법2: 계산대에 진열 진열방법3: 구석진 곳 이때 위 진열방법을 썼을때 판매량과 위 진열방법을 쓰지 않았을때 판매량의 데이터가 아래와 같이 존재한다고 가정하면 data snackdat; infile 'd:\tmp\snack.csv' firstobs=2 dlm=","; input arrMethod Sale preSale; run; symbol1 value=square color=black interpol=none; symbol2 value=circle color=red interpol=none; symbol3 value=triangle color=blue interp..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bCjwmp/btq9bluwiQD/6Y6g9dRk9h1jfmSu1GknD0/img.png)
SAS GLM을 이용하여 이원분산분석(two-way ANOVA)를 수행해보도록 한다. 1. 데이터파일: 쉼표로 구분된 csv파일이고 첫번째 행에 변수가 포함되어 있다. data hdlchol; infile 'd:\work\statistics\book\sas\tutorial\drugeffect.csv' dlm="," firstobs=2; input treat $ age $ response; run; HDL콜레스테롤을 증가시키는 약을 개발하여 t1 group에는 가짜약을 넣고 t2에는 5mg을 투약하고 t3에는 10mg을 투약한 후에 나이대별로 HDL콜레스테롤이 어떻게 변화하는지 알아본 데이터이다. 데이터파일의 첫번째 열은 t1, t2, t3 그룹을 나타내고 두번째 열은 연령별 그룹이고 세번째 열은 콜레스테..