일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 기자조선
- 풍백
- 통계학
- 한서
- 한서지리지
- 고구려
- 패수
- categorical variable
- 독사방여기요
- 기자
- 태그를 입력해 주세요.
- spss
- 낙랑군
- Histogram
- 신라
- 선형회귀분석
- repeated measures ANOVA
- t test
- 단군
- 통계
- 지리지
- 창평
- 후한서
- linear regression
- 유주
- 우분투
- 히스토그램
- post hoc test
- R
- ANOVA
- Today
- Total
목록과학과 기술 (233)
獨斷論
Stepwise linear regression를 우리말로는 단계적선형회귀라고 한다. 이 방법은 선형회귀를 수행할때 우리가 임으로 독립변수를 선택하는 것이 아니라 알고리즘에 의해서 독립변수를 자동적으로 선택하는 방법이다. 요즘은 데이터가 너무 방대하다. observation도 많을뿐만 아니라 변수도 많다. 하나의 종속변수에 대한 선형회귀모델을 만들때 데이터에 있는 모든 변수를 독립변수로 사용하여 선형회귀모델을 작성하면 overfitting이 되서 모델이 정확하지 못하다. 또한 그렇다고 하여 너무 적은 숫자의 독립변수를 이용하여 선형회귀모델을 만들면 예측력이 떨어진다. 어떻게하면 적절한 독립변수를 선택하여 선형회귀모델을 만들수 있을까?자동적으로 해주는 방법이 여기서 이야기하고자 하는 stepwise lin..
조건문 if switch와 순환문 for while에 대한 간략 설명 (Matlab 사용설명서 4)Matlab을 쓰다보면 가끔 if문을 쓰거나 switch문을 써서 조건에 따라 계산해야 할 필요가 있다. 또한 matlab은 기본적으로 vector와 matrix로 계산하므로 for나 while은 그렇게 쓸일이 없지만 꼭 써야하는 경우가 발생하기도 하므로 알아두어야만 한다. 조건문 if if의 기본적인 문법은 다음과 같다. if 조건식 문장 elseif 조건식 문장 else 문장 end elseif나 else는 필요없다면 생략해도 된다.elseif는 띄어쓰는게 아니라 붙여써야 한다는것을 기억해두어야 한다. 이제 조건문 if를 써서 간단한 script를 작성해보자.아래 matlab script는 변수 a에 1..
편집기editor를 이용한 programming과 script 만들기 (Matlab 사용설명서 4) 지금까지는 Matlab의 command window에 명령어를 한줄씩 입력하여 결과를 얻었지만 이는 매우 불편한 방법이다. 이제 matlab에서 제공하는 편집기를 이용하여 script를 작성하여 단번에 실행하는 방법에 대해서 알아보자. 편집기 열기Matlab에서 제공하는 편집기를 열려면 아래와 같이 마우스로 New를 클릭한 후에 Script를 클릭한다. 또한 아래 나와 있듯이 Ctrl+N을 눌러도 된다.다른 방법으로 command window에서 edit이라고 입력해도 된다. 그러면 아래와 같은 편집기가 열릴 것이다. 편집기에서 script 만들기 이제 편집기를 열었으면 편집기에 명령행을 쳐 넣으면 된다...
z-transform을 이용한 선형회귀분석에서도 공선성 문제를 해결하지 못하였다.이제 Factor componet scores를 이용하여 공선성 문제를 해결하여 보자. Factor analysis는 나중에 다룰 것인데 여기서는 단순히 독립변수를 선형조합을 하여, 즉 (f1 = a*x1 + b*x2 + ...) 같은 것을 수행하여 변수들간에 상관관계를 없앤다고만 알아두면 된다. Factor Analysis 수행하기 이제 Factor analysis를 수행하여보자. 데이터파일은 역시 car_sales2.csv인데 http://dogmas.tistory.com/377에 가면 있다. Analyze > Dimension Reduction > Factor...를 클릭한다.Variables에 z-transform한 ..
SPSS 사용설명서 17에서 우리는 독립변수들간에 공선성 문제를 보았다. 이제 그 문제를 어떻게 해결하는지 알아보자. z-transform한 값으로 선형회귀분석 실행하기 공선성multicollinearity의 문제는 독립변수를 z-transform하여 선형회귀분석을 실행하면 그 문제를 해결할 수 있다. 선형회귀분석에 사용되었던 모든 독립변수를 z-transform하여 저장하여 보자. Analyze > Descriptive Statistics > Descriptives...를 클릭한다. Variables에 변환하고자 하는 독립변수를 설정하고아래에 Save standardized values as variables를 클릭한 후에 OK를 클릭하면 설정해두었던 변수들의 변수명에 "Z"가 붙어서 새로운 변수가 생..
선형회귀분석이란 하나 이상의 독립변수로부터 종속변수의 값을 선형으로 모델링하는 것이다 독립변수는 영어로 여러가지 다른 말로 존재하는데 다음과 같다. 주로 많이 쓰는 단어를 굵게 표시하였다. independent variablespredictor variablesexplanatory variableregressorcontrolled variable, manipulated variable, exposure variablerisk factor(의학통계분야에서 쓰임) feature와 input variable(machine learning에서 쓰임) 종속변수도 영어로 여러가지 다른말로 존재한다. 역시 많이 쓰는 단어를 굵게 표시하였다. dependent variablesresponse variables 또는 r..
Partial Correlations 우리말로는 부분상관 또는 편상관이라고 한단다. Partial correlation이란 우리가 가진 데이터에 변수가 2개만 있는 것이 아니라 3개 이상의 변수가 있고 이때 이들 변수중 오직 2개만의 변수의 correlation을 보고자할때 다른 하나의 변수를 controlling하여 그 영향을 없앤 후의 correlation을 보는 방법이다. 공중보건에 대한 데이터가 보건예산이 증가할수록 발병률이 증가하는 상관관계를 보였다고 가정해보자. 데이터의 숫자들에 에러가 없다고 가정할때, 이 데이터에 따르면 정부가 보건예산을 감소시킬수록 국민들의 건강이 좋아진다고 생각하게 만든다. 이것이 정말 사실일까? 아니면 다른 요소들이 위 둘 변수, 즉 보건예산과 발병률의 관계를 반대로 ..
비모수nonparametric 상관관계correlation를 계산해보자.주로 Spearman's rho와 Kendall's tau를 이용한다. 언제나 그랬듯이 아래 csv 파일을 받아서 SPSS에서 읽은 후에 np_sales.sav로 저장한다. 아래처럼 보인다면 제대로 된 것이다. model은 자동차 모델이고sales는 자동차 판매량이며mpg는 연비를 나타내고type은 0일때 승용차 1일때 트럭이다.log_sales는 sales 변수를 log-transform해놓은 것이다. 위 데이터는 연비에 따라서 자동차 판매량이 달라지는지 알아본 데이터인데 승용차냐 트럭이냐에 따라 판매 양상이 달라지므로 이 두 개를 달리 고려해야 한다. 그렇게 하기 위해서는 우선 Data > Split Files...를 클릭한다. ..