일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 우분투
- post hoc test
- 지리지
- 히스토그램
- R
- spss
- ANOVA
- 유주
- 단군
- linear regression
- 통계학
- 낙랑군
- 한서
- Histogram
- 기자조선
- 후한서
- 기자
- t test
- categorical variable
- 창평
- 선형회귀분석
- 패수
- 독사방여기요
- 신라
- 통계
- repeated measures ANOVA
- 한서지리지
- 고구려
- 태그를 입력해 주세요.
- 풍백
- Today
- Total
목록과학과 기술/SPSS (61)
獨斷論
SPSS 사용설명서 17에서 우리는 독립변수들간에 공선성 문제를 보았다. 이제 그 문제를 어떻게 해결하는지 알아보자. z-transform한 값으로 선형회귀분석 실행하기 공선성multicollinearity의 문제는 독립변수를 z-transform하여 선형회귀분석을 실행하면 그 문제를 해결할 수 있다. 선형회귀분석에 사용되었던 모든 독립변수를 z-transform하여 저장하여 보자. Analyze > Descriptive Statistics > Descriptives...를 클릭한다. Variables에 변환하고자 하는 독립변수를 설정하고아래에 Save standardized values as variables를 클릭한 후에 OK를 클릭하면 설정해두었던 변수들의 변수명에 "Z"가 붙어서 새로운 변수가 생..
선형회귀분석이란 하나 이상의 독립변수로부터 종속변수의 값을 선형으로 모델링하는 것이다 독립변수는 영어로 여러가지 다른 말로 존재하는데 다음과 같다. 주로 많이 쓰는 단어를 굵게 표시하였다. independent variablespredictor variablesexplanatory variableregressorcontrolled variable, manipulated variable, exposure variablerisk factor(의학통계분야에서 쓰임) feature와 input variable(machine learning에서 쓰임) 종속변수도 영어로 여러가지 다른말로 존재한다. 역시 많이 쓰는 단어를 굵게 표시하였다. dependent variablesresponse variables 또는 r..
Partial Correlations 우리말로는 부분상관 또는 편상관이라고 한단다. Partial correlation이란 우리가 가진 데이터에 변수가 2개만 있는 것이 아니라 3개 이상의 변수가 있고 이때 이들 변수중 오직 2개만의 변수의 correlation을 보고자할때 다른 하나의 변수를 controlling하여 그 영향을 없앤 후의 correlation을 보는 방법이다. 공중보건에 대한 데이터가 보건예산이 증가할수록 발병률이 증가하는 상관관계를 보였다고 가정해보자. 데이터의 숫자들에 에러가 없다고 가정할때, 이 데이터에 따르면 정부가 보건예산을 감소시킬수록 국민들의 건강이 좋아진다고 생각하게 만든다. 이것이 정말 사실일까? 아니면 다른 요소들이 위 둘 변수, 즉 보건예산과 발병률의 관계를 반대로 ..
비모수nonparametric 상관관계correlation를 계산해보자.주로 Spearman's rho와 Kendall's tau를 이용한다. 언제나 그랬듯이 아래 csv 파일을 받아서 SPSS에서 읽은 후에 np_sales.sav로 저장한다. 아래처럼 보인다면 제대로 된 것이다. model은 자동차 모델이고sales는 자동차 판매량이며mpg는 연비를 나타내고type은 0일때 승용차 1일때 트럭이다.log_sales는 sales 변수를 log-transform해놓은 것이다. 위 데이터는 연비에 따라서 자동차 판매량이 달라지는지 알아본 데이터인데 승용차냐 트럭이냐에 따라 판매 양상이 달라지므로 이 두 개를 달리 고려해야 한다. 그렇게 하기 위해서는 우선 Data > Split Files...를 클릭한다. ..
http://dogmas.tistory.com/365에서 했던 파일을 다시 열고이제 outlier가 제거된 carsales.sav를 가지고 bivariate correlation을 구해보도록 하자.한가지 유의해야할 점은 F-series라는 모델이 outlier 상에 존재함에도 불구하고 아직 연구중이라는 이유로 데이터에 포함시켰으므로 skewness를 가진 데이터이다. 이때는 log transform을 해야만 한다. Log transform 실행하기 Transform > Compute Variables...를 클릭한다. 위와 같은 윈도우가 하나 뜨면Target Variable에다가 log_sales라고 입력하고Numeric Expression에다 Ln(sales)라고 입력한다. Ln()함수는 밑이 e인 자..
Bivariate correlations은 우리말로 상관분석. 두 개의 scale 또는 ordinal 변수 사이에 pairwise associations을 보는 것이며 상관계수가 행렬 형태로 표시된다. 예를들어 자동차 판매원이 자동차를 판매할때 사는 사람의 선호도를 조사하면서 자동차 판매댓수와 자동차연료효율과의 관계를 알고자할때 사용될수 있다. 단순히 상관관계를 계산만 하는 것은 쉽지만 본 사용설명서에서는 아래와 같은 추가적인 작업을 수행하는 것을 알아보기로 한다. outlier가 있을 경우 제거하여 correlation의 p-value가 어떻게 달라지는지를 알아보고 정규분포가 아닐 경우 log-transform을 하여 데이터 가운데 어떤변수가 통계적으로 의미있는 상관관계가 있는지를 찾아보는 과정을 설명..
실험디자인으로 나온 데이터 종류별로 parametric test(모수검정)와 nonparametric test(비모수검정)하는 방법을 비교하여적어보았다. 아래 표를 보면 non-parametric test할때 뭘 적용해야할지 잘 알수 있다. Parametric Test Data Non-Parametric Test Data One sample t-test Interval Wilcoxon Sign Rank Test Ordinal / Interval(skewed) Two sample t-test Interval Mann-Whitney U Test Ordinal / Interval(skewed) Paired t-test Interval Wilcoxon Sign Rank Test Ordinal / Interval..
Contrast를 써서 특정한 그룹끼리 얼마나 다른지 비교하는 것보다는 모든 그룹의 조합을 생성해서 그 그룹들끼리 얼마나 다른지 볼수도 있다. 우선 아래 CSV 파일을 받아서 SPSS에서 불러들인다. 제대로 수행했다면 아래와 같이 나타남.. 신입사원을 교육하는데 그룹별로 다른 교육방식으로 교육시키고 그 그룹들이 어떻게 다른 수행결과를 가지는지 시험한 데이터이다. group은 서로다른 교육을 받은 교육그룹이고 perform은 수행결과를 숫자로 나타낸 것이다. 이제 이 데이터를 가지고 one-way ANOVA를 수행하여보자.Analyze > Compare Means > One-Way ANOVA... 를 클릭한다. 아래와 같은 창이 뜨면 ANOVA 수행을 하기 위하여 변수들을 지정한다. Dependent li..