일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- categorical variable
- repeated measures ANOVA
- R
- t test
- 패수
- 히스토그램
- 우분투
- 신라
- 후한서
- 지리지
- 고구려
- 기자조선
- 유주
- 한서
- 단군
- 통계
- 태그를 입력해 주세요.
- post hoc test
- 한서지리지
- 기자
- linear regression
- 독사방여기요
- 통계학
- ANOVA
- 선형회귀분석
- 낙랑군
- Histogram
- spss
- 풍백
- 창평
- Today
- Total
목록과학과 기술/SPSS (61)
獨斷論
http://dogmas.tistory.com/409에서 데이터축소(data reduction)는 주성분분석(PCA, principal component analysis)에 해당되고 구조검출(structure detection)은 인자분석(factor analysis)에 해당된다고 하였지만 SPSS에서 메뉴는 오직 Factor Analysis 밖에 없기때문에 여기 제목이 데이터축소를 위한 인자분석이라고 달아 놓았다. 이제 우리가 실행하려는 문제를 알아보자. 자동차회사에서 자동차판매량에 대한 조사를 하려고 할때 변수가 너무 많아 어려움을 겪고 있다고 가정하자. 이때 데이터가 가진 정보는 그대로 유지하면서 변수의 갯수를 줄인다면 효과적으로 분석을 실행할수 있을 것이다. 이때 사용할수 있는 것이 Factor ..
Factory analysis는 우리말로 인자분석 또는 요인분석이라고 하고, principal component analysis(PCA)는 주성분분석이라고 한다. 이들 분석의 주요한 목적은 데이터의 차원 즉 서로 의존적인 변수의 갯수를 줄이는데 그 주요한 목적이 있다. 변수를 줄이는데 사용되는 방법은 주로 linear combination을 이용하는데 linear combination으로 나온 새로운 변수 즉 잠재변수(latent variable)들이 선형독립이면 PCA라 말하고 latent variable이 선형독립이 아니면 factory analysis라고 말한다. 따라서 factor analysis으로 나온 latent variable은 실재로 존재할수 있는 변수이지만 PCA로 나온 latent v..
http://dogmas.tistory.com/393에서 식료품체인점에 대한 이원분산분석(two-way ANOVA)을 실행했었다. 이때 fixed factor만 고려했었는데 이제 식료품체인점 분석에서 random factor를 하나더 고려하여보자. Random factor에 대해서는 http://dogmas.tistory.com/392를 참고하면 된다. 본 사용설명서에서 하고자 하는 분석은 식료품체인점에서 소비하는 돈의 양이 쿠폰의 종류와 누구와 함께 물건구매를 하는지에 영향을 받는지 알아보고자 한다. 그런데 식료품 체인점은 전국적으로 퍼져위치해 있고 이들 체인점에대한 모든 데이터를 가지고 분석을 하지 않고 무작위로 뽑은 데이터만 가지고 분석을 하므로 체인점의 위치를 random factor로 고려하여야..
이제 공분산분석ANCOVA를 SPSS에서 실행하여보자 ANCOVA란 analysis of covariance의 약자이다. 앞서 배웠던 ANOVA는 analysis of variance의 약자이다. ANCOVA를 공분산분석이라 하지 않고 공변량분석이라고 하는 사람도 있다. 공분산분석ANCOVA란 간단히 말해서 두 개의 선형회귀분석한 예측값을 이은 선 두개가 서로 얼마나 다른지 비교하는 것이다. 아래 그림을 보면 이해하기가 쉽다. 아래 그림은 두 동물 집단의 심장박동수를 측정한 가상의 데이터를 그래프로 나타낸 것이다. Group1과 Group2는 두 동물집단사이에 심장박동수의 큰 차이가 보이지를 않는다. 하지만 이 두 동물집단은 주위 온도에 따라 심장박동수가 달라진다고 한다면 주위 온도와 심장박동을 그래프로..
이원분산분석(Two-way ANOVA)는 fixed factor가 2개, 즉 범주형독립변수가 2개이고 연속형종속변수가 1개인 분산분석ANOVA를 의미한다. 예를 들어보면... 식료품체인점에서 제품구매형태에 대하여 조사하여, 성별에 따른 제품구매 주기와 구매액에 대한 관계를 알아보려고 한다고 가정해보자. 우선 아래 파일을 받아서 SPSS에서 읽은 후에 grocerysales.sav로 저장하자. 제대로 읽었다면 아래와 같은 형태가 된다. custid는 고객을 숫자로 나타낸 것이고gender는 성별을 나타내며style은 얼마나 자주 물건을 사러가는지를 나타내는데 1은 2주일에 한번가는 것이고 2는 1주일에 1번 가는 것이며 3은 할인품목이 있을때마다 자주가는 것을 의미한다. amtspent는 구매량을 돈으로 ..
General linear model을 우리말로는 일반선형모델..이름이 비슷한 generalized linear model과 헷갈릴수가 있는데... 차이는 분명하다. 일반선형모델 General linear model 일반화선형모델 Generalized linear model 모델구하는 수학적 방법 Least squares Best linear unbiased prediction Maximum likelihood Bayesian 이 부류에 속하는 통계방법들 ANOVA ANCOVA MANOVA MANCOVA Linear regression Mixed model Linear regression Logistic regression Poisson regression Gamma regression SPSS에서 사용..
Stepwise linear regression를 우리말로는 단계적선형회귀라고 한다. 이 방법은 선형회귀를 수행할때 우리가 임으로 독립변수를 선택하는 것이 아니라 알고리즘에 의해서 독립변수를 자동적으로 선택하는 방법이다. 요즘은 데이터가 너무 방대하다. observation도 많을뿐만 아니라 변수도 많다. 하나의 종속변수에 대한 선형회귀모델을 만들때 데이터에 있는 모든 변수를 독립변수로 사용하여 선형회귀모델을 작성하면 overfitting이 되서 모델이 정확하지 못하다. 또한 그렇다고 하여 너무 적은 숫자의 독립변수를 이용하여 선형회귀모델을 만들면 예측력이 떨어진다. 어떻게하면 적절한 독립변수를 선택하여 선형회귀모델을 만들수 있을까?자동적으로 해주는 방법이 여기서 이야기하고자 하는 stepwise lin..
z-transform을 이용한 선형회귀분석에서도 공선성 문제를 해결하지 못하였다.이제 Factor componet scores를 이용하여 공선성 문제를 해결하여 보자. Factor analysis는 나중에 다룰 것인데 여기서는 단순히 독립변수를 선형조합을 하여, 즉 (f1 = a*x1 + b*x2 + ...) 같은 것을 수행하여 변수들간에 상관관계를 없앤다고만 알아두면 된다. Factor Analysis 수행하기 이제 Factor analysis를 수행하여보자. 데이터파일은 역시 car_sales2.csv인데 http://dogmas.tistory.com/377에 가면 있다. Analyze > Dimension Reduction > Factor...를 클릭한다.Variables에 z-transform한 ..