일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 히스토그램
- 유주
- post hoc test
- 독사방여기요
- spss
- 통계
- 태그를 입력해 주세요.
- 통계학
- 선형회귀분석
- categorical variable
- Histogram
- linear regression
- 낙랑군
- 기자
- R
- 단군
- 창평
- 우분투
- 한서지리지
- 후한서
- 기자조선
- 지리지
- 고구려
- repeated measures ANOVA
- 신라
- t test
- 패수
- 풍백
- 한서
- ANOVA
- Today
- Total
목록과학과 기술 (233)
獨斷論
http://dogmas.tistory.com/410에서 주성분분석(principal component analysis, PCA)을 이용하여 데이터축소(data reduction)를 하는 방법에 대해서 알아보았다. 제목은 인자분석(factor analysis)이라고 달아놓았지만 이는 SPSS에서 메뉴구성상 인자분석이라고 했을뿐 이는 정확히 말하면 주성분분석이다. 여기서는 이제 factor analysis를 이용하여 데이터의 구조파악(structure detection)을 하는 방법에 대해서 알아보자. 주성분분석과 똑같이 SPSS에서 factor analysis를 이용하지만 축회전과 factor extraction 방법만 다를뿐이다. 이제 풀고자 하는 문제에 대해서 알아보자. 통신회사에서 여러가지 통신요금..
http://dogmas.tistory.com/409에서 데이터축소(data reduction)는 주성분분석(PCA, principal component analysis)에 해당되고 구조검출(structure detection)은 인자분석(factor analysis)에 해당된다고 하였지만 SPSS에서 메뉴는 오직 Factor Analysis 밖에 없기때문에 여기 제목이 데이터축소를 위한 인자분석이라고 달아 놓았다. 이제 우리가 실행하려는 문제를 알아보자. 자동차회사에서 자동차판매량에 대한 조사를 하려고 할때 변수가 너무 많아 어려움을 겪고 있다고 가정하자. 이때 데이터가 가진 정보는 그대로 유지하면서 변수의 갯수를 줄인다면 효과적으로 분석을 실행할수 있을 것이다. 이때 사용할수 있는 것이 Factor ..
Factory analysis는 우리말로 인자분석 또는 요인분석이라고 하고, principal component analysis(PCA)는 주성분분석이라고 한다. 이들 분석의 주요한 목적은 데이터의 차원 즉 서로 의존적인 변수의 갯수를 줄이는데 그 주요한 목적이 있다. 변수를 줄이는데 사용되는 방법은 주로 linear combination을 이용하는데 linear combination으로 나온 새로운 변수 즉 잠재변수(latent variable)들이 선형독립이면 PCA라 말하고 latent variable이 선형독립이 아니면 factory analysis라고 말한다. 따라서 factor analysis으로 나온 latent variable은 실재로 존재할수 있는 변수이지만 PCA로 나온 latent v..
http://dogmas.tistory.com/393에서 식료품체인점에 대한 이원분산분석(two-way ANOVA)을 실행했었다. 이때 fixed factor만 고려했었는데 이제 식료품체인점 분석에서 random factor를 하나더 고려하여보자. Random factor에 대해서는 http://dogmas.tistory.com/392를 참고하면 된다. 본 사용설명서에서 하고자 하는 분석은 식료품체인점에서 소비하는 돈의 양이 쿠폰의 종류와 누구와 함께 물건구매를 하는지에 영향을 받는지 알아보고자 한다. 그런데 식료품 체인점은 전국적으로 퍼져위치해 있고 이들 체인점에대한 모든 데이터를 가지고 분석을 하지 않고 무작위로 뽑은 데이터만 가지고 분석을 하므로 체인점의 위치를 random factor로 고려하여야..
이제 공분산분석ANCOVA를 SPSS에서 실행하여보자 ANCOVA란 analysis of covariance의 약자이다. 앞서 배웠던 ANOVA는 analysis of variance의 약자이다. ANCOVA를 공분산분석이라 하지 않고 공변량분석이라고 하는 사람도 있다. 공분산분석ANCOVA란 간단히 말해서 두 개의 선형회귀분석한 예측값을 이은 선 두개가 서로 얼마나 다른지 비교하는 것이다. 아래 그림을 보면 이해하기가 쉽다. 아래 그림은 두 동물 집단의 심장박동수를 측정한 가상의 데이터를 그래프로 나타낸 것이다. Group1과 Group2는 두 동물집단사이에 심장박동수의 큰 차이가 보이지를 않는다. 하지만 이 두 동물집단은 주위 온도에 따라 심장박동수가 달라진다고 한다면 주위 온도와 심장박동을 그래프로..
기본적인 명령어들 (Matlab 설명서 5) 여기서는 기본적인 간단한 명령어들이나 개념들을 지루하게 열거해보도록 하겠다. ans 이건 명령어라기보다는 변수명이라고 하는것이 편하겠다. 바로 실행한 결과를 저장해두는 곳. clccommand window의 내용을 모두 지워버린다. 깨끗하게 clear allWorkspace에 있던 모든 변수를 지워버린다. 일종의 변수 초기화... 줄바꿈편집기에서 줄바꿈을 하고자 할때는 점을 세 개 찍고 엔터하면 한 줄로 인식한다. s = 1 - 1/2 + 1/3 - 1/4 + 1/5 ... - 1/6 + 1/7 - 1/8 + 1/9; mystring = ['Accelerating the pace of ' ... 'engineering and science']; 실행중지Scri..
이원분산분석(Two-way ANOVA)는 fixed factor가 2개, 즉 범주형독립변수가 2개이고 연속형종속변수가 1개인 분산분석ANOVA를 의미한다. 예를 들어보면... 식료품체인점에서 제품구매형태에 대하여 조사하여, 성별에 따른 제품구매 주기와 구매액에 대한 관계를 알아보려고 한다고 가정해보자. 우선 아래 파일을 받아서 SPSS에서 읽은 후에 grocerysales.sav로 저장하자. 제대로 읽었다면 아래와 같은 형태가 된다. custid는 고객을 숫자로 나타낸 것이고gender는 성별을 나타내며style은 얼마나 자주 물건을 사러가는지를 나타내는데 1은 2주일에 한번가는 것이고 2는 1주일에 1번 가는 것이며 3은 할인품목이 있을때마다 자주가는 것을 의미한다. amtspent는 구매량을 돈으로 ..
General linear model을 우리말로는 일반선형모델..이름이 비슷한 generalized linear model과 헷갈릴수가 있는데... 차이는 분명하다. 일반선형모델 General linear model 일반화선형모델 Generalized linear model 모델구하는 수학적 방법 Least squares Best linear unbiased prediction Maximum likelihood Bayesian 이 부류에 속하는 통계방법들 ANOVA ANCOVA MANOVA MANCOVA Linear regression Mixed model Linear regression Logistic regression Poisson regression Gamma regression SPSS에서 사용..