일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 신라
- R
- 기자조선
- Histogram
- 단군
- categorical variable
- post hoc test
- 한서지리지
- spss
- 통계학
- 태그를 입력해 주세요.
- 패수
- 풍백
- linear regression
- 고구려
- 선형회귀분석
- 독사방여기요
- 한서
- 지리지
- 후한서
- 우분투
- 기자
- repeated measures ANOVA
- t test
- 히스토그램
- 통계
- ANOVA
- 낙랑군
- 유주
- 창평
- Today
- Total
목록과학과 기술 (233)
獨斷論
Logistic Regression에 대한 간단한 설명 Linear regression은 종속변수가 일정한 양을 나타낼 경우가 대부분이지만 종속변수가 0과 1만을 갖는 변수일때에는 logistic regression을 사용하는 것이 좋다. 예를들면, 어떤 대학교 법과대학을 졸업한 학생을 대상으로 학점, 재산, 나이, 사법고시 합격 여부를 조사한다면 학점과 재산과 나이는 일정한 양을 나타내지만 사법고시 합격 여부는 합격은 1로 나타내고 불합격은 0으로 나타내는 binary variable이 된다. 다음과 같은 선형 모델을 생각해보자. 여기서 Y는 0과 1만을 갖는 종속변수이고, x는 독립변수이며, e는 에러를 나타낸다. Y가 Bernoulli random variable이고 확률은 다음과 같다고 가정해보자..
SPSS 사용법 - Hierarchical Multiple Regression (계층적 다중회귀) Hierarchical multiple regression은 multiple regression의 변형이다. Multiple regression은 여러개의 독립변수를 선택하여 독립변수를 제거하거나 선택하지 않았다. Stepwise regression은 여러개의 독립변수를 수학적 알고리즘에 의하여 제거하거나 선택하여 최종 결과를 얻었다. 하지만 Hierarchical multiple regression은 여러개의 독립변수를 임으로적으로 차례로 더해가면서 regression한 결과를 비교하여 최종모델을 선택하는 것이다. 먼저 regression에 사용될 데이터파일을 http://dogmas.tistory.com..
SPSS 사용법 - Stepwise Regression (단계적 회귀분석) 앞서 multiple linear regression에서 독립변수를 많이 사용하면 사용할수록 fitting의 결과는 좋아질수 밖에 없다. 하지만, 여러개의 독립변수를 선택하여 무작정 linear regression을 수행하다보면 모델이 유의미하더라도 overfitting이 될 가능성이 농후하다. 따라서 독립변수를 너 많이 선택하지 않고 linear regression의 결과가 유의미하도록 multiple linear regression을 수행하는 것이 중요하다. 이를 위하여 stepwise regression을 하는 경우가 있는데 stepwise regression은 데이터에 있는 여러개의 독립변수 중에 최소의 독립변수를 선택하여..
SPSS 사용법 - Multiple Linear Regression (다중회귀분석) Dependent variable(종속변수)가 하나이고 independent variable(독립변수)가 여러개인 linear regression(회귀분석)을 multiple linear regression(다중회귀분석)이라고 한다. 아래와 같은 식을 사용한다. y = b0 + b1*x1 + b2*x2 + ... + bk * xk 이를 수행하기 위하여 아래 첨부된 파일을 다운받아 SPSS에서 연다. SPSS파일이 아니라 쉼표로 변수를 나눈 파일이므로 적절한 방법으로 열어아 한다. 첩부파일: 이 파일을 제대로 연다면 아래와 같이 나타날 것이다. 모든 변수는 Numeric과 Scale로 지정해 주어야 한다. 위 데이터의 각 ..
SPSS 사용법 - Linear Regression 결과 그래프 Linear regression(선형회귀)의 결과를 그래프로 나타내어 보자. 우선 http://dogmas.tistory.com/135에서 사용한 SPSS파일을 연다. 그리고 "Graphs >> Legacy Dialogs >> Scatter/Dot "를 클릭하면 다음과 같은 대화창이 뜬다. 여기서 "Simple Scatter"를 클릭한 후에 "Define"을 클릭하면 아래와 같은 대화창이 나타난다. Y Axis에 babymort를 지정하고 X Axis에 fertility를 지정한 후에 OK를 클릭하면 아래와 같은 그래프를 얻는다. 이제 Scatter plot위에 linear regression한 결과를 그리기 위하여 그래프 영역 내를 두번클..
SPSS 사용법 - Linear Regression 선형회귀 우선 첨부된 파일을 다운받아 SPSS에서 연다. 첨부파일 : 데이터의 변수중에 babymort는 유아치사도를 나타내는 변수이고, fertility는 출생율을 나타내는 변수이며 observation은 전세계 국가이다. 이제 이 두 변수가 서로 연관이 있는지 linear regression을 사용하여 알아보도록 하자. Linear regression은 간단하게 아래와 같은 식에서 x와 y의 데이터값을 지정해주고 b0(표준편차)와 b1(기울기)을 구하는 것이다. 우선 "Analyze >> Regression >> Linear"를 선택하면 아래와 같은 대화상자가 나타난다. 위 그림과 같이 depdendent와 independent를 지정한 후에 OK를..
Chi-squared 검정법은 2개 이상의 categorical 변수의 상관관계를 따지는데 유용한 방법이다. 우선 아래와 같이 SPSS에서 변수값을 입력하도록 하자. 여기서 두 변수의 Type은 모두 Numeric으로 해야하며 Measure는 Nominal로 한다. Treatment는 각 환자가 어떻한 처치를 받았는지를 나타내고 Problem은 각 환자의 병증을 나타낸다. 문자로 나타낼수도 있지만 chi-square test를 위하여 숫자로 나타낸 것이다. 문제는 환자의 병증에 따라 처치방법을 어떻게 달리하였는지 아니면 이와 상관없이 처지를 하였는지 보는 것이다. 만약 이 두 변수가 독립이면 두 변수사이에 상관관계가 없는 것이며 독립이 아니면 병증에 따라 처치 방법을 달리하였다는 것을 알수있다. 이제 "..
범주형변수의 Pearson Chi 제곱 검정법 Pearson's Chi-Squared Test for Categorical Variables Categorical variables(범주형 변수)을 사용하여 수집된 데이터를 분석하는데에는 contingency table(분할표)이 아주 유용하다. 예를 들어 아래와 같이 각 성별에 따른 정치성향을 수집하였다고 하면 contingency table을 이용하여 그 결과를 표시할수 있다. 표 1. 각 성별에 따른 정치성향 성별 정치성향 총합 민주당 지지정당없음 새누리당 여성 573 516 422 1511 남성 386 475 399 1260 총합 959 991 821 2771 한편 위 표1의 데이터를 백분율로 표시할 수도 있다. 표2. 각 성별에 따른 정치성향(백분..