일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 기자조선
- linear regression
- 태그를 입력해 주세요.
- 후한서
- 선형회귀분석
- 독사방여기요
- ANOVA
- 히스토그램
- 창평
- 패수
- 한서
- 지리지
- Histogram
- t test
- repeated measures ANOVA
- 한서지리지
- 풍백
- 고구려
- 유주
- R
- 통계
- 낙랑군
- post hoc test
- categorical variable
- spss
- 신라
- 통계학
- 기자
- 우분투
- 단군
- Today
- Total
목록과학과 기술 (233)
獨斷論
http://dogmas.tistory.com/365에서 했던 파일을 다시 열고이제 outlier가 제거된 carsales.sav를 가지고 bivariate correlation을 구해보도록 하자.한가지 유의해야할 점은 F-series라는 모델이 outlier 상에 존재함에도 불구하고 아직 연구중이라는 이유로 데이터에 포함시켰으므로 skewness를 가진 데이터이다. 이때는 log transform을 해야만 한다. Log transform 실행하기 Transform > Compute Variables...를 클릭한다. 위와 같은 윈도우가 하나 뜨면Target Variable에다가 log_sales라고 입력하고Numeric Expression에다 Ln(sales)라고 입력한다. Ln()함수는 밑이 e인 자..
Bivariate correlations은 우리말로 상관분석. 두 개의 scale 또는 ordinal 변수 사이에 pairwise associations을 보는 것이며 상관계수가 행렬 형태로 표시된다. 예를들어 자동차 판매원이 자동차를 판매할때 사는 사람의 선호도를 조사하면서 자동차 판매댓수와 자동차연료효율과의 관계를 알고자할때 사용될수 있다. 단순히 상관관계를 계산만 하는 것은 쉽지만 본 사용설명서에서는 아래와 같은 추가적인 작업을 수행하는 것을 알아보기로 한다. outlier가 있을 경우 제거하여 correlation의 p-value가 어떻게 달라지는지를 알아보고 정규분포가 아닐 경우 log-transform을 하여 데이터 가운데 어떤변수가 통계적으로 의미있는 상관관계가 있는지를 찾아보는 과정을 설명..
간단한 그래프 그리기 (Matlab 사용설명서 3) Matlab에서 제공하는 그래프 그리는 기능 중에 간단한 plot() 함수만 알아보자. Line plots가장 많이 사용하는 것은 line plots인데 plot()를 이용한다. sine 함수를 그려보면우선 x값으로 0에서 2pi까지 100개로 나누고각각의 x값에 대해 y에 sin(x)를 대입하고 세로축을 y로, 가로축을 x로 그리면 된다. >> x = 0:pi/100:2*pi; >> y = sin(x); >> plot(x,y) 위와 같이 하면 아래와 같은 그래프가 얻어진다. 그래프가 뭔가 좀 허전한데x축의 label과 y의 label과 그래프 이름이 없다.아래와 같이 수행하면 그래프가 허전하지 않을 것이다. 그래프의 선의 색을 빨갛게 하고 선의 형태를..
배열array의 원소element 참조 (Matlab 사용설명서 2) 앞서 만든 배열이나 행렬의 원소를 참조 또는 인덱싱indexing하는 방법에 대해서 알아보기로 하자.우선 아래와 같이 4x4 행렬을 만든다. >> A = magic(4); >> A A = 16 2 3 13 5 11 10 8 9 7 6 12 4 14 15 1 위 행렬에서 4행 3열을 알아내기 위해서는 어떻게 할까?답은 간다.>> A(4,3) ans = 15 위 행렬의 크기를 잘 몰라서 4x4 범위 밖에 값을 대입하면 어떤 결과를 가져올까?>> A(4,5) = 7 A = 16 2 3 13 0 5 11 10 8 0 9 7 6 12 0 4 14 15 1 7 에러 처리를 하지 않고 5번째에 열을 하나 더 더하고 (4,5)에 7을 대입하고 나머지..
행렬matrix와 배열array 만들기와 연산 (Matlab 사용설명서 1) 배열(array)이란 1차원 이상의 변수를 말하는데특히 2차원 배열을 행렬matrix이라고 matlab에서는 규정하고 있다(수학에서는 그렇지 않다). 배열 생성 원소element가 4개인 일차원 배열을 만들려면 아래와 같이 한다. 이렇게하면 행벡터가 만들어진다. >> a = [1 2 3 4]; >> a a = 1 2 3 4 Console에서도 할수도 있고 Editor를 써서 m-file로 저장한 후에 console에서 실행해도 된다. 열벡터를 만들려면 아래와 같이 한다. >> b = [1; 2; 3; 4]; >> b b = 1 2 3 4 행렬은 아래와 같이 만든다.>> c = [1 2 3; 4 5 6; 7 8 10]; >> c ..
실험디자인으로 나온 데이터 종류별로 parametric test(모수검정)와 nonparametric test(비모수검정)하는 방법을 비교하여적어보았다. 아래 표를 보면 non-parametric test할때 뭘 적용해야할지 잘 알수 있다. Parametric Test Data Non-Parametric Test Data One sample t-test Interval Wilcoxon Sign Rank Test Ordinal / Interval(skewed) Two sample t-test Interval Mann-Whitney U Test Ordinal / Interval(skewed) Paired t-test Interval Wilcoxon Sign Rank Test Ordinal / Interval..
Contrast를 써서 특정한 그룹끼리 얼마나 다른지 비교하는 것보다는 모든 그룹의 조합을 생성해서 그 그룹들끼리 얼마나 다른지 볼수도 있다. 우선 아래 CSV 파일을 받아서 SPSS에서 불러들인다. 제대로 수행했다면 아래와 같이 나타남.. 신입사원을 교육하는데 그룹별로 다른 교육방식으로 교육시키고 그 그룹들이 어떻게 다른 수행결과를 가지는지 시험한 데이터이다. group은 서로다른 교육을 받은 교육그룹이고 perform은 수행결과를 숫자로 나타낸 것이다. 이제 이 데이터를 가지고 one-way ANOVA를 수행하여보자.Analyze > Compare Means > One-Way ANOVA... 를 클릭한다. 아래와 같은 창이 뜨면 ANOVA 수행을 하기 위하여 변수들을 지정한다. Dependent li..
앞서 one-way ANOVA를 수행한 결과를 먼저 보면 (http://dogmas.tistory.com/350) 가장 높은 점수를 준 그룹은 3번과 4번인데 과연 3번과 4번이 서로 차이가 있는지 궁금해 할수도 있다. 만약 통계적으로 3과 4가 다르지 않다면 가장 많은 점수를 준 그룹은 3과 4라고 해야할 것이고 3과 4가 통계적으로 다르다면 가장 많은 점수를 준 그룹은 4라고 해야할 것이다. 이제 3과 4가 서로 다른지 contrast를 써서 알아보자. 데이터 파일은 앞서 사용한 dvdplayers.csv를 이용한다. One-way ANOVA와 똑같이 아래 순서로 우선 클릭한다. Analyze > Compare Means > One-Way ANOVA...그러면 아래와 같이 창이 뜬다. 우선 ANOVA..