일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- post hoc test
- 단군
- 한서지리지
- 기자
- 풍백
- 우분투
- ANOVA
- 고구려
- 히스토그램
- 선형회귀분석
- categorical variable
- Histogram
- repeated measures ANOVA
- 태그를 입력해 주세요.
- 신라
- 통계학
- 후한서
- 한서
- t test
- 창평
- 낙랑군
- 유주
- R
- linear regression
- 패수
- 지리지
- 독사방여기요
- 통계
- 기자조선
- spss
- Today
- Total
목록과학과 기술/R 통계 (70)
獨斷論
간단한 회귀분석(linear regression)을 베이시언(Bayesian)으로 수행하여 보자 아래 데이터 파일을 R의 working directory에 내려받은 후에 R에서 읽는다. R에서 데이터를 아래와 같이 읽어들인다 1 2 3 4 5 rm(list = ls()) setwd("d:/tmp/rcode/") regdat
패키지 설치JAGS를 먼저 컴퓨터에 설치한다. 현재 버전은 4.3.0 http://mcmc-jags.sourceforge.net/ R에서 JAGS를 사용하기 위하여 rjags를 R에 설치한다. R console에서 아래 스크립트를 실행 > install.packages("rjags") 데이터 내려받기평균과 표준편차를 알지 못하는 가상의 데이터 example1.csv를 내려받아 R의 working directory에 저장한다. JAGS 모델 작성 이제 평균과 표준편차를 모르는 표준정규분포를 따르는 example1.csv 데이터의 평균과 표준편차를 베이시언Bayesian 추론하여보자. JAGS 모델은 다음과 같다. 12345678 model { for (i in 1:N) { x[i] ~ dnorm(mu, t..

R은 버전이 바뀔때마다 라이브러리 디렉토리(폴더)도 바뀌어서 패키지 설치한걸 다시 또 설치해야하는 번거로움이 있는데 라이브러리 디렉토리를 영구적으로 지정해두면 R 버전이 업그레이드 되더라도 패키지를 다시 설치할 필요가 없다. R library 디렉토리를 영구적으로 지정하는 방법을 알아보자. notepad와 같은 편집기를 열고 아래와 같이 입력한다. 여기서 "yourname"은 자신의 윈도우 로그인 계정이름이다. .libPaths(c("C:/Users/yourname/Documents/R/Library", .libPaths())) 이 파일의 이름을 .Rprofile로 저장하는데, 주의해야할 것은 파일명이 점(.)으로 시작하고 확장자가 없다. 또한 디렉토리 표시가 역슬레쉬가 아니라 슬레쉬이다. 저장할 디렉토..
R 4.0이상은 더이상 지원하지 않는 것 같다 (2021. 2. 7) 통계소프트웨어 R은 주로 RStudio를 통합개발환경(IDE)로 사용하지만 비주얼스튜디오(visual studio)도 사용할수가 있다. 우선 Microsoft R open을 설처히야 한다. cran에서 제공하는 R과 달리 선형대수에 사용하는 수학관련된 라이브러리가 5~10배정도 빠르므로 GNU R을 사용하였을때 실행속도가 느리다면 Microsoft R Open을 사용해보는것도 좋다. Microsoft R Open 설치하기 왼쪽 링크 (https://mran.microsoft.com/download)에서 자신의 OS에 맞는걸 선택하여 클릭한다. 32bit는 제공하지 않는다. 현재 제공하는 OS는 윈도우, 우분투, 레드햇(페도라), 수세리..
단일표본 t 검정(one-sample t test)는 표본의 평균이 특정값과 같은이 비교하는 것이다. R의 MASSS 패키지에 UScrime이라는 데이터를 가지고 예를 들어보자. 기본적인 패키지가 아니므로 library(MASS)를 console에서 쳐야한다. 1 2 > library(MASS) > View(UScrime) 여기서 이용한 변수는 UScrime의 GDP라는 변수인데 1인당 소득을 달러로 표시한 것이다(1960년 기준).이제 UScrime의 GDP가 700과 같은지 알아보자 1 2 3 4 5 6 7 8 9 10 11 12 > t.test(UScrime$GDP, mu=700, alternative="two.sided") One Sample t-test data: UScrime$GDP t = -..
http://dogmas.tistory.com/537 에서 설명한 상관계수 또는 상관관계계수의 유의성을 검정할 수도 있다. 사용함수는 cor.test이고 문법은 아래와 같다. cor.test(x, y, alternative = c("two.sided", "less", "greater"), method = c("pearson", "kendall", "spearman")) x와 y는 상관관계계수의 유의성을 검정하고자 하는 벡터이고 alternative에는 대립가설(alternative hypothesis)이 무엇이냐에 따라 "two.side" 또는 "less" 또는 "greater"를 사용한다. 보통 상관관계가 있는지 없는지 따지는 것이므로 "two.side"를 많이 사용한다. 아무것도 표시하지 않으면 tw..
R에 기본데이터로 있는 state.x77을 가지고 분산공분산행렬(variance-covariance matrix)을 구하여보자. 분산공분산행렬은 간단히 공분산행렬(covariance matrix)이라고도 한다. 별 어렵지 않으니깐 아래 스크립트를 R console에 하나씩 입력하면 12345678910111213141516171819202122232425262728 > my.state.x77 head(my.state.x77) Population Income Illiteracy Life Exp Alabama 3615 3624 2.1 69.05 Alaska 365 6315 1.5 69.31 Arizona 2212 4530 1.8 70.55 Arkansas 2110 3378 1.9 70.66 Californi..
상관관계(correlation)이란 두 변수 사이에 선형관계가 어느정도 있는지를 보여주는 것인데 그 지표가 상관계수(correlation coefficient)이다. 절대값이 0과 1 사이의 값을 갖는데 0이면 선형관계가 없고 1이면 선형관계가 가장 큰것을 나타낸다. 상관계수를 구하는 함수는 cor()인데 이 함수를 이용하여 상관계수행렬(correlation coefficient matrix)도 구할수 있다. 상관계수 구하기 두 벡터 변수 사이에 상관계수를 구하려면 cor( )를 이용하는데 사용방법은 그냥 cor(x, y)하면 된다. 123456 > x y cor(x, y) [1] 0.8876614 > cor(x, y, method = "pearson") [1] 0.8876614 3번재 줄에 두 변수 사..