728x90
R은 통계프로그래밍 언어로 일반인이 사용하기 쉽게 만든 언어이다.
그러나 필자는 프로그래머이고 비 프로그래머의 인식으로 접근하기 힘든면이 있다.
강의 또한 그러하다. 강의 곳곳에 프로그래머적인 시선이 들어있으니 참고하여 필요없으면 넘겨라.
참고:
샤피로-윌크 검정은 해당 데이터가 정규분포를 따르는지이다.
통계이서 정규분포를 따른다는것은 매우 중요하다.
동전던지기나 주사위 굴리기등역시 정규분포를 따르며 정규분포를 따른다는것의 의미는 일반적인 모델이라는 뜻이다.
샤피로 윌크 검정은 정규분포가 아닐것이라 가정하고 하는것이다.
p-value가 0.05를 넘어가면 정규분포의 모습이 이라고 결론짓게되며
반대의 경우에는 정규분포가 아니라고 보는 것이다.
저번 데이터 셋을 그대로 이용한다. data.go.kr에서 다운받았다.
ds <- read.csv('1-2-1-2. 시간대별_관광객_지번(PNU)단위_유동인구_비율포함_201410.csv')
print(result<-shapiro.test(ds$X02시.03시.유동인구[1:5000]))
이 검정의 데이터셋은 3~5000개 사이로 고정되어있다. 넘어가면 잘라주어야하고 부족하면 못한다.
실행결과를 보자.
검정결과 0.05이하로 나오므로 2시~3시의 유동인구는 정규분포를 따른다고 할 수 없다.
'Programming > R' 카테고리의 다른 글
[R-27]T-test(t.test) (0) | 2017.11.21 |
---|---|
[R-26]히스토그램(hist) (0) | 2017.11.21 |
[R-24]콜모고로프-스미노프검정(ks.test) (1) | 2017.11.20 |
[R-23]카이제곱검정(chisq.test), 피셔검정(fisher.test) (0) | 2017.11.20 |
[R-22]그룹화(plyr) (0) | 2017.11.20 |