728x90

R은 통계프로그래밍 언어로 일반인이 사용하기 쉽게 만든 언어이다.

그러나 필자는 프로그래머이고 비 프로그래머의 인식으로 접근하기 힘든면이 있다.

강의 또한 그러하다. 강의 곳곳에 프로그래머적인 시선이 들어있으니 참고하여 필요없으면 넘겨라.


참고:

[개발환경 셋팅하기]R설치 및 환경변수 등록-(1)

[개발환경 셋팅하기]RStudio설치-(2)

[개발환경 셋팅하기]RStudio프로젝트 만들기-(3)


샤피로-윌크 검정은 해당 데이터가 정규분포를 따르는지이다.

통계이서 정규분포를 따른다는것은 매우 중요하다.

동전던지기나 주사위 굴리기등역시 정규분포를 따르며 정규분포를 따른다는것의 의미는 일반적인 모델이라는 뜻이다.

샤피로 윌크 검정은 정규분포가 아닐것이라 가정하고 하는것이다.

p-value가 0.05를 넘어가면 정규분포의 모습이 이라고 결론짓게되며

반대의 경우에는 정규분포가 아니라고 보는 것이다.



저번 데이터 셋을 그대로 이용한다. data.go.kr에서 다운받았다.


ds <- read.csv('1-2-1-2. 시간대별_관광객_지번(PNU)단위_유동인구_비율포함_201410.csv')

print(result<-shapiro.test(ds$X02시.03시.유동인구[1:5000]))


이 검정의 데이터셋은 3~5000개 사이로 고정되어있다. 넘어가면 잘라주어야하고 부족하면 못한다.

실행결과를 보자.



검정결과 0.05이하로 나오므로 2시~3시의 유동인구는 정규분포를 따른다고 할 수 없다.

'Programming > R' 카테고리의 다른 글

[R-27]T-test(t.test)  (0) 2017.11.21
[R-26]히스토그램(hist)  (0) 2017.11.21
[R-24]콜모고로프-스미노프검정(ks.test)  (1) 2017.11.20
[R-23]카이제곱검정(chisq.test), 피셔검정(fisher.test)  (0) 2017.11.20
[R-22]그룹화(plyr)  (0) 2017.11.20

+ Recent posts