본문 바로가기
R/R 예제

1.정규성 검정(Normality Test)

by 자유데이터 2019. 2. 14.
반응형
정규성 검정(Normality Test)

목차


0.데이터 불러오기


1.정규성 검정이란


2.중요한 두 법칙


3.정규성 검정 시각화


4.Shapiro-Wilk 검정




0.데이터 불러오기

my.data <- ToothGrowth

str(my.data)
## 'data.frame':    60 obs. of  3 variables:
##  $ len : num  4.2 11.5 7.3 5.8 6.4 10 11.2 11.2 5.2 7 ...
##  $ supp: Factor w/ 2 levels "OJ","VC": 2 2 2 2 2 2 2 2 2 2 ...
##  $ dose: num  0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 ...

R에 있는 기본 데이터셋인 ToothGrowth를 불러온다.

3개의 변수와 60개의 관측치가 있다.


1.정규성 검정이란

데이터셋의 분포가 정규분포를 따르는지 검정하는 것을 말한다.

데이터셋이 정규분포를 따라야, 다양한 분석 이론을 적용시킬 수 있다.

만일, 정규분포를 따르지 않는다면 데이터 먼징하거나 비모수적 방법을 사용한다.

2.중요한 두 법칙

다음 두 법칙으로 인해, 대표본(n>=30)인 경우 데이터셋은 정규분포를 따른다.


중심극한의 정리(C.L.T - Central Limit Theorem)

1.표본의 평균은 표본의 크기가 커질수록, 정규분표와 유사해진다.

2.모집단이 정규분포하지 않더라도 표본의 크기가 충분히 크다면, 정규분포라고 가정할 수 있다. 


대수의 법칙

1.표본의 크기가 증가할수록, 통계적 추정의 정밀도가 향상된다는 것을 수학적으로 증명

2.표본의 크기가 커짐에 따라 표본에서 계산한 평균값과 모집단의 실제평균과의 차이가 매우 작아진다.



3.정규성 검정 시각화

1)ggdensity

library(ggpubr)
ggdensity(my.data$len,
          add = "mean",
          color = "red",
          fill = "violet red",
          alpha = .5,
          title = "Dendity plot of Tooth Length",
          xlab = "Tooth Length")


2)ggqqplot

library(ggpubr)
ggqqplot(my.data$len, color = "red")


3)qqPlot

library(car)
qqPlot(my.data$len)

## [1] 23  1

표시된 값은 이상치이다.


4)따로 그리기

qqnorm(my.data$len)
qqline(my.data$len, col =2)



4.Shapiro-Wilk 검정

귀무가설 H0 : 모집단은 정규분포를 따른다.

대립가설 H1 : 모집단은 정규분포를 따르지 않는다.

shapiro.test(my.data$len)
## 
##  Shapiro-Wilk normality test
## 
## data:  my.data$len
## W = 0.96743, p-value = 0.1091

p값이 0.05보다 크기 때문에 귀무가설 채택한다.

정규성을 따른다.




반응형

'R > R 예제' 카테고리의 다른 글

5.Unpaired Two samples T-test  (0) 2019.02.15
4.One Sample T-test  (0) 2019.02.15
3.독립성 검정(Test of Independence)  (0) 2019.02.15
2.등분산성 검정(Homogeneity of Variance Test)  (0) 2019.02.14
0.R 고급의 시작  (0) 2019.02.14

댓글