R을 사용하여 가설검정하기

R - 통계 언어

R을 사용하여 가설검정하기 - 대응표본 t 검정

티멀 2022. 6. 2. 00:05

728x90

대응표본 t 검정이란 특정한 사람이 두 그룹에 모두 속하는 경우
예시로 중간고사와 기말고사의 시험 결과를 본 학생이 있을 수 있다.
두 결과가 모두 같은 사람에게서 나왔기 때문
before, after 개념

t검정과의 차이는 대응표본 t검정같은 경우 before, after의 차이를 계산한다

그리고 t검정에는 분산 동질성 검사가 없고 정규성 검정이후에 바로 T test를 시행하여 결론을 낸다

그 이유는 집단간의 차이를 구하기 때문에 각각의 집단의 분포를 볼 필요가 없다.

만약 집단이 2개 이상이라면 분산 동질성 검사를 하여 분산이 동일한지 체크하여야 한다.

1. 가설 설정

r <- read.csv('Data/htest02d.csv', header = T)

#결과값

   before after
1   20000 40000
2    1000 32000
3   30000 70000
4    4000  3000
5    8000 15000
6    7000 15000
7    2000 10000
8    6000  7000
9   12000 30000
10  15000 16000

mean(a)
mean(b)

#결과값
> mean(a)
[1] 10500
> mean(b)
[1] 23800

위의 데이터를 토대로 귀무가설은 after와 before의 평균 판매량은 차이가 없다는 것으로 설정하고 대립가설은 차이가 있다는 것으로 설정한다.

2. 정규성 검사

대응표본 검사이기 때문에 두 집단의 차이값을 기준으로 정규성 검사를 시행한다.

#두개의 차이를 구한다
d = a - b

shapiro.test(d)
qqnorm(d)
qqline(d)

#결과값
W = 0.88826, p-value = 0.1621

p value가 0.05보다 큼으로 데이터셋이 정규분포를 이룬다고 볼 수 있다.

3. T - test

#대응표본 t 검정이므로 paired를 사용
t.test(a, b, alternative = 'less', paired = T)

#결과값
data:  a and b
t = -3.0637, df = 9, p-value = 0.006745

p value가 0.05보다 작으므로 대립가설이 맞다는 것을 확인할 수 있다.

- after의 매출판매액 평균값이 before 평균값보다 크다.

728x90

저작자표시 비영리 변경금지