728x90
반응형
대응표본 t 검정이란 특정한 사람이 두 그룹에 모두 속하는 경우
예시로 중간고사와 기말고사의 시험 결과를 본 학생이 있을 수 있다.
두 결과가 모두 같은 사람에게서 나왔기 때문
before, after 개념
t검정과의 차이는 대응표본 t검정같은 경우 before, after의 차이를 계산한다
그리고 t검정에는 분산 동질성 검사가 없고 정규성 검정이후에 바로 T test를 시행하여 결론을 낸다
그 이유는 집단간의 차이를 구하기 때문에 각각의 집단의 분포를 볼 필요가 없다.
만약 집단이 2개 이상이라면 분산 동질성 검사를 하여 분산이 동일한지 체크하여야 한다.
1. 가설 설정
r <- read.csv('Data/htest02d.csv', header = T)
#결과값
before after
1 20000 40000
2 1000 32000
3 30000 70000
4 4000 3000
5 8000 15000
6 7000 15000
7 2000 10000
8 6000 7000
9 12000 30000
10 15000 16000
mean(a)
mean(b)
#결과값
> mean(a)
[1] 10500
> mean(b)
[1] 23800
위의 데이터를 토대로 귀무가설은 after와 before의 평균 판매량은 차이가 없다는 것으로 설정하고 대립가설은 차이가 있다는 것으로 설정한다.
2. 정규성 검사
대응표본 검사이기 때문에 두 집단의 차이값을 기준으로 정규성 검사를 시행한다.
#두개의 차이를 구한다
d = a - b
shapiro.test(d)
qqnorm(d)
qqline(d)
#결과값
W = 0.88826, p-value = 0.1621
p value가 0.05보다 큼으로 데이터셋이 정규분포를 이룬다고 볼 수 있다.
3. T - test
#대응표본 t 검정이므로 paired를 사용
t.test(a, b, alternative = 'less', paired = T)
#결과값
data: a and b
t = -3.0637, df = 9, p-value = 0.006745
p value가 0.05보다 작으므로 대립가설이 맞다는 것을 확인할 수 있다.
- after의 매출판매액 평균값이 before 평균값보다 크다.
728x90
반응형
'R - 통계 언어' 카테고리의 다른 글
R로하는 머신러닝 - Logistic 회귀분석 (0) | 2022.06.04 |
---|---|
R을 사용하여 가설검정하기 - Z 검정 (0) | 2022.06.02 |
R을 사용하여 가설검정하기 - T 테스트 (0) | 2022.06.01 |
R 데이터 내 이상치, 극단치 제거하는 법 (0) | 2022.06.01 |
R 결측치 찾기, 결측치 제거, 결측치 생성, 결측치 대체하기 (1) | 2022.06.01 |