참고 link : https://blog.acronym.co.kr/621
https://www.youtube.com/watch?v=tpow70KGTYY - 김성범 교수님 머신러닝 pvalue 강의
+) preview 정의
모집단 : 정보를 얻고자 하는 관심대상의 전체 집단
표본 : 모집단의 부분집단 --> 랜덤하게 추출, 하지만 이때 항상 오차가 수반됨 ==> 이게 표준 오차
표본 통계량 : 샘플의 평균, 샘플의 분포
표준 오차 : Standard error (SE) 표본 통계량의 표준 편차
모집단을 이해하고 싶지만 현실적으로 불가능하다
과연 이 표본이 믿을 만한 표본인건지 알고 싶을 때 하는 분석
=> 통계적 가설 검정
0. 통계적 가설 검정
--> 표본으로부터 모집단을 추정하는 귀무가설을 세움 (모집단은 이럴 것이다~~~)
--> 귀무 가설의 진위여부를 검정하기 위해 표본으로부터 계산하는 검정 통계량을 구함
--> Pvalue를 통해 신뢰구간안에 들어가는지 (진위여부 맞는지 아닌지) 확인
가설을 기각할지 통과할지 결정
통계적 가설 검정의 3단계 (1sample t-test로 보면)
1. 귀무가설과 대립가설 설정
2. 검정통계량 결정 및 계산
3. pvalue 계산
--> 귀무가설 기각/채택 여부 확인
(예시 1. 모집단의 평균 추정으로)
1. 귀무가설과 대립 가설 설정
# 예시 모집단의 평균 구하기 - 1. 귀무가설 대립가설
귀무가설 (H0) : 모집단의 평균이 10
대립가설 (H1) : 모집단의 평균은 10이 아니다.
2. 검정 통계량 결정 및 계산
: 귀무가설이 참이라는 가정 아래 얻은 통계량
: t분포, 표분정규분포, F분포, 카이제곱분포를 사용하고 이를 일컬어 검정 통계량이라함
: 통계적 가설의 진위여부를 검정하기 위해, 표본으로부터 계산하는 통계량 --> 즉 표본 통계량을 2차 가공한 것
+) 표본 통계량과의 차이점 : 검정 통계량의 목적은 2표본을 비교 분석 하는 것에 초점, 표본 통계량에서 가공한 것
: 검정통계량의 종류
자세한 분포 설명은
https://huidea.tistory.com/230
https://huidea.tistory.com/231
# 예시 모집단의 평균 구하기 - 2. 귀무가설 대립가설
여기서 검정 통계량은 T !
예시와 같이 단일 집단의 모평균에 대한 가설 검정은 검정통계량이 T분포를 보임
위에는 분자값만 표기해 둔거고 실제 계산은 아래 공식과 같다
3. p-value 계산
Pvalue?
: 귀무가설이 참일 확률
: 귀무가실이 참이라는 전제아래에서, 계산된 검정통계량이 귀무가설을 얼마나 지지하는지 나타내는 확률
# 예시 모집단의 평균 구하기 - 3. pvalue 구하기
--> 검정 통계량 : 표본의 평균 (Xbar) - 귀무가설 (뮤, 10)
검정 통계량 T가 t 분포를 따르고, T값이 10.5 이면
T값보다 클 확률 -> 빨간 면적 ==> P(Y > 10.5) --> 0에 가까운 값
==> 검정 통계량 값이 크면 -> pvalue 는 작음 -> 귀무가설 기각
+) 이 과정을 1sample t-test (모집단 1개, t검정) 이라 한다.
'Study > Statistics & Math' 카테고리의 다른 글
[통계] 단일 표본 비율검정 (one-sample proportion test), 독립 표본 비율 검정 (two-sample proportion test) (0) | 2022.05.09 |
---|---|
[기초통계] t 분포, F 분포 강의 정리 (0) | 2022.01.20 |
[기초 통계] 표본분산의 분포, 카이제곱분포 (0) | 2022.01.18 |
[기초 통계] 표본분포(Sampling Distribution), 샘플평균의 분포 강의 내용 정리 (0) | 2022.01.18 |
[통계] 사후설계분할표_1218 (0) | 2020.12.18 |
댓글