[기초 통계] 통계적 가설 검정 과정 (검정통계량, P-value)

참고 link : https://blog.acronym.co.kr/621

통계적 가설 검정(Statistical Hypothesis Testing) 절차

통계적 가설 검정은 통계적 추측의 하나이다. 전체 집단의 실제 값이 얼마라는 주장에 대해서 표본을 활용해 가설의 합당성 여부를 판단하는 것이다. 빅데이터 시대에는 전체 데이터 대상으로

blog.acronym.co.kr

https://www.youtube.com/watch?v=tpow70KGTYY - 김성범 교수님 머신러닝 pvalue 강의

+) preview 정의

모집단 : 정보를 얻고자 하는 관심대상의 전체 집단

표본 : 모집단의 부분집단 --> 랜덤하게 추출, 하지만 이때 항상 오차가 수반됨 ==> 이게 표준 오차

표본 통계량 : 샘플의 평균, 샘플의 분포

표준 오차 : Standard error (SE) 표본 통계량의 표준 편차

모집단을 이해하고 싶지만 현실적으로 불가능하다
과연 이 표본이 믿을 만한 표본인건지 알고 싶을 때 하는 분석
=> 통계적 가설 검정

0. 통계적 가설 검정

--> 표본으로부터 모집단을 추정하는 귀무가설을 세움 (모집단은 이럴 것이다~~~)

--> 귀무 가설의 진위여부를 검정하기 위해 표본으로부터 계산하는 검정 통계량을 구함

--> Pvalue를 통해 신뢰구간안에 들어가는지 (진위여부 맞는지 아닌지) 확인

가설을 기각할지 통과할지 결정

통계적 가설 검정의 3단계 (1sample t-test로 보면)
1. 귀무가설과 대립가설 설정
2. 검정통계량 결정 및 계산
3. pvalue 계산
--> 귀무가설 기각/채택 여부 확인

(예시 1. 모집단의 평균 추정으로)

1. 귀무가설과 대립 가설 설정

# 예시 모집단의 평균 구하기 - 1. 귀무가설 대립가설

귀무가설 (H0) : 모집단의 평균이 10

대립가설 (H1) : 모집단의 평균은 10이 아니다.

2. 검정 통계량 결정 및 계산

: 귀무가설이 참이라는 가정 아래 얻은 통계량

: t분포, 표분정규분포, F분포, 카이제곱분포를 사용하고 이를 일컬어 검정 통계량이라함

: 통계적 가설의 진위여부를 검정하기 위해, 표본으로부터 계산하는 통계량 --> 즉 표본 통계량을 2차 가공한 것

+) 표본 통계량과의 차이점 : 검정 통계량의 목적은 2표본을 비교 분석 하는 것에 초점, 표본 통계량에서 가공한 것

: 검정통계량의 종류

자세한 분포 설명은

https://huidea.tistory.com/230

[기초 통계] 표본분산의 분포, 카이제곱분포

https://www.youtube.com/watch?v=DyBxYsCow9k&list=PLpIPLT0Pf7IqS4as3nefPyGv94r2aY6IT&index=3 위의 강의 내용을 캡쳐 + 정리한 내용입니다. https://huidea.tistory.com/228 통계량 stati.." data-og-host="hu..

huidea.tistory.com

https://huidea.tistory.com/231

[기초통계] t 분포, F 분포 강의 정리

https://www.youtube.com/watch?v=DyBxYsCow9k&list=PLpIPLT0Pf7IqS4as3nefPyGv94r2aY6IT&index=4 김성범 교수님 머신러닝 강의의 20분 이후 내용입니다. 강의 앞부분 내용은 : https://huidea.tistory.com/230 [..

huidea.tistory.com

# 예시 모집단의 평균 구하기 - 2. 귀무가설 대립가설

여기서 검정 통계량은 T !

예시와 같이 단일 집단의 모평균에 대한 가설 검정은 검정통계량이 T분포를 보임

위에는 분자값만 표기해 둔거고 실제 계산은 아래 공식과 같다

3. p-value 계산

Pvalue?

: 귀무가설이 참일 확률

: 귀무가실이 참이라는 전제아래에서, 계산된 검정통계량이 귀무가설을 얼마나 지지하는지 나타내는 확률

# 예시 모집단의 평균 구하기 - 3. pvalue 구하기

--> 검정 통계량 : 표본의 평균 (Xbar) - 귀무가설 (뮤, 10)

검정 통계량 T가 t 분포를 따르고, T값이 10.5 이면

T값보다 클 확률 -> 빨간 면적 ==> P(Y > 10.5) --> 0에 가까운 값

==> 검정 통계량 값이 크면 -> pvalue 는 작음 -> 귀무가설 기각

+) 이 과정을 1sample t-test (모집단 1개, t검정) 이라 한다.

728x90

저작자표시 (새창열림)

'Study > Statistics & Math' 카테고리의 다른 글

[통계] 단일 표본 비율검정 (one-sample proportion test), 독립 표본 비율 검정 (two-sample proportion test) (0)	2022.05.09
[기초통계] t 분포, F 분포 강의 정리 (0)	2022.01.20
[기초 통계] 표본분산의 분포, 카이제곱분포 (0)	2022.01.18
[기초 통계] 표본분포(Sampling Distribution), 샘플평균의 분포 강의 내용 정리 (0)	2022.01.18
[통계] 사후설계분할표_1218 (0)	2020.12.18

데이터 분석가 후이