가설 검정(Statistical hypothesis test) #
가설 검정 #
가설 검정이란 #
- 통계적 추론의 하나로써, 모집단의 특성을 추론하고 그 결과의 신뢰성을 검정하는 것이다.
- 전체 데이터를 모집단이라고하며, 그 일부를 표본이라고 한다. 이때, 표본은 모집단의 특성을 대변해야 한다.
- 가설 검정의 절차는 아래와 같은 순서로 이루어진다.
이미지 출처: kkokkilkon.tistory.com
- 주요 용어 정리
- 가설
- 오류
- 1종 오류: 사실인 귀무가설을 기각한 경우
- 2종 오류: 거짓인 귀무가설을 채택한 경우
- 검정방법
- 양측검정: 귀무가설을 기각하는 영역이 양쪽에 있는 경우 (키가 크거나 작다)
- 단측검정: 귀무가설을 기각하는 영역이 한쪽에 있는 경우 (작다 or 크다)
- 좌측검정: 귀무가설을 기각하는 영역이 왼쪽에 있는 경우 (작다)
- 우측검정: 귀무가설을 기각하는 영역이 오른쪽에 있는 경우 (크다)
-
신뢰/유의
- 신뢰수준(confidence level): 표본의 결과를 통해 추정하려는 모수의 신뢰성 정도 (95% 신뢰수준 == 100번 조사에서 95번은 동일한 결과를 보임)
-
신뢰구간(confidence interval): 모집단의 모수가 일정한 확률을 갖게 될 값의 범위
이미지 출처: 실생활 알짜배기
-
유의수준 & 유의확률(p-value): 귀무가설을 지지하는 정도를 확률로 표시/ 귀무가설이 참일때, 검정 통계량이 계산될 확률(p값)/ 신뢰수준의 반대말
- 기각역: 귀무가설을 기각하는 영역
- 자유도: 값이 가질 수 있는 범위, (표본수-1), 3개의 수의 합이 9인 경우: 첫번째 혹은 두번째 값은 아무 값을 갖을 수 있지만 셋째 수는 선택 권한이 없음
참고 #
- R을 이용한 누구나 하는 통계분석. 안재형 지음 | 한나래 | 2016년 03월 25일 출간 (1쇄 2011년 01월 15일)
- 위키: https://ko.wikipedia.org/wiki/가설_검정
- 꼬낄콘의 분석일지
- https://blog.naver.com/hny6-0070/220936964565