Skip to content

R활용 가설검정 #

Find similar titles

13회 업데이트 됨.

Edit
  • 최초 작성자
    twkang
  • 최근 업데이트
    green

가설 검정(Statistical hypothesis test) #

가설 검정 #

가설 검정이란 #

  • 통계적 추론의 하나로써, 모집단의 특성을 추론하고 그 결과의 신뢰성을 검정하는 것이다.
  • 전체 데이터를 모집단이라고하며, 그 일부를 표본이라고 한다. 이때, 표본은 모집단의 특성을 대변해야 한다.
  • 가설 검정의 절차는 아래와 같은 순서로 이루어진다.

Image

이미지 출처: kkokkilkon.tistory.com


  • 주요 용어 정리
    • 가설
      • 검정통계량: 가설을 검정하기 위한 기준으로 사용하는 값
        • 검정통계량, t값 = (표본평균-모평균)/표본 표준편차
      • 귀무가설, H0: 일반적으로 맞다는 가설 (일반적으로, 차이가 없다라는 의미)
      • 대립가설, H1: 새롭게 증명하려는 가설, 주장하고자 하는 사실
    • 오류
      • 1종 오류: 사실인 귀무가설을 기각한 경우
      • 2종 오류: 거짓인 귀무가설을 채택한 경우
    • 검정방법
      • 양측검정: 귀무가설을 기각하는 영역이 양쪽에 있는 경우 (키가 크거나 작다)
      • 단측검정: 귀무가설을 기각하는 영역이 한쪽에 있는 경우 (작다 or 크다)
      • 좌측검정: 귀무가설을 기각하는 영역이 왼쪽에 있는 경우 (작다)
      • 우측검정: 귀무가설을 기각하는 영역이 오른쪽에 있는 경우 (크다)
    • 신뢰/유의

      • 신뢰수준(confidence level): 표본의 결과를 통해 추정하려는 모수의 신뢰성 정도 (95% 신뢰수준 == 100번 조사에서 95번은 동일한 결과를 보임)
      • 신뢰구간(confidence interval): 모집단의 모수가 일정한 확률을 갖게 될 값의 범위 Image 이미지 출처: 실생활 알짜배기

      • 유의수준 & 유의확률(p-value): 귀무가설을 지지하는 정도를 확률로 표시/ 귀무가설이 참일때, 검정 통계량이 계산될 확률(p값)/ 신뢰수준의 반대말

      • 기각역: 귀무가설을 기각하는 영역
      • 자유도: 값이 가질 수 있는 범위, (표본수-1), 3개의 수의 합이 9인 경우: 첫번째 혹은 두번째 값은 아무 값을 갖을 수 있지만 셋째 수는 선택 권한이 없음

참고 #

  1. R을 이용한 누구나 하는 통계분석. 안재형 지음 | 한나래 | 2016년 03월 25일 출간 (1쇄 2011년 01월 15일)
  2. 위키: https://ko.wikipedia.org/wiki/가설_검정
  3. 꼬낄콘의 분석일지
  4. https://blog.naver.com/hny6-0070/220936964565
0.0.1_20230725_7_v68