Skip to content

귀무가설 #

Find similar titles

14회 업데이트 됨.

Edit
  • 최초 작성자
    MinhakChoi
  • 최근 업데이트
    ShabangBoy

Structured data

Category
Statistics

귀무가설이란? #

  • 통계학의 궁극적인 목표는 기존 주장이 맞는지 아니면 새로운 연구 또는 실험으로 발견된 주장이 맞는지 검정하는 것이다. 그래서 최종적으로 귀무가설을 채택하거나 기각, 또는 대립가설을 채택하거나 기각하는 선택을 하는 것이다. (가설이란 **어떤 사실을 설명하거나 증명하기 위해서 설정한 가정을 의미)
  • 예를 들어 'A 유전자가 위암을 유발한다.' 라는 가설을 입증할 때 'A 유전자는 위암을 유발하지 않는다.' 라는 가설을 설정한다. 이는 'A 유전자는 위암을 유발하지 않는다.' 라는 가설이 틀렸다는 사실을 통해서 'A 유전자가 위암을 유발한다.' 는 가설이 성립되는 것을 증명하는 것이다.
  • 즉, 귀무가설(null hypothesis)은 우리가 증명하고자 하는 가설의 반대되는 가설, 효과와 차이가 없는 가설을 의미하며 우리가 증명 또는 입증하고자 하는 가설, 효과와 차이가 있는 가설을 대립가설이라고 한다.

귀무가설의 의미 #

귀무가설(歸無假說 : Null hypothesis)은 1900년대 중반 영국의 통계/유전학자인 로널드 피셔에 의해 정의된 통계용어로, 처음부터 맞지 않을 것으로 예상하고 세우는 가설이다. 기본적인 의미만 봤을 때 그 쓰임새가 쉽게 와닿지 않을 수 있는 이 귀무가설의 역할은, 어떠한 가설을 주장하고자 하는 사람이 본래의 가설이 옳다는 것을 통계적으로 증명하기 위한 것이다. 본래 자신이 주장하고자 하는 내용과 정반대의 가설(귀무가설)을 세우고 이 가설을 검증하여 잘못된 것임을 밝혀내 본래의 가설이 옳다는 것을 주장하는 방식으로, 오늘날에도 수학이나 통계는 물론 각종 과학분야나 산업계에서 가설 검증을 위해 널리 활용되고 있다.

대립가설과 귀무가설 #

대립가설은 귀무가설과 반대되는 의미로, 가설을 만든 사람이 실제로 주장하거나 증명하고 싶은 내용을 담고 있다. 예를 들어 ‘지구는 둥글다’라는 가설을 검증하고자 할 경우에 ‘지구는 둥글지 않다’라는 가설이 귀무가설이 되고 이에 반대되는 본래의 가설 ’지구는 둥글다’는 대립가설이 된다. 이 예시에서는 지구가 둥글지 않다는 대립가설이 잘못되었음을 증명하여 대립가설인 지구는 둥글다는 것이 맞다고 주장하고자 하는 것이다. 실제로 귀무가설은 통계적인 분석 과정에서 많이 활용되기 때문에 ‘지구는 둥글다’식의 단순 명제보다는 통계값간의 관계에 대한 가설로 많이 설정된다. 예를 들면 발암물질을 발생시키는 공장 주변 지역의 암 발생률이 높은 원인을 분석하는 연구 과정에서, 암을 발생시키는 요인(공장)과 암 발병률과의 상관관계를 따지기 위해 ‘공장의 발암물질은 암 발병률에 영향을 미치지 않았다’라는 귀무가설을 만들고 이에 대한 대립가설로 본래의 가설인 ‘공장의 발암물질은 암 발병률에 영향을 주었다’를 설정하는 식이다. 분석과정에서 귀무가설(공장의 발암물질과 암 발병 관계없음)이 잘못되었음을 증명하면 연구에서 예측했던 결과에 도달하는 것이 된다.

유의성 검정과 유의확률 #

유의성 검정(Null Hypothesis Significance Testing(NHST))은 앞서 구성한 두 개의 가설 중 어느 쪽이 참인지를 판단하기 위해 진행하는 검증 과정이다. 그런데 통계적인 분석에서는 모든 현상이나 대상에 대한 정보를 바탕으로 검증을 하기는 어렵기 때문에 표본을 추출하여 검증을 거치게 된다. 이렇게 추출한 표본을 바탕으로 검증을 실시하는 과정을 유의성 검증이라고 하고, 귀무가설이 맞다고 가정했을 때 표본에서 실제 통계치와 같거나 더 극단적인 통계치가 나올 확률이다. 간단하게 표현하면 귀무가설을 참으로 볼 수 있는 확률) 유의확률은 보통 p-value로 표현하며, 많은 연구에서 p-value가 0.05이하이면 이 귀무가설을 옳지 않은 것으로 본다(‘귀무가설을 기각’한다고 표현함). p-value가 0.05 미만이라면, 이 통계치에서 귀무가설을 참으로 봤을 때 표본에서 실제로 해당되는 통계치가 나올 가능성은 5% 미만이라는 의미가 된다. 즉 해당 통계치는 95%의 확률로 대립가설이 참이 될 가능성이 훨씬 더 높은 것이라고 할 수 있다.

유의확률(p-value)이 활용된 실제 연구 사례(예시) #

귀무가설과 유의확률은 생물체 연구나 약물의 효능 연구에서 가설 검증 시 거의 필수적으로 사용되고 있는데, 간략하게 그러한 사례 중 하나를 살펴보겠다. 아래는 봉독 추출물(꿀벌의 독낭에 들어있는 봉독을 추출가공한 물질)이 피부 노화에 미치는 영향에 대한 연구결과에 포함된 실험결과이다. (봉독이 피부 노화에 미치는 영향(경희대 한의대 연구팀)) 이 연구에서 연구자들은 봉독이 피부노화를 억제하는 역할을 할 것이라는 가설을 설정하고 실험을 통해 이를 검증하는 과정을 거쳤다. 실험결과를 분석할 때 실험 통계치로부터 나온 유의확률의 값에 따라서 가설이 유효한지를 확인하였다. 아무것도 주입하지 않은 대조군(Control)보다 봉독을 주입한 실험군(Syringe)에서 p-value 0.037로 훨씬 더 작은 값이 나온 것으로 보아 해당 실험은 유의한 것으로 볼 수 있었다.

Image

참고 #

Incoming Links #

Related Data Sciences #

Related Articles #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20230725_7_v68