Skip to content

Binomial distribution #

Find similar titles

7회 업데이트 됨.

Edit
  • 최초 작성자
    Seungho
  • 최근 업데이트
    hey

Structured data

Category
Statistics

Bernoulli Distribution #

베르누이 분포와 이항분포는 분포 중에 단순한 분포에 속하지만, 분류 문제에서는 중요한 개념이다. 베르누이 시행은 결과가 성공 혹은 실패의 경우만 가지는 실험을 의미한다. 베르누이 실행의 결과를 확률 변수 X라고 나타내었을 때 X=1은 성공을 뜻하고 X=0은 실패를 뜻한다. 여기서 X=1 즉 성공일 확률을 θ라고 지칭했을 때 확률 변수 X가 모수 θ의 베르누이 분포를 따른다고 표현할 수 있다.

아래 그림처럼 확률 변수 X가 베르누이 분포를 따른다고 표현할 수 있으며 베르누이 분포가 1이 나올 확률을 θ라는 파라미터를 가진다. 그럼 0이 나올 확률은 1-θ가 되는 것이다. 방금 표현한 내용을 하나의 식으로 표현하면 아래 그림과 같이 표현할 수 있다.

Image

Binomial Distribution #

이항분포란 베르누이 분포와 유사하지만, 차이점은 매회 성공확률이 p인 베르누이 실험을 각 실험마다의 독립적인 상황에서 n번 반목하였을 때, 성공한 횟수의 확률분포를 모수 n과 p인 분포를 뜻한다. 생물정보학에서도 많은 경우 사용되고 있으며 특히 variant나 expression에 대한 분석을 진행할 때 많이 사용되고 있다. 또한 여러 논문에서 위의 분석에 사용된 분포에 따른 성능을 비교한 때도 많이 보이고 있으며 특정한 경우에 대한 이항분포의 이점이 있는 경우가 많다. 아래 그림처럼 이항분포를 식으로 나타낼 수 있다. 베르누이 시행을 n번 시행마다 독립적인 상황에서 진행했을 때 성공확률이 θ이며 성공한 총횟수를 확률 변수 Y라고 표현했다. 이처럼 표현했을 때 확률 변수 Y는 파라미터가 (n, θ)인 이항분포를 따른다고 나타낼 수 있다. 또한, n=1인 경우, 이항분포는 베르누이 분포와 같다고 판단하면 된다.

Image

Example #

동전 던지기가 가장 보편적인 예로 들며 앞면이 나올 확률은 1/2을 가진다. 이때 n번의 시행에 대한 특정 면이 나올 확률을 나타내는 분포가 이 사건의 이항분포가 되며, B(n, 0.5)로 나타낼 수 있다.

Variants 검출에 대한 이항분포 #

이항분포를 적용한 변이 검출은 간단하다. 전체적인 변이확률을 우선 구하여 p로 두며 특정 부위의 변이 발생 횟수를 n으로 두어 이항분포에서의 발생확률을 산출한다. 기본적인 통계학의 적용에 따라 그 발생확률이 예측값의 범위 안에 있으며, Null 가설을 채택하며 그렇지 아니할 때 유의한 경우로 선별하여 이후 분석에 사용한다.

Reference #

  1. https://gem763.github.io/probability%20theory/%EB%B2%A0%EB%A5%B4%EB%88%84%EC%9D%B4-%EB%B6%84%ED%8F%AC%EC%99%80-%EC%9D%B4%ED%95%AD%EB%B6%84%ED%8F%AC.html
  2. https://datascienceschool.net/02%20mathematics/08.02%20%EB%B2%A0%EB%A5%B4%EB%88%84%EC%9D%B4%EB%B6%84%ED%8F%AC%EC%99%80%20%EC%9D%B4%ED%95%AD%EB%B6%84%ED%8F%AC.html

Suggested Pages #

0.0.1_20230725_7_v68