Skip to content

DEG(Differential Expression Gene) #

Find similar titles

12회 업데이트 됨.

Edit
  • 최초 작성자
    Dragon
  • 최근 업데이트
    jmchoi

Structured data

Category
Statistics

Differential Expression Gene(DEG) #

DEG 분석은 2개 이상의 샘플에서 전사체 시퀀싱을 수행한 후 샘플 간 유전자 발현의 차이를 비교 분석하는 기법이다. 이 분석 기법은 시료 준비 과정에서나 시퀀싱 과정 중에 발생할 수 있는 실험 오차를 통계적으로 바로잡을 수 있으며, 대조군과 비교군 간에 발현의 유의미를 찾을 수 있다. 기본적으로 DEG를 구한다는 것은 주어진 데이터셋을 이분법적으로 바라본다는 것을 전제로 한다. DEG의 기준은 크게 두 가지, Fold Change(FC)와 Adjusted P value를 이용한다.

Fold Change(FC) #

Adjusted P value #

P value는, 귀무가설(null hypothesis, H0)이 맞는다는 전제하에, 통곗값(statistics)이 실제로 관측된 값 이상일 확률을 의미한다. p value는 결괏값이 여러 개가 있으면 이중 우연히 결과가 통계적으로 의미 있는 값으로 나올 확률이 높아진다. 따라서 이런 가능성을 줄이는 방법이 p값 조정(Adjusted P value)이다. p값을 조정하는 순서는 다음과 같다.

  1. 단순 조정 - 가정 검토 없이 단순히 p값을 조정하는 과정이다. 이 조정 방법에는 Bonferroni와 Sidak 조정이 있다.
  2. 단계 조정 - 순차적으로 p값을 조정하는 것이다. 이 조정 밥법에는 step down bonferroni (Holm), step-down Sidak, Hochberg's step-up, Hommels's가 있다.
  3. 재 표본 추출 검정 - 일정 크기의 표본 샘플을 뽑아서 다시 분석하는 방법이다. 이 조정 방법에는 bootstrap방법과 대체 없는 permutation test가 있다.
  4. False Discovery Rate(FDR) - 인코덤, 셍믈정보 전문위키

DEG(Differential Expression Gene) 분석 순서 #

  1. Clean data 만들기
  2. Reference assembly
  3. RPKM 값 구하기
  4. DEG 찾기
  5. FC(Fold Change) list 추출
  6. FC(Fold Change) description
0.0.1_20240214_1_v81