Skip to content

EdgeR with no replicate #
Find similar titles

Structured data

Category
Analysis

EdgeR with no replicate #

1. Background #

EdgeR은 원래 replicate이 존재하는 데이터를 분석하기 위해 디자인되었으나 높은 실험 가격 또는 다량의 샘플링이 어려운 경우로 인해 부득이하게 replicate을 만들지 못하는 경우가 있음. 이러한 경우에 EdgeR을 이용하여 유의 유전자를 도출하기 위해 EdgeR 개발자들이 제안하는 4가지 방법이 있음

1) 방법1 #

MDS plot을 그리고 fold change를 산출하는 것으로 만족하기

2) 방법2 #

합리적인 dispersion 값을 셋팅하는 방법

  • 실험이 잘 된 경우 human 데이터는 일반적으로 BCV(squareroot-dispersion)값이 0.4
  • 유전적으로 잘 통제된 실험 동물의 경우 0.1
  • technical replicate의 경우 0.01

임을 참고하여 적당한 값을 설정한 후

> bcv <- 0.2
> counts <- matrix( rnbinom(40,size=1/bcv^2,mu=10), 20,2)
> y <- DGEList(counts=counts, group=1:2
> et <- exactTest(y, dispersion=bcv^2)

3) 방법3 #

발현 패턴이 비슷한 그룹을 묶고 replicate으로 간주하는 방법

> estimateGLMCommonDisp(data, method="deviance", robust=TRUE,                                   subset=NULL)

4) 방법4 #

발현이 변하지 않을 것으로 추정되는 유전자 그룹 (예, house-keeping gene)을 만들고 이들로부터 dispersion을 추정한 이후 분석하는 방법

d1은 treatment한 한 개 그룹일 경우

d0는 house-keeping 유전자 내 dispersion 값

> d1 <- d 
> d1$samples$group <- 1
> d0 <- estimateCommonDisp(d1[housekeeping,])
> d$common.dispersion <- d0$common.dispersion 
> et <- exactTest(d)

2. Simulation #

Material: 마우스 데이터

Method: 방법2를 사용하되 bcv 0.1~0.5에서 no replicate과 duplicate에서 얻은 -log10(p-value)값을 비교 분석

  • bcv=0.1 Image

  • bcv=0.2 Image

  • bcv=0.3 Image

  • bcv=0.4 Image

  • bcv=0.5 Image

bcv가 0.1은 과도하게 분산값이 적게 설정되어 no replicate가 duplicate 보다 p-value가 더 유의하게 산출되었고 0.3 이후로는 duplicate에 비해 현저하게 떨어진 sensitivity를 보임
0.0.1_20140628_0