Skip to content

MA-plot #
Find similar titles

Structured data

Category
Statistics

서론 #

RNAseq의 다양한 응용법 중 DEG분석은 기본이면서도 가장 중요한 분석으로 생각된다. DEG를 찾는 통계적 방법은 여러가지가 있고, 그 중 MA-plot을 이용한 방법은 고전적이면서도 육안으로 쉽고 직관으로 구별을 할 수 있다.

개념 #

앞서 언급했듯이 MA-plot은 microarray data혹은 RNA-seq의 Intensity-dependent ratio를 밝히고 시각화 하는데 매우 강력한 통계적 방법이다. 두 개의 샘플에 공통적으로 존재하는 하나의 특정 유전자를 가정하고, Ci를 유전자에 대한 mapped reads count로 pi를 리드가 특정 유전자로부터 유래했을 확률로 ni를 mapped read 의 total number로 나타낸다면 ni, pi의 이항식(Ci ~ binomial(ni, pi), I = 1,2)이 성립하고 아래와 같은 식으로 표현할 수 있다.

M = log2C1 - log2C2
A = (log2C1 + log2C2)/2

위 식은 random sampling이라는 가정하에 성립되는데 일반적으로 log-intensity log2 C1 과 log-intensity log2 C2 의 2차원 plot으로 표현되어진다. 이 plot에서 log2 C1 = log2 C2의 선상에서 벗어난 gene의 양을 관찰한다. 또한, 이 값들을 이용한 log-intensity ratio인 M 값과 mean log-intensity인 A 값을 이용하여 plotting 하기도 한다. 이 M과 A 값을 이용한 plotting은 위의 log2 C1 과 log2 C2를 이용한 plot을 45º회전시킨 plot으로 0 값을 기준 선으로 gene data를 관찰한다. 수직 축에 M값(로그화한 C1/C2 ratio), 수평 축으로는 A값(spot intensity)으로 구성된다.

0.0.1_20140628_0