Skip to content

RNA-seq 분석 방법 (책 발간용 글 편집 및 수정) #
Find similar titles

Structured data

Category
Analysis

RNA-seq #

RNA-seq이란 transcriptome을 분석하여 발현의 차이를 확인 하는 분석 방법이다. Transcript에서 translation을 통해 단백질이 된다는 central dogma에 입각하여 transcript 수가 많을수록 발현이 많이 된다고 판단하여 계산하는 방법이다. Transcriptome 대용량 시퀀싱 후 분석을 하는 RNA-seq을 통하여 새로운 것을 발견할 수도 있으며, 발현 값을 정량 할 수도 있다.

RNA-seq 기본 원리 #

샘플에서 먼저 mRNA를 추출한다. 이를 cDNA로 합성한 이후 혹은 RNA 상태에서 조각을 낸 뒤 fragment 양 끝단에 adapter등 시퀀싱에 필요한 서열들을 붙여 라이브러리를 만든다. 그리고 대용량 시퀀싱을 진행한다. RNA에 붙어있는 poly A tail이나 라이브러리를 만들 때 사용된 adapter는 제거가 되고 read라고 불리우는 시퀀싱 데이터가 생성이 된다. 이 샘플이 유래된 생물종(ex. Human, mouse, rat, etc.)의 서열을 reference로 삼아 하여 read를 reference 서열에 붙인다. 이 과정을 mapping이라고 한다. 다음은 이러한 과정을 그림으로 나타낸 자료이다.

Image

[출처 : Wang et. al, RNA-Seq: a revolutionary tool for transcriptomics, Nat. Rev. Genetics 10, 57-63, 2009).]

RNA-seq 분석 로드맵 #

2016년 Genome Biology 저널에 실린 피규어를 보면 wet lab에서부터 dry lab까지 RNA-seq의 전반적인 분석 로드맵을 한눈에 확인할 수 있다.
분석 이전 단계에서 실험 디자인, 시퀀싱 디자인, quality control로 이루어져 있으며, 분석 과정에서는 transcriptome profiling하는 과정과 여기서 나온 발현 값들(RMPK, TPM, FPKM 등)을 이용하여 differntial expression 값을 구하여 발현차이를 확인하고, interpretation 과정에서 차등발현 유전자 혹은 transcript를 구한 다음 pathway나 GSEA를 통하여 의미를 확인 할 수 있다.
분석 후 과정으로는 이 결과를 시각화하고, transcriptome 데이터를 이용하여 small RNA분석이나, fusion gene등을 확인 할 수 있으며, QTL분석이나 transcription factor 분석, proteomics나 metabolomics와 연계하는 분석까지 진행 할 수 있다.

Image

[출처 : Copyright © Conesa et al. 2016, A survey of best practices for RNA-seq data analysis]

레퍼런스 데이터별 분석 전략 #

레퍼런스데이터에 따라서 크게 세가지의 전략으로 나눠볼 수 있다.
(a)는 genome reference를 가지고 있을 때 이며 annotation의 유무에 따라 fuctional annotation 과정이 추가된다. 이 때는 gap을 고려해주는 TopHat이나 STAR를 맵퍼로 사용한다.
(b)는 transcrip를 reference로 삼아 맵핑하는 방법이다. 이 때는 Bowtie를 이용하여 맵핑한다. (c)가장 까다로운 과정이 바로 reference가 없는 RNA-seq 과정인데, 이때는 시퀀싱 결과를 가지고 먼제 de-novo assembly를 진행해야 한다. 굉장히 까다로운 과정으로 가장 시간과 노력이 소모되는 분석이다. 그렇게 만들어진 contig들을 reference로 하여 맵핑을 한다. Transcriptome을 가지고 조립을 한 결과이므로 gap을 고려하지 않아도 되기 때문에 bowtie를 이용한다. Annotation이 없기 때문에 서열의 의미를 찾기 위해 fuctional annotation을 하는 과정이 추가되어야 한다.

Image

[출처 : Copyright © Conesa et al. 2016, A survey of best practices for RNA-seq data analysis]

Suggested Pages #

0.0.1_20140628_0