Skip to content

RSEM USAGE #

Find similar titles

4회 업데이트 됨.

Edit
  • 최초 작성자
    Seung-il Yoo
  • 최근 업데이트

Structured data

Category
Software

RSEM의 introduction에서 언급했듯이 크게 두단계로 구성된다. 직접설치한 RSEM에서의 각 단계는 하나의 프로그램으로 구성되어있어 사용법은 간단하고 유저친화적이지만, 다양한 파라미터옵션으로 인해 접근성이 다소 떨어질 수 있다. 이런 부분은 Trinity software를 이용해 다소 해소할 수 있다. Trinity package에는 RSEM을 이용한 transcripts의 abundance를 extimation하는 부분이 구현되어 있고 이 부분을 소개한다. RSEM을 단 하나의 스크립트로 손쉽게 이용할 수 있다. Trinity 2.0.6 버젼의 사용자라면 아래의 path에 사용할 perl script를 찾을 수 있을 것이다.

 $TRINITY_HOME/util/align_and_estimate_abundance.pl

1. Preparing Reference Sequences #

이 단계는 bowtiebowtie2를 이용해 reads를 genes이나 transcripts에 alignment를 하기 위한 것으로 reference building을 우선적으로 수행해야한다.

 $TRINITY_HOME/util/align_and_estimate_abundance.pl

위 스크립트를 아무런 옵션없이 수행하면 다양한 파라미터들이 출력된다. 이중 prep_reference 옵션은 reference building을 수행한다는 옵션이다. 아래 커맨드라인은 reference building 만을 수행하는 예제다.

./align_and_estimate_abundance.pl --transcripts Trinity.fasta --est_method RSEM --aln_method bowtie --trinity_mode --prep_reference

2. Align reads and estimate abundance #

전사체 reference (Trinity.fasta)를 building했다면, 각 샘플의 reads들을 alignment 해야한다. 각 샘플별로 반복적으로 수행해야한다.

./align_and_estimate_abundance.pl --transcripts Trinity.fasta --seqType fq --left reads_1.fq --right reads_2.fq --est_method RSEM --aln_method bowtie --trinity_mode

수행이 완료되면 gene단위와 isoform단위의 transcripts abundance estimation 결과를 확인할 수 있다.

sample.isoforms.results : EM read counts per Trinity transcript
sample.genes.results : EM read counts on a per-Trinity-component basis

Tip. 한번에 수행하기 #

Trinity의 스크립트를 이용하면 위 두 단계를 한번에 수행할 수 있다. 다만, 샘플수가 많다면 reference building 을 중복적으로 샘플 수만큼 수행하는 것이니 비효율적이다. 아래의 옵션에서 reads정보와 prep_reference 옵션을 함께 사용하면 한번에 수행한다.

./align_and_estimate_abundance.pl --transcripts Trinity.fasta --seqType fq --left reads_1.fq --right reads_2.fq --est_method RSEM --aln_method bowtie --trinity_mode --prep_reference

Suggested Pages #

0.0.1_20230725_7_v68