RSEM
USAGE
#
Find similar titles
- 최초 작성자
-
최근 업데이트
dksgud4107@gmail.com
Structured data
- Category
- Software
RSEM의 introduction에서 언급했듯이 크게 두단계로 구성된다. 직접설치한 RSEM에서의 각 단계는 하나의 프로그램으로 구성되어있어 사용법은 간단하고 유저친화적이지만, 다양한 파라미터옵션으로 인해 접근성이 다소 떨어질 수 있다. 이런 부분은 Trinity software를 이용해 다소 해소할 수 있다. Trinity package에는 RSEM을 이용한 transcripts의 abundance를 extimation하는 부분이 구현되어 있고 이 부분을 소개한다. RSEM을 단 하나의 스크립트로 손쉽게 이용할 수 있다. Trinity 2.0.6 버젼의 사용자라면 아래의 path에 사용할 perl script를 찾을 수 있을 것이다.
$TRINITY_HOME/util/align_and_estimate_abundance.pl
1. Preparing Reference Sequences #
이 단계는 bowtie나 bowtie2를 이용해 reads를 genes이나 transcripts에 alignment를 하기 위한 것으로 reference building을 우선적으로 수행해야한다.
$TRINITY_HOME/util/align_and_estimate_abundance.pl
위 스크립트를 아무런 옵션없이 수행하면 다양한 파라미터들이 출력된다. 이중 prep_reference 옵션은 reference building을 수행한다는 옵션이다. 아래 커맨드라인은 reference building 만을 수행하는 예제다.
./align_and_estimate_abundance.pl --transcripts Trinity.fasta --est_method RSEM --aln_method bowtie --trinity_mode --prep_reference
2. Align reads and estimate abundance #
전사체 reference (Trinity.fasta)를 building했다면, 각 샘플의 reads들을 alignment 해야한다. 각 샘플별로 반복적으로 수행해야한다.
./align_and_estimate_abundance.pl --transcripts Trinity.fasta --seqType fq --left reads_1.fq --right reads_2.fq --est_method RSEM --aln_method bowtie --trinity_mode
수행이 완료되면 gene단위와 isoform단위의 transcripts abundance estimation 결과를 확인할 수 있다.
sample.isoforms.results : EM read counts per Trinity transcript
sample.genes.results : EM read counts on a per-Trinity-component basis
Tip. 한번에 수행하기 #
Trinity의 스크립트를 이용하면 위 두 단계를 한번에 수행할 수 있다. 다만, 샘플수가 많다면 reference building 을 중복적으로 샘플 수만큼 수행하는 것이니 비효율적이다. 아래의 옵션에서 reads정보와 prep_reference 옵션을 함께 사용하면 한번에 수행한다.
./align_and_estimate_abundance.pl --transcripts Trinity.fasta --seqType fq --left reads_1.fq --right reads_2.fq --est_method RSEM --aln_method bowtie --trinity_mode --prep_reference
Suggested Pages #
- 0.025 de Bruijn
- 0.025 Butterfly
- 0.025 Chrysalis
- 0.025 Inchworm
- More suggestions...