Skip to content

TopHat #
Find similar titles

Structured data

Category
Software

TopHat #

TopHat은 무슨 프로그램인가 ? #

TopHat은 exon-exon splice junction을 확인하기 위하여 유전체에 RNA-seq read들을 정렬하는 프로그램입니다. TopHat은 빠른 short read mapping program인 Bowtie를 기반으로 하고 있습니다. TopHat을 사용하여 Mapping한 이후에 cufflinks를 이용해서 Gene structure를 수정하거나 novel transcript를 찾을 수 있습니다.

TopHat은 어떻게 junction(경계선)을 찾을까? #

현재 Short read sequenceing machine들은 100bp 또는 그 이상의 read들을 생성할 수 있습니다. 하지만 많은 exon들은 이 read들보다 길이가 짧습니다. 그래서 mapping 과정에서 exon들을 놓칠 수 있습니다. TopHat은 input read들을 이어 맞추어 독립적으로 mapping 할 수 있기 때문에 이와 같은 문제를 해결할 수 있습니다. TopHat은 먼저 일반적인 junction 정보인 "GT-AG", "GC-AG" 그리고 "AT-AC"를 이용하고 추가적으로 정렬을 실시하여 junction database를 구축해 junction을 찾아냅니다.

TopHat의 Library type #

  • Fr-unstranded ( standard Illumina ) Read들을 transcript strand 왼쪽을 기준으로 mapping하고 complement strand를 오른쪽 기준으로 mapping합니다.
  • Fr-firststand ( dUTP, NSR, NNSR ) Single-end read들을 오른쪽을 기준으로 하여 mapping합니다.
  • Fr-secondstrand ( ligation, standard solid ) Single-end read들을 왼쪽을 기준으로 하여 mapping합니다.

TopHat을 사용하기 전에 필요한 것 #

  • Bowtie2 그리고 Bowtie2-align( 또는 Bowtie )
  • Bowtie2-inspect( 또는 Bowtie )
  • Bowtie2-build( 또는 Bowtie )
  • samtools
  • python version 2.6 이상

TopHat의 기본적인 사용 방법 #

  • Usage tophat [options]* [reads1_2,...readsN_2] 
  • Paired read를 running할 때 _1 file 그리고 _2 file들을 comma-delimited list로 구분해야 합니다.
  • TopHat은 paired read들 후에 제공되어진 추가적인 unpaired read들의 사용이 가능합니다. 사용 방법으로는 아래에 보이는 command line이 대표적입니다.

  • Usage tophat [options] PE_reads_1.fq.gz,SE_reads.fa PE_reads_2.fq.gz 
    or tophat [options]
    PE_reads_1.fq.gz PE_reads_2.fq.gz,SE_reads.fa

Reference #

Incoming Links #

Related Articles #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20140628_0