Skip to content

Trinotate #

Find similar titles

2회 업데이트 됨.

Edit

Structured data

Category
Software

Introduction #

TrinotateBLAST, hmmer/pfam, signalP, tmhmm, RNAmmer 등 분석 결과를 토대로 KEGG, GO, COG 등 결과를 통합하여 보여준다. 이 과정에서 annotation information을 포함하는 SQLite database를 필요로 한다.

Limitations #

다만 UniProt Swiss-Prot DB에 대해서만 정보를 가져올 수 있다는 한계가 있다. nr 버전을 지원하지 않는 이유에 대해서 UniProt이 nr의 European version이기 때문이라고 답변하였다 (링크).

Install #

Requirement #

  1. Trinotate
  2. Trinity
  3. TransDecoder
  4. sqlite
  5. NCBI BLAST+
  6. HMMER/PFAM

Optional #

아래 프로그램들은 academic free version으로 각 프로그램의 홈페이지에서 정보 기입 후 다운로드 받을 수 있다.

  1. signalP v4
  2. tmhmm v2
  3. RNAmmer

Database #

  1. SwissProt

    $ wget https://data.broadinstitute.org/Trinity/Trinotate_v3_RESOURCES/uniprot_sprot.pep.gz
    $ gunzip uniprot_sprot.pep.gz
    $ makeblastdb -in uniprot_sprot.pep -dbtype prot
    
  2. Pfam

    $ wget https://data.broadinstitute.org/Trinity/Trinotate_v3_RESOURCES/Pfam-A.hmm.gz
     $ gunzip Pfam-A.hmm.gz
     $ hmmpress Pfam-A.hmm
    
  3. Pre-generated Resource SQLite database - swissprot과 uniref90 annotation 정보를 가지고 있다.

     $ wget "https://data.broadinstitute.org/Trinity/Trinotate_v3_RESOURCES/Trinotate_v3.sqlite.gz" -O Trinotate.sqlite.gz
     $ gunzip Trinotate.sqlite.gz
    

Usage #

다음과 같은 일련의 과정을 단계별로 수행한다.

  1. transdecoder 이용하여 peptide candidates 생성

    $ TransDecoder.LongOrfs -t transcripts.fa
    $ TransDecoder.Predict -t transcripts.fa
    
  2. BLAST 수행

    $ blastx -query transcripts.fa -db /home/isg/tools/Trinotate/Database/uniprot_sprot.pep -num_threads 20 -max_target_seqs 1 -outfmt 6 > blastx.outfmt6
    $ blastp -query transcripts.fa.transdecoder.pep -db /home/isg/tools/Trinotate/Database/uniprot_sprot.pep -num_threads 20 -max_target_seqs 1 -outfmt 6 > blastp.outfmt6
    
  3. hmmer

    $ hmmscan --cpu 20 --domtblout TrinotatePFAM.out /home/isg/tools/Trinotate/Database/Pfam-A.hmm transcripts.fa.transdecoder.pep > pfam.log
    
  4. signalp

    $ signalp -f short -n signalp.out transcripts.fa.transdecoder.pep
    
  5. tmhmm

    $ tmhmm --short < transcripts.fa.transdecoder.pep > tmhmm.out
    
  6. trinotate

    $ Trinotate Trinotate.sqlite init --gene_trans_map transcripts.fa.gene_trans_map --transcript_fasta transcripts.fa --transdecoder_pep transcripts.fa.transdecoder.pep >& log.err
    $ Trinotate Trinotate.sqlite LOAD_swissprot_blastp blastp.outfmt6
    $ Trinotate Trinotate.sqlite LOAD_swissprot_blastx blastx.outfmt6
    $ Trinotate Trinotate.sqlite LOAD_pfam TrinotatePFAM.out
    $ Trinotate Trinotate.sqlite LOAD_tmhmm tmhmm.out
    $ Trinotate Trinotate.sqlite LOAD_signalp signalp.out
    $ Trinotate Trinotate.sqlite report > trinotate_annotation_report.xls
    

Output #

Trinotate report 명령어에 의해 출력되는 파일이며 하나의 유전자에 대해 gene_id, transcript_id, sprot_Top_BLASTX_hit, RNAMMER, prot_id, prot_coords, sprot_Top_BLASTP_hit, Pfam, SignalP, TmHMM, eggnog, Kegg, gene_ontology_blast, gene_ontology_pfam 결과를 제공한다.

Incoming Links #

Related Articles #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20231010_1_v71