Trinotate
#
Find similar titles
- 최초 작성자
- 최근 업데이트
Structured data
- Category
- Software
Table of Contents
Introduction #
Trinotate는 BLAST, hmmer/pfam, signalP, tmhmm, RNAmmer 등 분석 결과를 토대로 KEGG, GO, COG 등 결과를 통합하여 보여준다. 이 과정에서 annotation information을 포함하는 SQLite database를 필요로 한다.
Limitations #
다만 UniProt Swiss-Prot DB에 대해서만 정보를 가져올 수 있다는 한계가 있다. nr 버전을 지원하지 않는 이유에 대해서 UniProt이 nr의 European version이기 때문이라고 답변하였다 (링크).
Install #
Requirement #
- Trinotate
- Trinity
- TransDecoder
- sqlite
- NCBI BLAST+
- HMMER/PFAM
Optional #
아래 프로그램들은 academic free version으로 각 프로그램의 홈페이지에서 정보 기입 후 다운로드 받을 수 있다.
Database #
-
SwissProt
$ wget https://data.broadinstitute.org/Trinity/Trinotate_v3_RESOURCES/uniprot_sprot.pep.gz $ gunzip uniprot_sprot.pep.gz $ makeblastdb -in uniprot_sprot.pep -dbtype prot
-
Pfam
$ wget https://data.broadinstitute.org/Trinity/Trinotate_v3_RESOURCES/Pfam-A.hmm.gz $ gunzip Pfam-A.hmm.gz $ hmmpress Pfam-A.hmm
-
Pre-generated Resource SQLite database - swissprot과 uniref90 annotation 정보를 가지고 있다.
$ wget "https://data.broadinstitute.org/Trinity/Trinotate_v3_RESOURCES/Trinotate_v3.sqlite.gz" -O Trinotate.sqlite.gz $ gunzip Trinotate.sqlite.gz
Usage #
다음과 같은 일련의 과정을 단계별로 수행한다.
-
transdecoder 이용하여 peptide candidates 생성
$ TransDecoder.LongOrfs -t transcripts.fa $ TransDecoder.Predict -t transcripts.fa
-
BLAST 수행
$ blastx -query transcripts.fa -db /home/isg/tools/Trinotate/Database/uniprot_sprot.pep -num_threads 20 -max_target_seqs 1 -outfmt 6 > blastx.outfmt6 $ blastp -query transcripts.fa.transdecoder.pep -db /home/isg/tools/Trinotate/Database/uniprot_sprot.pep -num_threads 20 -max_target_seqs 1 -outfmt 6 > blastp.outfmt6
-
hmmer
$ hmmscan --cpu 20 --domtblout TrinotatePFAM.out /home/isg/tools/Trinotate/Database/Pfam-A.hmm transcripts.fa.transdecoder.pep > pfam.log
-
signalp
$ signalp -f short -n signalp.out transcripts.fa.transdecoder.pep
-
tmhmm
$ tmhmm --short < transcripts.fa.transdecoder.pep > tmhmm.out
-
trinotate
$ Trinotate Trinotate.sqlite init --gene_trans_map transcripts.fa.gene_trans_map --transcript_fasta transcripts.fa --transdecoder_pep transcripts.fa.transdecoder.pep >& log.err $ Trinotate Trinotate.sqlite LOAD_swissprot_blastp blastp.outfmt6 $ Trinotate Trinotate.sqlite LOAD_swissprot_blastx blastx.outfmt6 $ Trinotate Trinotate.sqlite LOAD_pfam TrinotatePFAM.out $ Trinotate Trinotate.sqlite LOAD_tmhmm tmhmm.out $ Trinotate Trinotate.sqlite LOAD_signalp signalp.out $ Trinotate Trinotate.sqlite report > trinotate_annotation_report.xls
Output #
Trinotate report 명령어에 의해 출력되는 파일이며 하나의 유전자에 대해 gene_id, transcript_id, sprot_Top_BLASTX_hit, RNAMMER, prot_id, prot_coords, sprot_Top_BLASTP_hit, Pfam, SignalP, TmHMM, eggnog, Kegg, gene_ontology_blast, gene_ontology_pfam 결과를 제공한다.
Incoming Links #
Related Articles (Article 0) #
Related Bioinformaticses (Bioinformatics 1) #
Suggested Pages #
- 0.025 rRNA
- 0.025 ribosomal RNA
- 0.025 Repeat
- 0.025 hmmsearch
- 0.025 EMBL
- 0.025 non-coding RNA
- 0.025 www.uniprot.org
- 0.025 SPARQL
- 0.025 HMMER
- 0.025 core-rnammer
- More suggestions...