Skip to content

PASA #
Find similar titles

Structured data

Category
Software
Image
URL

PASA #

PASA는 TIGR (The Institute for Genomic Research)에서 개발한 Gene structure annotation 툴로서 assembled spliced alignment로부터 gene structure를 예측한다.

기존에 gene structure annotation이 존재하면 UTR영역이나 exon boundary를 업데이트 해주고, 유전자의 병합 또는 나누기, novel gene도 찾아준다.

annotation update #

PASA를 이용하여 기존의 annotation을 업데이트 할 수 있다. 두 단계로 진행되는데 첫번째 단계는 기존 annotation을 pasa database에 로딩하는 과정이다. 이 때 사용되는 input파일은 1)genome.fasta, 2)orig_annotations.gff3 이다.

scripts/Load_Current_Gene_Annotations.dbi \
    -c alignAssembly.config \
    -g genome.fasta \
    -P orig_annotations.gff3

는 gff3형식에 맞게 작성되어있어야 한다. pasa에 함께 제공되는 misc_utilities/pasa_gff3_validator.pl 펄 스크립트를 이용하여 validation 할 수 있다.

misc_utilities/pasa_gff3_validator.pl orig_annotations.gff3

original annotation 로딩 후 진행하는 두번째 단계는, pasa alignment과 을 비교하여 업데이트하는 과정이다. 사용되는 input파일은 1)genome.fasta와 2)all_transcript.fasta이다.

scripts/Launch_PASA_pipeline.pl \
    -c annotCompare.config \
    -A -g genome_sample.fasta \
    -t all_transcripts.fasta.clean

최종적으로 생성되는 파일은 ${mysql_db}.gene_structures_post_PASA_updates.$pid.gff3 이다.

references #

Incoming Links #

Related Bioinformaticses #

0.0.1_20140628_0