Table of Contents
AUGUSTUS [gene prediction] #
진핵 생물의 유전자 구조 즉, exon-intron, utr, CDS, mRNA, gene 영역을 예측하기 위한 프로그램
Features #
- 2003년 Hidden-Markov Model에 기초하여 독일의 괴팅겐 대학에서 처음 개발된 이후 2016년 현재까지 계속 업데이트되고 있음
- ESTs, mRNA, RNA-seq 서열(일반적인 NGS reads 모두 가능)을 기반으로 유전체 서열에 매핑된 정보를 바탕으로 유전자 예측이 가능
- 보존도가 높은 특정 protein family의 예측이 가능 - 이를 위해 특정 family protein의 alinment 정보로 부터 이들의 잘 보존된 exon-intron 구조를 block화 하여 protein profile extension (PPX)을 생성하고 이를 이용해 유전자를 예측, PPX는 생성은 제공되는 추가적인 스크립트를 통해 제작이 가능함
- 새로운 유전체에 대한 유전자 예측을 위해 해당 종에 맞춰진 training HMM 구축과 유전자 예측이 가능
- alternative splicing 및 alternative transcripts 예측이 가능
- Linux 환경에서 local analysis와 web을 통한 analysis 모두 가능
Web Augustus #
Training #
- 새로운종의 training을 수행해줌
- URL : http://bioinf.uni-greifswald.de/webaugustus/training/create
-
input file
1. genome sequence (필수항목) 2. cDNA file / protein file / training gene structure file (.gff or .gb)(필수항목)
Prediction #
- 제공되는 training HMM을 통해 유전자 예측
- URL : http://bioinf.uni-greifswald.de/webaugustus/prediction/create
-
input file
1. genome file (필수항목) 2. species parameter 선택 및 upload (필수항목) 3. cDNA file/ hints file
supported species #
animal | alveolata | plants and algae | fungi | bacteria | archaea |
---|---|---|---|---|---|
22 종 | 2 종 | 9 종 | 32 종 | 3 종 | 1 종 |
Program download #
(http://bioinf.uni-greifswald.de/augustus/binaries/)