RNAmmer
#
Find similar titles
- 최초 작성자
- 최근 업데이트
Structured data
- Category
- Software
Table of Contents
Introduction #
RNAmmer는 유전체 서열에서 Hidden Markov Model을 이용하여 5s/8s, 16s/18s와 23s/28s ribosomal RNA를 예측해주는 프로그램(free academic)이다.
Limitations #
박테리아의 유전체 분석 용도로 개발되었기 때문에 5.8s rRNA 예측은 지원하지 않는다. 추후 공개될 버전에서는 진핵생물 5.8S rRNA에 대한 새로운 모델이 포함될 것이라고 한다. 이때 HMMER 3 프로그램과 호환될 것이고 역시 공개 라이선스로 출시될 예정이라고 한다 (관련 포스트 링크).
Install #
- RNAmmer 프로그램을 다운로드 (링크) 후 압축을 푼다.
- 압축을 해제하면 바로 뿌려지기 때문에 반드시 디렉토리 생성 후 그 디렉토리 안으로 이동 후 실행한다.
- hmmsearch (v2) 프로그램을 설치한다 (2.3버전 다운로드 링크)
-
설치가 완료되면 rnammer 스크립트에서 hmmsearch path를 다음과 같이 변경해주어야 한다.
$HMMSEARCH_BINARY = "/path/to/hmmsearch2";
-
rnammer의 INSTALL_PATH도 다음과 같이 변경해 주어야 한다.
$INSTALL_PATH = "/dir/where/you/installed/RNAMMER";
-
빠른 분석을 위해 여러 CPU를 사용하고자 하는 경우에는 core-rnammer 스크립트에서 "--cpu 1"를 삭제해 주어야 한다. "--cpu 1"은 2번 나오므로 모두 제거한다.
Usage #
참고 페이지에서 상세한 설명을 확인할 수 있고, 일반적으로 분석을 위해 많이 사용되는 커맨드라인은 다음과 같다.
$ rnammer -S bac -m lsu,ssu,tsu -xml ecoli.xml -gff ecoli.gff -h ecoli.hmmreport < ecoli.fsa
- -S arc/bac/euk
- -m = molecular type
- tsu : 5/8s rRNA
- ssu : 16/18s rRNA (small subunit; 16s -> prokaryotic / 18s -> eukaryotic)
- lsu : 23/28s rRNA (large subunit; 23s -> prokaryotic / 28s -> eukaryotic)
Tips #
-
XML::Simple 라이브러리 설치가 선행되어야 한다. cpan을 이용하면 쉽게 설치할 수 있다.
cpan install XML::Simple
-
반복서열이 masking된 genome 서열을 써야하는가?
- Repeat 영역의 non-coding RNA (논문 링크)도 있으므로 masking되지 않은 유전체 서열을 이용하여 분석하는 것이 좋을 것 같다.
Incoming Links #
Related Bioinformaticses (Bioinformatics 0) #
Suggested Pages #
- 0.602 TransDecoder
- 0.398 SRA/전사체분석예제
- More suggestions...