Skip to content

TopHat-Fusion #
Find similar titles

Structured data

Category
Software

Description #

만성 골수성백혈병 (CML, chronic myelogenous leukemia) 환자 중 90% 이상에서 BCR (chromosome 22) 과 ABL1 (chromosome 22) fusion gene 발현이 보고된 바 있다 (Ozsolak, F. and Milos, P. RNA sequencing: advances, challenges and opportunities. Nature Review Genetics. 2011). 이처럼 암연구 분야에서 다양한 fusion gene이 발견되고 있고 암 발생 과정에 영향을 미치고 있다.

TopHat-Fusion 프로그램을 이용하면 RNAseq 데이터를 이용하여 fusion gene을 쉽게 찾을 수 있다. 특히 TopHat-Fusion 프로그램을 이용하면 최종적으로 얻어진 fusion gene에 대해서 자동으로 BLAST를 수행해 줌으로써 탐색된 fusion gene이 repeat, pseudogene 등이 아닌지 추가적으로 검사할 수 있다.

Usage #

$ tophat -o [output directory] -p 8 --fusion-search --keep-fasta-order --bowtie1 --no-coverage-search -r 0 --mate-std-dev 80 --fusion-min-dist 100000 --fusion-anchor-length 13 --fusion-ignore-chromosomes chrM [genome index base] [reads1_1[,...,readsN_1] [reads1_2,...readsN_2]

$ tophat-fusion-post --num-fusion-reads 1 --num-fusion-pairs 2   --num-fusion-both 5 [genome index base]

Comment #

  • tophat running 시 --fusion-search 옵션을 적용하면 tophat alignment를 통해 fusion break point를 탐색하고 fusion candidate를 출력한다 (fusions.out).
  • 이후 tophat-fusion-post 프로그램을 통해 supproting reads count와 coverage를 고려하여 false-positive를 필터링하는데 이때 프로그램이 디렉토리 구조를 인식하여 input 파일을 가져오기 때문에 아래 그림과 같이 커맨드라인이 실행되는 위치에 특정 파일과 디렉토리가 존재해야 한다. tophat alignment 결과 bam 파일, fusions.out 파일은 "tophat_"로 시작하는 디렉토리 아래 위치해야 한다.

Installation #

현재 최신 버전은 2.0.13 (2014. 10. 2)이다.

$ wget http://ccb.jhu.edu/software/tophat/downloads/tophat-2.0.13.Linux_x86_64.tar.gz
$ tar xvfz tophat-2.0.13.Linux_x86_64.tar.gz

BLAST search를 위해 NCBI BLAST+ 및 BLAST database를 셋팅해 주어야 한다. NCBI FTP 페이지에서 파일 다운로드 후 압축을 해제하면 된다.

Suggested Pages #

0.0.1_20210630_7_v33