MCScanX
#
Find similar titles
- 최초 작성자
- 최근 업데이트
Structured data
- Category
- Software
Table of Contents
MCScanX(Multiple Collinearity Scan toolkit) #
MCScanX 의 정의 #
MCScanX는 두 개 이상의 유전체 혹은 서열 등에 포함되는 유전자 정보를 이용하여 homologous 한 synteny region을 찾아내는 프로그램 패키지이다.
MCScanX 의 구조 #
MCScanX 의 구조는 크게 두 가지 단계로 구분할 수 있다. 1. blast 결과 등과 같은 multiple alignment에 대한 결과를 이용하여 synteny 와 collinearity region 에 대해 예측한다.(Core programs) 2. 예측된 synteny, collinearity region 을 분석 및 시각화한다.(downstream programs)
이미지 출처 : MCScanX structure(http://chibba.pgml.uga.edu/mcscan2)
설치 #
MCScanX 의 설치는 매우 간단하며, 모든 MCScanX 내의 모든 프로그램은 MAC OS 또는 LINUX 시스템상에서 실행 가능하다.
http://chibba.pgml.uga.edu/mcscan2/MCScanX.zip
unzip MCScanX.zip
cd MCScanX
make
모든 설치가 완료되면, Core 프로그램인 MCScanX, MCScanX_h, duplicate_gene_classifier와 Downstream 프로그램(총 12개)들을 확인할 수 있다.
이미지 출처 : Downstream programs(MCScanX manual)
MCScanX의 Core 프로그램 #
- MCscanX
MCscanX은 MCScan 알고리즘을 변형한 것으로, 입력한 reference 의 chromosome에 따라 정렬되는 collinear block들을 detection 하는 프로그램이다.
input 파일은 target protein 을 reference protein에 매칭시킨 blast(.tbl) 파일과 target 및 reference protein에 대한 position 정보를 포함한 gff 파일이다.
-
- MCScanX_h
- MCScanX 는 blastp 의 tbl 파일을 input으로 활용하는 반면, blast가 아닌 다른 프로그램(thirdparty program)에 의해 생성한 pair-wise relationship을 가지는 파일을 input으로 하려면 MCScanX_h 프로그램을 사용해야 한다.
MCScanX 의 결과 #
MCScanX 를 수행하면 다음과 같은 3가지의 파일을 얻을 수 있다.
1. collinearity file
입력한 두 유전체내에 해당하는 유전자 간의 pairwise 하게 연결되는 collinear block에 대한 정보를 포함하고 있다.
예) ## Alignment 0: score=9171.0 e_value=0 N=187 at1&at1 plus
0- 0: AT1G17240 AT1G72300 0
0- 1: AT1G17290 AT1G72330 0
… … … …
0-185: AT1G22330 AT1G78260 1e-63
0-186: AT1G22340 AT1G78270 3e-174
2. tandem file
입력한 두 유전체 내의 각 유전체 안의 tandem하게 duplication을 이루는 유전자에 대한 정보를 포함하고 있다.
예) [bio@dj_01 05.2X_WITH_6XPAC]$ head 2X_WITH_6XPAC.tandem
IBPAC000001CG0450,IBPAC000001CG0460
IBPAC000001CG0460,IBPAC000001CG0470
IBPAC000001CG0630,IBPAC000001CG0640
IBPAC000001CG0640,IBPAC000001CG0650
IBPAC000001CG0650,IBPAC000001CG0660
3. html files
입력한 두 유전체의 각 유전자별로 collinear block를 이루는 유전자들을 각 contig 별로 나누어서 html 파일을 담는 폴더가 생성된다.
MCScnaX의 Downstream 프로그램 #
MCScanX 패키지에는 Genome 간의 비교를 통해 얻은 collinear block 들을 downstream 프로그램들을 이용하여 다양하게 표현할 수 있다.
dot_plotter #
dot_plotter 프로그램은 두 유전체의 chromosome 간의 collinear block 들을 dot plot 형식으로 표현하는 프로그램이다. 각 점들은 chromosome 간의 pair를 이루는 유전자들을 의미한다.
이미지 출처 : manually created(dotplot 예제)
circle_plotter #
circle_plotter 프로그램은 유저가 지정해놓은 chromosome 간의 collinear block 값을 바탕으로, curved line을 연결하여 유전자 간의 synteny를 원형식으로 표현하는 프로그램이다.
이미지 출처 : manually created(circle plot 예제)
bar_plotter #
bar_plotter 프로그램은 유저가 지정해놓은 chromosome 간의 synteny block을 bar plot형식으로 표현하는 프로그램으로 두 유전체 간의 비교를 할 수 있다.