Skip to content

MCScanX #

Find similar titles

22회 업데이트 됨.

Edit
  • 최초 작성자
    Tuohy
  • 최근 업데이트
    ecjang

Structured data

Category
Software

MCScanX(Multiple Collinearity Scan toolkit) #

MCScanX 의 정의 #

MCScanX는 두 개 이상의 유전체 혹은 서열 등에 포함되는 유전자 정보를 이용하여 homologous 한 synteny region을 찾아내는 프로그램 패키지이다.

MCScanX 의 구조 #

MCScanX 의 구조는 크게 두 가지 단계로 구분할 수 있다. 1. blast 결과 등과 같은 multiple alignment에 대한 결과를 이용하여 synteny 와 collinearity region 에 대해 예측한다.(Core programs) 2. 예측된 synteny, collinearity region 을 분석 및 시각화한다.(downstream programs)

Image

이미지 출처 : MCScanX structure(http://chibba.pgml.uga.edu/mcscan2)

설치 #

MCScanX 의 설치는 매우 간단하며, 모든 MCScanX 내의 모든 프로그램은 MAC OS 또는 LINUX 시스템상에서 실행 가능하다.

http://chibba.pgml.uga.edu/mcscan2/MCScanX.zip
unzip MCScanX.zip
cd MCScanX
make

모든 설치가 완료되면, Core 프로그램인 MCScanX, MCScanX_h, duplicate_gene_classifier와 Downstream 프로그램(총 12개)들을 확인할 수 있다.

Image

이미지 출처 : Downstream programs(MCScanX manual)

MCScanX의 Core 프로그램 #

  1. MCscanX MCscanX은 MCScan 알고리즘을 변형한 것으로, 입력한 reference 의 chromosome에 따라 정렬되는 collinear block들을 detection 하는 프로그램이다.

input 파일은 target protein 을 reference protein에 매칭시킨 blast(.tbl) 파일과 target 및 reference protein에 대한 position 정보를 포함한 gff 파일이다.

  1. MCScanX_h
    MCScanX 는 blastp 의 tbl 파일을 input으로 활용하는 반면, blast가 아닌 다른 프로그램(thirdparty program)에 의해 생성한 pair-wise relationship을 가지는 파일을 input으로 하려면 MCScanX_h 프로그램을 사용해야 한다.

MCScanX 의 결과 #

MCScanX 를 수행하면 다음과 같은 3가지의 파일을 얻을 수 있다.

1. collinearity file
입력한 두 유전체내에 해당하는 유전자 간의 pairwise 하게 연결되는 collinear block에 대한 정보를 포함하고 있다.
예) ## Alignment 0: score=9171.0 e_value=0 N=187 at1&at1 plus
       0- 0: AT1G17240 AT1G72300 0
       0- 1: AT1G17290 AT1G72330 0
       … … … …
       0-185: AT1G22330 AT1G78260 1e-63
       0-186: AT1G22340 AT1G78270 3e-174

2. tandem file
입력한 두 유전체 내의 각 유전체 안의 tandem하게 duplication을 이루는 유전자에 대한 정보를 포함하고 있다.
예) [bio@dj_01 05.2X_WITH_6XPAC]$ head 2X_WITH_6XPAC.tandem
    IBPAC000001CG0450,IBPAC000001CG0460
    IBPAC000001CG0460,IBPAC000001CG0470
    IBPAC000001CG0630,IBPAC000001CG0640
    IBPAC000001CG0640,IBPAC000001CG0650
    IBPAC000001CG0650,IBPAC000001CG0660

3. html files
입력한 두 유전체의 각 유전자별로 collinear block를 이루는 유전자들을 각 contig 별로 나누어서 html 파일을 담는 폴더가 생성된다.

MCScnaX의 Downstream 프로그램 #

MCScanX 패키지에는 Genome 간의 비교를 통해 얻은 collinear block 들을 downstream 프로그램들을 이용하여 다양하게 표현할 수 있다.

dot_plotter #

dot_plotter 프로그램은 두 유전체의 chromosome 간의 collinear block 들을 dot plot 형식으로 표현하는 프로그램이다. 각 점들은 chromosome 간의 pair를 이루는 유전자들을 의미한다.

Image

이미지 출처 : manually created(dotplot 예제)

circle_plotter #

circle_plotter 프로그램은 유저가 지정해놓은 chromosome 간의 collinear block 값을 바탕으로, curved line을 연결하여 유전자 간의 synteny를 원형식으로 표현하는 프로그램이다.

Image

이미지 출처 : manually created(circle plot 예제)

bar_plotter #

bar_plotter 프로그램은 유저가 지정해놓은 chromosome 간의 synteny block을 bar plot형식으로 표현하는 프로그램으로 두 유전체 간의 비교를 할 수 있다.

참고 문헌 #

0.0.1_20230725_7_v68