Skip to content

OrthoMCL #

Find similar titles

1회 업데이트 됨.

Edit

Structured data

Category
Software

OrthoMCL #

OrthoMCL이란? #

OrthoMCL은 Markov Cluster 알고리즘을 사용해 다수의 진핵생물의 단백질 서열 사이에 orthologous, paralog group을 구분하여 확인할 수 있게 해주는 프로그램이다. OrthoMCL은 MySQL과 Oracle 서버를 이용해서 구동하기 때문에 configuration 파일을 설정하는 것이 필요하다. 또한 OrthoMCL의 파이프라인은 여러 단계로 구성되어 있기 때문에 각 단계별로 필요한 것을 확인하고 오류를 검토해야 한다.

OrthoMCL의 Pipeline을 구동하기 #

  • OrthoMCL의 input 파일 준비 : OrthoMCL의 input 파일은 fasta format의 단백질 서열로 OrthoMCL에 적합한 format으로 변경하기 위해 orthomclAdjustFasta step과 orthomclFilterFasta step을 이용해야 한다.

    사용 예제 : orthomclAdjustFasta fasta_file alias
    사용 예제 : orthomclFilterFasta fasta_directory 10 20
    
  • OrthoMCL은 또한 BLAST를 사용하기 때문에 BLASTALL의 BLASTP 또는 BLAST+의 BLASTP를 사용해서 tab으로 구분된 output을 얻어야 한다. 이후 OrthoMCL의 적합한 output으로 만들기 위해 orthomclBlastParser step을 이용한다.

    사용 예제 : orthomclBlastParser BLAST_result fasta_directory >> similarSequence.txt
    
  • 이후 단계부터는 MySQL이라 Oracle에 의해서 구축한 orthoMCL의 database에 data를 load하고 사용하는 것이기 때문에 시간이 좀 더 걸리는 step들이다. 또한 이때 앞에서 설정한 configuration 파일을 이용하기 때문에 자신의 환경에 맞게 잘 설정했는지 확인해야할 필요가 있다.

OrthoMCL의 결과 #

결과적으로 OrthoMCL이 성공적으로 끝나면 groups.txt라는 파일을 얻을 수 있으며 해당 파일 안에 orthology group으로 묶인 종들의 단백질을 확인할 수 있다.

OrthoMCL 결과 벤다이어그램 그리기 #

OrthoMCL 분석 결과 얻어진 종별 orthologous/specific gene을 벤다이어그램으로 시각화하는 방법은 다음과 같다.

  • Input 단백질 예시(파란색: orthologous genes, 빨간색: species-specific genes)

    human : human1, human2, human3, human4
    mouse : mouse1, mouse2, mouse3, mouse4
    dog : dog1, dog2
    
  • OrthoMCL 결과 예시

    group1: human1 human2 mouse1 dog1
    group2: human3 mouse2
    group3: mouse3 mouse4
    
  • Step 1. Orthologous group별 각 종이 해당하였는지(TRUE 또는 1) 아닌지(FALSE 또는 0) 나타내기

    group   human   mouse   dog
    group1  1   1   1
    group2  1   1   0
    group3  0   1   0
    
  • Step 2. OrthoMCL 결과에 포함되지 않는 종 특이적인 유전자들을 유전자 개수만큼 추가하기

    human4  1   0   0
    dog2    0   0   1
    

이때 첫 번째 컬럼 명은 원하는 대로 줄 수 있으나 중복되지 않도록 주의한다.

  • Step 3. R에서 import 후 벤다이어그램 그리기

R에서 벤다이어그램을 그리는 방법은 R (프로그래밍 언어)/VennDiagram을 참고한다.

Reference #

Incoming Links #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20231010_1_v71