Skip to content

ClustalW #

Find similar titles

5회 업데이트 됨.

Edit
  • 최초 작성자
    Hana Song
  • 최근 업데이트
    Jaeng

Structured data

Category
Algorithm

ClustalW #

ClustalW는 Alignment를 위한 알고리즘 중 하나로 DNA 서열 혹은 protein 서열의 다중정렬을 위해 사용한다. ClustalW의 결과 진화적인 관계는 Cladograms 또는 Phylograms 레이아웃을 통해 뷰어할 수 있다.

ClustalW는 Progressive alignment를 기반으로 하며(아래),

Image

서열 정렬을 하기 위한 알고리즘은 아래 3 단계로 진행이 된다.

  1. 서열의 조합 별 pairwise 유사도 측정: Homology 행렬을 만들기 위해 Wilbur & Lipman 알고리즘을 사용하며, 서열의 수에 따라 0.5N(N-1) 수 만큼 연산이 필요하다.

  2. 행렬을 통한 계통수 생성: 기본적으로 UPGMA 방법을 이용하여 행렬을 다루게 되며, pairwise similarity 측정후, 점수 파일은 입력으로 하고, 각 분석된 집단 기록으로 생성된 계통수를 출력하고 다시 정렬 프로그램의 입력이 된다.

  3. 계통수 내의 군집화 순서에 따른 다중정렬 클러스터링을 통해 생성된 계통수와 최초 서열 데이터를 입력받아, Wibur & Lipman 방식으로 정렬한다.

프로젝트 종료 #

계통분석과 생물정보 분야에서 오래동안 사랑받던 ClustalW 와 ClustalX 프로젝트는 종료되었다. 프로젝트가 종료 되면서 더이상 공식적인 기능 업데이트나 오류 수정 업데이트가 지원되지 않게 되었다. European Bioinformatics Institute에서도 ClustalW를 활용한 Multiple_alignment 서비스를 종료하였으며, DNA 서열의 Multiple_alignmentMUSCLE이나 MAFFT를, Amino acid 서열의 Multiple_alignmentClustal Omega를 활용하도록 권장하고 있다. 물론 Clustal OmegaDNA 서열 Alignment를 지원하며 Hidden_Markov_model 기반의 Multiple_alignment 알고리즘으로 훨씬 빠른 속도로 결과를 보여준다.

ClustalW 이용하기 #

참고 사이트 #

Incoming Links #

Related Data Sciences #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20230725_7_v68