Skip to content

UPGMA #
Find similar titles

Structured data

Category
Algorithm

UPGMA #

다양한 생물 종들 간의 관계를 추론하는 계통수를 그리기 위해서는, 각 분류군이 얼마나 가까이 연관되어 있는지를 파악해야 한다. 이를 위해서는 분류군들이 가지는 비교 가능한 특징들을 가지고 계통 추론을 진행할 수 있다. 공동 조상으로부터 기원된 상동성(homologous) 특징이 진화 시간을 거쳐 점차 다르게 분화되어 간다는 진화 원리에 따라, 서로 비슷한 특징을 가질수록 더 가까이 연관되어 있다고 할 수 있다.

UPGMA (Unweighted Pair Group Method with Arithmetic Mean)는 이와 같이 특정 특징들을 비교하고자 할 때 사용되는 여러 추론법 중 pairwise distance method에 속하는 방법 중 하나이다. UPGMA는 직관적으로 거리 계산을 수행하므로, 다른 방법들에 비해 상당히 이해하기 쉬운 편에 속한다. UPGMA 수행은 간단하게, 분석하고자 하는 분류군 중 가장 가까운 관계 둘을 찾아 하나의 새로운 군(cluster)으로 묶어 나가는 것을 반복하는 것으로 진행된다.

UPGMA 수행 방법 #

  1. 가장 가까운 관계 찾기
    계통을 추론하고자 하는 특정 분류군(taxon)들이 가지는 특징들 (DNA 서열, 표현형 등)의 거리를 계산한 뒤, 거리가 가장 가까운 두 개의 분류군을 찾는다.

  2. 가까운 관계를 하나로 묶기
    위에서 찾은 거리가 가장 가까운 두 개의 분류군을 하나의 군(cluster)으로 묶어 이를 또 하나의 분류군으로 생각하게 된다. 이제 가장 가까웠던 두 분류군이 하나의 분류군으로 간주되므로, 분류군들 간의 거리를 새로 다시 계산하게 된다.

  3. 위 과정 반복
    위의 1-2 과정을 반복할 때마다 두 개의 분류군이 하나로 합쳐지게 되므로, 위와 같은 과정을 반복함에 따라 두 개의 분류군이 점차적으로 묶여 나가게 된다. 최종적으로 마지막 두 개의 분류군을 묶게 되면 최종적으로 계통 관계도를 얻을 수 있게 된다.

UPGMA 수행 예시 #

26_19-UPGMA

위 그림의 표 (a)는 사람(Human), 침팬지(Chimp), 고릴라(Gorilla), 큰긴팔원숭이(Siamang), 긴팔원숭이(Gibbon) 간의 유전적 거리를 나타내고 있다.

표 (a)를 보면 사람-침팬지 간의 유전적 거리가 1.628로 가장 가까움을 알 수 있다. 따라서, 이 둘을 (b)와 같이 묶은 뒤에 하나의 분류군, “사침(Hu-Ch)”으로 간주할 수 있다.

다시 한 번 사침, 고릴라, 큰긴팔원숭이, 긴팔원숭이 간의 거리를 계산하면, 표 (c)에서 볼 수 있듯이 큰긴팔원숭이와 긴팔원숭이 간의 유전적 거리가 1.95로 가장 가까움을 알 수 있다. 따라서 이 둘을 그림 (d)와 같이 하나로 묶는다. 이제 이 둘은 하나의 분류군, “큰긴(Si-Gi)”으로 간주된다.

마찬가지로, “사침”, 고릴라, “큰긴” 간의 거리를 계산하면, 표 (e)에서 볼 수 있듯이 “사침”과 고릴라 간의 거리가 가장 가까움을 알 수 있다. 따라서 이 둘은 “사침고(Hu-Ch-Go)”라는 하나의 분류군으로 간주하면서, 그림 (f)와 같이 묶어줄 수 있다.

마지막으로 남은 두 개의 군, “사침고”와 “큰긴”을 하나의 군으로 묶어주며 계통도를 완성할 수 있다.

참조문헌 #

Incoming Links #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20140628_0