Sequence homology #
정의 #
서열 상동성은 DNA, RNA 또는 Protein 서열 간의 생물학적 상동성으로, 해당 서열들은 생명의 진화 역사에서 공통 조상을 갖는 것으로 정의가 된다. 서열 상동성은 일반적으로 뉴클레오타이드 또는 아미노산 서열 유사성에서 추론된다. 중요한 유사성은 두 서열이 공통 조상 서열의 진화적인 변화와 관련이 있다는 것을 의미하고, 여러 서열의 정렬을 통해 각 서열의 어느 영역이 상동인지 알 수 있다. 크게 Ortholog, Paralogs, Xenologs로 나뉜다.
그림 1. Sequence homology. 출처:1
Ortholog #
정의 #
Ortholog란 종 분화로 공통 조상으로부터 유래되어 서로 다른 종에서 공통으로 확인되는 서열을 의미한다. 공통 조상으로부터 유래되었기 때문에, 항상은 아니지만, 일반적으로 같은 기능을 하고, 이러한 특성을 이용하여 분류 및 계통 발생 연구에 중요한 정보를 제공한다. 또한, ortholog 유전자 서열을 확인하고 분석하기 위한 데이터베이스 및 프로그램들이 있다. 서열 비교 방법을 이용하는 것과 phylogenetic, hybrid(heuristic + phylogenetic) 방법이 있다. 프로그램은 아래를 참고하면 된다.
프로그램 #
-
서열 비교 방법
- eggNOG
- OrthoDB
- OrthoMCL
- GreenPhylDB
- InParanoid
- OHNOLOGS
- OrthoInspector
- OrthologID
- OrthoMaM
- Roundup
-
트리 기반 계통 발생 접근 방법
- LOFT
- TreeFam
- OrthoFinder
-
하이브리드 접근 방법
- EnsemblCompara GeneTrees
- HomoloGene
- Ortholuge
Paralog #
정의 #
Paralogous 유전자는 비교되는 종의 마지막 공통 조상(LCA, Last Common Ancestor)에서 중복 이벤트를 통해 관련된 유전자이다. 그들은 별도의 종 분화 하는 동안 중복된 유전자의 돌연변이로 인해 발생한다. 마지막 공통 조상의 후손이 원래 복제된 유전자의 돌연변이 된 homolog를 가지고 있다면, 해당 유전자는 paralog로 간주한다.