Skip to content

InParanoid #
Find similar titles

Structured data

Category
Software

InParanoid 8 : Ortholog Groups with Inparalogs #

273종의 complete proteom data를 바탕으로 구성된 ortholog 유전자 분석을 위한 데이터베이스 및 분석 프로그램이다.

  1. Orthologs : 종분화를 통해 하나의 유전자에서 유래된 다른종간의 유전자를 뜻하는 것으로 바로 위 조상의 single gene에서 직접적으로 유래된 유전자임.

  2. Paralogs : 종분화 이후에 유전자의 duplication에 의해 한종내에서 분리된 유전자를 뜻하는 것.

  3. Inparalogs : 종분화 이후에 duplication에 의해 multiple co-orthlogs를 형성하는 것.

  4. Outparalogs : 종분화 이전에 duplication에 의해 유래된 유전자로 동일한 종이든 혹은 다른종에서든 발견되는 유전자 group.

즉, A종에서 A-1, A-2 유전자가 있을 경우 B종으로 분화되면서 B-1 유전자는 A-1 유전자와 ortholog 관계가 된다. 그런데, 이때 B-2 유전자는 duplication 되어 B-2-1, B-2-2 유전자가 되었을 경우 B-2-1과 B-2-2는 Paralog 관계를 갖게 되며, A-1<=>B-1, A-2<=>B-2-1, B-2-2 의 관계가 Inparalogs가 된다. 이후 C 종으로의 분화시에 C-1, C-2-1, C-2-2로 분화 되었을 경우 B-2-1 <=> C-2-1은 Inparalog이나 B-2-1 <=> C-2-2는 Outparalog 관계가 된다.

따라서 이와 유사한 종간의 family 유전자와 duplication 유전자 구분이 어렵기 때문에 Otholog 분석은 그 경계가 모호한 부분이 존재한다. 이러한 구별을 위한 보다 분명한 목적으로 고안된 알고리즘이 InParanoid로 outparalog는 제외하고 inparalogs 만을 대상으로 분석되었다.

Web http://inparanoid.sbc.su.se/ 을 통한 user interface를 제공하고 있어 실제 데이터 분석을 수행할수 있다.

InParanoid 8 data 구성 #

  1. 273종의 reference proteome database
    • Eukaryotic : 246종
    • Bacteria : 20 종
    • Archaea : 7 종
  2. 3,718,323 sequence database

Workflow #

  1. Graph-based method로 BLAST를 이용한 서열 비교 이후 각 ortholog groups별로 clustering을 수행한다.
  2. 이미 분석된 ortholog관계 정보를 가지고 있는 3,718,323 유전자와 관계 설정한다.

Image

Running #

  1. Web site를 통한 서열 입력후 BLAST 수행

    http://inparanoid.sbc.su.se/cgi-bin/blast_search.cgi

  2. 분석 결과를 이용한 phylogenetic tree 구성

    • ortholog grups내 유전자를 대상으로 phylogenetic distance score를 계산 할수 있음.

Reference #

0.0.1_20140628_0