Skip to content

Motif #
Find similar titles

Structured data

Category
Biology

Motif 란 #

단백질 서열 내의 특징이 보존된 짧은 펩타이드 서열이다. 이 motif는 단백질 내에서 구조적(ex: Zinc finger motif), 기능적으로 중요하다. 보통 짧은 것이 특징이나 특이적으로 15 ~ 20 정도의 긴 서열도 존재한다. 기능이 보존된 패턴이기에 Domain과 비교가 된다. motif 는 수학적 모델로 생성한 단순한 패턴인데 반해 Domain 은 단백질 구조(1차, 2차, 3차, 4차 구조)와 단백질 패밀리(family, superfamily 등) 에 연관되어 있고, 서열데이터 측면으로 보면 아미노산 길이의 차이가 있다.

Motif 서열 패턴

그림1. Motif 서열 패턴

Motif와 Domain

그림2. Motif와 Domain

BLOCK #

다중 정렬 내 미공백 영역과 대응하는 매우 보존된 영역의 패턴을 모아놓은 Motif 데이터베이스로 2007년 최종 버전 이후는 없으며, 현재 InterPro 내의 member database로 제공 된다.

BLOCK motif 탐색 방법

그림3. BLOCK motif 탐색 방법

BLOCK 최종 데이터 통계량

그림4. BLOCK 최종 데이터 통계

PRINTs #

단백질 Fingerprint 방법(단백질 서열의 패밀리들의 특징을 갖는 보존된 패턴을 사용)이용한 한 Motif 데이터베이스로 2009년 1950개의 entry 이후 업데이트가 되지 않고 있으며, 현재 InterPro 내 member database로 제공 된다.

PRINTs 최종 데이터 통계량

그림5. PRINTs 최종 데이터 통계

PROSITE #

genomic 또는 cDNA의 서열에서 유래한 미번역 단백질의 특징을 pattern 또는 profile 방법으로 domain 및 motif 정보를 제공하며, ProRule로 manual한 정보를 제공한다. 현재 20.104버전(07/06/2014)이 릴리즈 되었으며, InterPro 내 member database로 제공된다.

PROSITE 최종 데이터 통계량

그림6. PROSITE 최신 데이터 통계

InterPro #

Motif 및 Domain 정보를 제공하는 통합데이터베이스로 여러개의 member database를 대상으로 정보를 선별 후 통합한다. 현재 47.0버전이 릴리즈 되어 있으며, 총 11개의 meber database와 14개의 signature database(Prodom / PIR / Pfam / Smart / Tigr / Profilescan / HaMap / Patternscan / Superfamily / signalP / TMHMM / Gene3D / Phobius / Coils) 를 제공한다. 검색 방법은 InterProscan을 사용하여, member DB의 sinature DB를 선택 후 fasta 형식의 파일을 입력한다.

InterPro 구성 방법

그림7. InterPro 구성 방법

InterPro Member databases

그림8. InterPro Member databases

InterPro 최신 데이터 통계량

그림9. InterPro 최신 데이터 통계

Incoming Links #

Related Data Sciences #

Related Articles #

Suggested Pages #

0.0.1_20140628_0