SCOPe
#
Find similar titles
- (rev. 12)
- syp
Structured data
- Category
- Database
Table of Contents
SCOP과 SCOPe #
단백질 3D구조를 분류한 SCOP은 Species, Protein, Family, Superfamily, Folds, Class 계층으로 alpha, beta, alpha or beta, alpha + beta 구조적인 형태로 분류하였다. (그림1) 이러한 분류는 모두 수작업에 의한 것이기에 구조 및 진화 연구에 매우 중요한 정보를 제공하였다.
<그림1. SCOP 데이터의 계층>
scop 데이터 계층 정의 #
- Species - 별개의 단백질 서열 갖거나, 자연발생 또는 인공적으로 생성된 변이체
- Protein - 같은 종의 다른 isoform 이거나, 생물학적으로 다른 종의 본질적인 동일한 기능을 가지고 있는 유사한 서열들
- Family - 패밀리는 단백질 서열로는 유사하나, 대체적으로 명확한 고유 기능을 갖고 있음.
- Superfamily - 공통적인 기능 및 구조적 특징을 갖는 단백질 패밀리를 말하며, 공통 진화 조상으로부터 유래 된 것으로 추론함.
- Folds - 구조적으로 유사한 superfailly 그룹
- Classes - 단백질 2차 구조 기준의 분류
SCOP과 SCOPe #
SCOP은 2009년 1.75버전을 마지막으로 더이상 업데이트가 되지 않았으나, 2012년 SCOPe라는 새로운 이름으로 변경되었다. SCOPe로의 변경은 단순히 이름만 변경이 된 것이 아니라 사용한 구조 데이터의 적용범위도 변경되었다. 초기에는 PDB 서열 일부만을 맵핑하였으나, 2012년도 이후에는 그 범위를 확대하였으며, 기존의 수작업 기반의 정보 외에 자동화 방법도 병행하여, 현재 PDB 내 모든 entry를 대상으로 분류정보를 제공하고 있다.(그림2)(그림3)
<그림2. SCOPe 디자인 및 사이즈(2018 기준)>
<그림3. SCOPe 릴리즈(2018 기준)>
SCOPe의 분류 정보 #
SCOPe의 분류는 현재 12가지의 형태이다. 특히 분류된 구조의 서열정보 데이터베이스인 ASTRAL 정보도 통합하여 3D 구조 관련 분류 및 서열 정보를 제공하고 있다.(그림4)
<그림4. SCOPe 분류정보>
SCOPe의 데이터 변천사 #
SCOPe 데이터 통계 #
SCOPe의 주요 7개의 클래스(classes)는 정기적으로 업데이트되고 있으며, 가장 최신에는 98,717 PDB 엔트리와 313,069 도메인(domains)을 제공하고 있다.(2020.05.07, 그림5)
<그림5. SCOPe 데이터 통계>
SCOPe 데이터 성장 #
SCOPe의 데이터는 PDB 엔트리를 기준으로, 성장하고 분류하고 있다.
Release | Freeze date | Release date | Months to release | Total PDB entries | Total PDB entries classified | Total domains classified |
---|---|---|---|---|---|---|
SCOP 1.55 | 2001–03 | 2001–07 | 4 | 13,307 | 13,228 | 31,474 |
SCOP 1.57 | 2001–10 | 2002–01 | 3 | 14,833 | 14,736 | 35,755 |
SCOP 1.59 | 2002–03 | 2002–05 | 2 | 16,067 | 15,985 | 39,893 |
SCOP 1.61 | 2002–09 | 2002–11 | 2 | 17,510 | 17,411 | 44,327 |
SCOP 1.63 | 2003–03 | 2003–06 | 3 | 19,049 | 18,951 | 49,497 |
SCOP 1.65 | 2003–08 | 2003–12 | 4 | 20,715 | 20,619 | 54,745 |
SCOP 1.67 | 2004–05 | 2005–02 | 9 | 24,151 | 24,036 | 65,122 |
SCOP 1.69 | 2004–10 | 2005–07 | 9 | 26,124 | 25,972 | 70,859 |
SCOP 1.71 | 2005–01 | 2006–10 | 21 | 27,844 | 27,599 | 75,930 |
SCOP 1.73 | 2007–09 | 2007–11 | 2 | 44,156 | 34,494 | 97,178 |
SCOP 1.75 | 2009–02 | 2009–06 | 4 | 53,832 | 38,221 | 110,800 |
SCOPe 2.01 | 2012–02 | 2012–03 | 1 | 76,312 | 49,219 | 135,634 |
SCOPe 2.02 | 2012–11 | 2013–01 | 2 | 83,296 | 49,560 | 136,313 |
SCOPe 2.03 | 2013–08 | 2013–10 | 2 | 90,354 | 59,514 | 167,547 |
SCOPe 2.04 | 2014–04 | 2014–07 | 3 | 96,087 | 67,580 | 192,710 |
SCOPe 2.05 | 2014–12 | 2015–02 | 3 | 102,263 | 71,015 | 203,026 |
SCOPe 2.06 | 2016–01 | 2016–02 | 1 | 113,035 | 77,439 | 244,326 |
SCOPe 2.07 | 2017–12 | 2018–03 | 3 | 133,747 | 87,224 | 276,231 |
출처 #
- http://scop.berkeley.edu/
- Nucleic Acids Research, Volume 47, Issue D1, 08 January 2019, Pages D475–D481, https://doi.org/10.1093/nar/gky1134