Skip to content

PDB #
Find similar titles

Structured data

Category
Database

PDB #

Protein Data Bank의 약자인 PDB는 단백질 구조에서 가장 크고 유명한 데이터베이스다. 단백질이 기능을 하는 폴딩 단계의 3차원 구조정보를 등록 및 제공하는 Primary database이다. 단백질 구조정보는 주로 X-ray 산란 실험, 핵자기 공명(Nuclear Magnetic Resonance)을 이용한 실험정보를 통하여 얻을 수 있으며, 현재 174,448(2020/06/30)개의 구조정보가 수록되어 있으며, 매년 10,000여건 이상의 데이터가 등록되고 있다.(그림2) 등록한 데이터는 아카이브 및 데이터 특성에 따라 다양한 현황을 제공하고 있으며, 사용자가 원하는 통계를 직관적으로 확인이 가능하다.(그림3)

Image

그림1. PDB 홈페이지 (https://www.rcsb.org/)

Image

그림2. PDB 데이터 통계(연간)

Image

그림3. PDB 데이터 특성별 통계 기준

PDB 역사 #

PDB는 1971년 Walter Hamilton에 의하여 Brookhaven National Laboratory에서 설립되었다. 최초에는 7개의 구조정보를 포함하고 있었으며, Hamilton 사후, Tom Koetzle, Joel Sussman 등을 거치면서 발전하였다. 특히 1998 구조 생물 정보학에 관한 연구 Collaboratory (RCSB)는 PDB의 관리를 담당하게 되었으며, 2003년에 wwPDB 라는 거대 분자 구조 데이터의 단일 PDB 아카이브(기록과 저장)를 형성하여 국제사회에 무료로 공개되고 유지되고 있다. 현재 PDB는 구조데이터에 대한 전반적인 사항을 담당하고 있다. (그림4)

Image

그림4. PDB Histroy (2020 업데이트)

PBD에서 선정한 역사적 간행물(논문) #

  • Creating a community resource for protein science
    (2012) Protein Science 21: 1587-1596
  • The Protein Data Bank at 40: Reflecting on the Past to Prepare for the Future
    (2012) Structure 20: 391-396 doi:10.1016/j.str.2012.01.010
  • The evolution of the Protein Data Bank (part of special essay collection on the 40th anniversary of the PDB
    (2011) Nature Structural & Molecular Biology 18: 1310 doi: 10.1038/nsmb1211-1304
  • The Protein Data Bank: a historical perspective
    (2008) Acta Cryst. A64: 88-95. doi: 10.1107/S0108767307035623
  • The PDB: A case study in management of community data
    (2004) Current Proteomics 1: 49-57. doi: 10.2174/1570164043488252
  • Announcing the worldwide Protein Data Bank
    (2003) Nature Structural Biology, 10:. 980. doi: 10.1038/nsb1203-980
  • The Protein Data Bank
    (2000) Nucleic Acids Research 28: 235-242
  • Protein Data Bank
    (1971) Nature New Biology 233:223

파일 형식 #

PDB가 처음 사용한 파일 형식을 PDB 파일 형식으로 텍스트로 되어 있다. 아래의 이미지는 PDB 파일 형식을 보여주고 있다. 첫 번째 칼럼은 원자임을 나타내주는 ATOM이 적혀있고, 두 번째 칼럼은 원자번호를, 세 번째 칼럼은 원자이름, 네 번째 칼럼은 아미노산이름, 다섯 번째 컬럼은 아미노산 번호를, 그리고 원자에 대한 X, Y, Z 좌표를 나타낸다.
Image

그림5. PDB 파일 형식
[출처 : http://www.icellsci.com/bbs/board.php?bo_table=BioNews&wr_id=632]

파일 형식 상세 #

PDB_format_field 분류 section 설명
HEADER 1.Title section PDB entry를 classification / PDB_id 표기
TITLE 1.Title section Entry의 대표적인 분석이나 실험 표기
COMPND 1.Title section Entry의 Macromolecular contents
SOURCE 1.Title section Entry 내의 생물학적 또는 화학적 source (학명 또는 일반 종명등)
KEYWDS 1.Title section Keyword(entry 내용의 단순한 의미)
EXPDTA 1.Title section 실험에 대한 대표적인 정보를 기록(X-ray / NMR / Theoretical model 등을 기록)
AUTHOR 1.Title section
REVDAT 1.Title section 해당 entry에 대한 변형 역사
JRNL 1.Title section 저널명
REMARK 1.Title section 실험에 대한 제세한 기록 / 주석처리 등 다른 레코드에 기록에 되지 않는 정보를 기록
DBREF 2. Primary Structure section PDB 서열의 cross-reference를 제공
SEQADV 2. Primary Structure section DBREF에서 주어진 서열DB의 서열과 실제 PDB entry 사이의 차이를 보여준다.
SEQRES 2. Primary Structure section 실제 PDB entry의 각각의 아미노산 또는 nucleic acid를 표시해준다.
HET 3. Heterogen section Non standard residues 표기(inhibitors, solvent molecules, ions 등)
HETNAM 3. Heterogen section HET에서 주어진 id에 대한 화학명 기록
FORMUL 3. Heterogen section Non standard group의 charge와 화학적 법칙을 제공
HELIX 4. Secondary Structure section PDB entry에서의 helices 위치정보 제공
SHEET 4. Secondary Structure section PDB entry에서의 sheets 위치정보 제공
TURN 4. Secondary Structure section PDB entry에서의 turns과 짧은 loop turn 위치정보 제공
CRYST1 5. Crystallographic and Coordinate transformation section x-ray로 얻어낸 데이터 인 경우 관련 정보를 수록
MODEL 6. Coordinate section NMR에서 얻어낸 데이터 인 경우 모델의 개수나 multiple structures 등의 정보를 수록
ATOM 6. Coordinate section standard residues 의 전자적 위치 정보를 제공한다.
그외 언급된 나머지 부분

PDB 분석 서비스 #

PDB는 데이터의 다운 및 검색을 지원한다. 사용하는 데이터 포맷은 pdb 파일로 서열/2차 구조/3차 구조 내 위치정보 등을 제공하여 뷰어로 3차원 구조 모양을 쉽게 볼 수 있다. 현재에는 일종의 포탈 형태로 변화하고 있다. 특히 시각화기능과 더불어 간단한 분석서비스를 지원하며, 구조정보의 연구 문턱을 낮추고 있다. 시각화기능은 3D 구조를 웹상에서 입체적으로 확인할 수 있으며, 주로 jmol을 사용한다. 분석서비스는 기본적은 서열 Alignment(정렬) 기능을 제공한다. pairwise 정렬(blast2seq, Needleman-Wunsch, and Smith-Waterman) 뿐만 아니라 구조 정렬(FATCAT, CE, Mammoth, TM-Align, TopMatch) 등의 기능을 제공한다. 구조 특징 중 중요한 대칭(symmetry)을 확인하기 위한 프로그램(highlights global, local, and helical symmetry), 구조품질 계산, 단백질 결정의 표면을 구분하여 생물학적인 접촉과 결정학적인 접촉을 구분하는 분석 도구 등을 제공한다.

Image

그림6. PDB에서 제공하는 구조 분석 서비스

PDB 파일 제공 사이트 #

출처 #

Incoming Links #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20140628_0