Skip to content

UniProt #

Find similar titles

11회 업데이트 됨.

Edit
  • 최초 작성자
    JSeo
  • 최근 업데이트
    hmkim

Structured data

Category
Database

UniProt #

UniProt #

UniProt은 Swiss-Prot, TrEMBL 및 PIR-PSD 데이터베이스를 결합하여 생성된 단백질 데이터의 중앙 저장소인 Universal Protein Resource이다.

Research center #

EMBL-EBI(The European Bioinformatics Institute), UK;
SIB(Swiss Institute of Bioinformatics), Switzerland;
PIR(Protein Information Resource), US.

Data format #

Custom flat file, FASTA, GFF, RDF, XML.

Website #

www.uniprot.org
www.uniprot.org/news/

UniProtKB(UniProt Knowledgebase) #

UniProtKB는 단백질에 관한 기능 정보를 수집하기 위한 central hub이며, 정확하고 일관성있는 풍부한 annotation이 붙어 있다. 각 UniProtKB 항목에 필수 핵심 데이터(주로 the amino acid sequence, protein name or description, taxonomic data and citation information)를 캡처할뿐만 아니라 가능한 많은 annotation 정보가 추가된다.

UniProtKB/Swiss-Prot #

High quality annoation과 관련되어 신뢰할 수 있는 단백질 서열(description of the function of a protein, its domain structure, post-translational modifications, variants 등) 및 최소 수준의 중복성과 다른 데이터베이스와의 높은 수준의 통합을 목표로 하는 데이터베이스로 리뷰가 완료된 데이터로 구성되어 있기 때문에 신뢰도가 높은 정보를 제공하고 있다(manually annotated, non-redundant). - UniProtKB/Swiss-Prot annotation에는 다양한 sequence 분석 도구가 사용되며, 컴퓨터 예측을 manually하게 평가한다. 이러한 예측에는 post-translational modifications, transmembrane domains and topology, signal peptides, domain identification, protein family classification 등이 포함된다.

  • 2020-08-12 ver. 563,082 sequence entries

Number of entries in UniProtKB/Swiss-Prot over time #

Image

Swiss-Prot entries per taxonomic group & Eukaryota #

Image

Amino acid distribution statistics #

Image


UniProtKB/TrEMBL #

Swiss-Prot 데이터베이스에 등록되기 위해 소요되는 시간보다 새로운 sequence 데이터가 생성되는 속도가 현저히 빠르기 때문에, 이러한 새로운 sequence 데이터는 TrEMBL 데이터베이스에 등록이 되어 제공된다. 그로 인해 TrEMBL 데이터베이스에는 리뷰되지 않은 데이터가 쌓이게되어 Swiss-Prot 데이터보다는 신뢰도가 떨어지지만, 데이터 양 측면으로 보면 Swiss-Prot 데이터베이스보다 방대한 양의 데이터를 보유하고 있다.

  • 2020-08-12 ver. 188,961,949 sequence entries

Number of entries in UniProtKB/TrEMBL over time #

Image

TrEMBL entries per taxonomic group & Eukaryota #

Image

Amino acid distribution statistics #

Image

제공 TOOLs #

UniProt 통합 사이트에서는 사용자 데이터와 등록한 UniProt데이터를 비교하거나 사용자 친화적인 검색 기능을 제공한다. 대표적으로 BLAST, Align, Retrieve/ID mapping , Peptide search, SPARQL과 같은 웹 TOOLs를 제공하고 있다. 이 중 BLAST를 제외한 다른 TOOLs의 기능은 다음과 같다.

Align #

Align은 Clustal Omega를 사용한 다중정렬 서열 검색을 제공하는 것으로 2개 이상의 단백질 서열을 입력하면 서열의 정렬 정보를 웹으로 확인할 수 있다.


Image

Retrive/ID mapping #

UniProt ID는 기본적으로 UniProt에서만 사용한다. 이럴 경우, 같은 서열정보라 해도 사용하는 참고데이터베이스마다 고유한 ID를 부여하게 된다. UniProt에서는 NCBI와 같이 자주 사용하는 ID들을 UniProt ID로 변환하는 기능을 제공한다. 따라서 사용자가 원할 경우, 다른 데이터베이스의 서열정보의 ID를 대량으로 변환하는 것이 가능하다.


Image

Peptide search #

긴 아미노산으로 이루어진 Peptide 서열의 계통적 분류 및 기능을 검색하는 기능으로 UniProt 데이터 전체를 대상으로 미확인 Peptide의 기능을 추측할 때 사용한다.


Image

SPARQL #

SPARQL은 UniProt에서 제공하는 스파클(SPARQL, SPARQL Protocol and RDF Query Language) 질의어를 사용하여 사용자가 웹에서 직접 원하는 정보를 검색할 수 있다. 스파클은 RDF 질의어를 사용할 경우, UniProt 데이터베이스를 대상으로 시맨틱 질의어로 정보를 검색 확인할 수 있다.


Image

Reference #

Incoming Links #

Related Articles #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20230725_7_v68