Skip to content

PIR #
Find similar titles

Structured data

Category
Database

PIR #

PIR(Protein Information Resource)은 미국에 위치한 단백질 데이터베이스이다. 현재 Uniprot 컨소시엄의 포함되어 있으며, 게놈, 프로테옴 및 시스템 생물학 연구 및 과학 연구를 지원하는 공용 생물 자원이다.

PIR

그림1. PIR 메인페이지

PIR 역사 #

PIR은 조지타운대학병원(Georgetown Univ. Medical Center)과 국립생의학연구재단(National Biomedical Research Foundation)이 공동으로 일궈낸 성과물이다. PIR은 마가렛 데이호프(Margaret Dayhoff) 박사의 노력이 결실을 맺어 지난 1984년에 구축되었다. 그녀는 지난 1965년부터 1978년에 걸쳐 단백질 아미노산 서열과 구조 도해서(Atlas of Protein Sequence and Structure)를 출판했는데, 이것은 단백질 서열에 대한 최초의 종합 성과물이었다. 1974년에는 데이호프 박사가 단백질 서열의 유사성을 기준으로 단백질과(protein family)와 그 상과(super-family) 개념을 고안해 이를 단백질 계통 정리와 분류 방법으로 활용했다. PIR에 등재된 목록은 이 같은 방법과 단백질 기능 및 구조에 대한 자료를 컴퓨터로 분석한 결과를 토대로 정리된 것이다.

Uniprot project #

2002년 대한민국의 월드컵의 열기가 식어갈 무렵에 세계 3대 단백질데이터베이스인 SWISS-PROT, TrEMBL, PIR(Protein Information Resource)을 하나로 묶는 프로젝트가 일어났다. 연합 단백질 데이터베이스(United Protein Database), 약어로 UniProt로 명명 되었으며, 현재의 UniProt 이다. 계획 초기에 Swiss-PROT 과 TrEMBL 두 부분으로 구성하고 PIR은 유지 않을 계획이었으나, EMBL 자료를 SWISS-PROT 기준에 적합하게 보강하는 작업에 PIR 자료활용이 되었다. 현재에는 PIR 목록은 UniProt에 통합되었다. 공적 자금이 투입된 프로젝트이기에 오픈데이터베이스를 지향하였고, 인간의 질병 연구에 유용한 수단을 마련하는 동시에 전 세계 연구원들이 포괄적이면서도 쓰레기 정보가 포함되지 않은 고급의 단백질 정보원을 무료로 자유롭게 사용할 수 있도록 하겠다는 목적이 있었기에 현재 단백질 서열정보는 UniProt이라는 대표 아이콘이 될 수 있었다.

현재의 PIR #

현재 크게 2가지 데이터베이스와 온톨로지 정보를 제공하고 있다.

데이터베이스 내용
PRO(Protein Ontoloy) 단백질 서열의 고유 entry를 제공하여, 이 범위는 단백질 관련 모든 정보(구조 및 서열)를 수록
iProClass 단백질 id mapping 정보
iProLINK 텍스트마이닝으로 생성된 단백질 정보

이러한 자원은 프로테옴 게놈 데이터 통합 및 전파 및 단백질 주석(annotation)의 표준화를 지원하기 위하여 제공되며, 특히 Id mapping 정보는 최근 까지도 업데이트되고 있다.

출처 #

http://pir.georgetown.edu/pirwww/index.shtml

Incoming Links #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20140628_0