Table of Contents
The Human Protein Atlas(HPD) #
개요 #
The Human Protein Atlas는 현존하는 인간 단백체 정보를 포괄하는 데이터베이스다(그림1). HPD 프로젝트는 2003년 스웨덴의 the Knut and Alice Wallenberg foundation의 펀딩을 받아 왕립공과대학(Royal Institute of Technology에서 프로젝트가 처음 시작되었다. 스톡홀롬의 Uppsala 대학의 공헌으로 현재까지 유지, 확장되고 있다. 최근에는 인도, 한국, 일본, 중국, 프랑스, 스위스, 미국 등 14개 국가와 협력하고 있어 유용한 인간 단백체 데이터베이스 구축에 힘을 쏟고 있다.
뇌, 심장, 폐, 간 등의 주요 장기부터 생식기, 피부와 같은 분류된 인간 조직, 세포를 대상으로 한다. 최근에는 암조직을 대상으로한 데이터도 포함되어 인간 단백체 발현 데이터베이스 중 가장 잘 만들어졌다고 해도 과언이 아니다. 데이터베이스는 앞서 인간 장기조직 및 세포에서 전사체, 단백질체의 정량화, 도식화 자료를 기초로 한다. 다양한 플랫폼을 사용해 수집되어 있다(그림2). 특히 단백질 정량을 위해 필요한 항체(antibody) 합성, NGS, Protein array 등 최신 기술을 통해 얻은 데이터로써 이들 기초 데이터가 public DB를 통해 공개된다는 점이 특징이다.
조직(Organization) #
Prof Mathias Uhlen, Program Director
Dr Tove Alm, Program Coordinator, Head of Communications
Assoc prof Emma Lundberg, Director of Cell Atlas
Dr Cecilia Lindskog Bergstrom, Director of Tissue Atlas
Prof Fredrik Ponten, Director of Cancer Atlas
Dr Hanna Tegel, Director of protein and antibody production
Prof Peter Nilsson - Head of biomarker discovery and protein arrays
Prof Sophia Hober - Head of protein science
Kalle von Feilitzen, Director of Bioinformatics and IT
Dr Asa Sivertsson, Head of Curation
특징 #
스웨덴 Uppsala 대학의 Pathology Clinic 이라는 조직의 유수한 생리학자들에 의해 대부분의 자료가 다루어지고 있다. 단백체 발현을 정량, 가시화를 위한 항체(antibody)가 필요하다. 인간의 유전자는 약 21,000개로 알려져 있지만 이들에서 비롯되 단백질은 250,000~1,000,000개에 이르는 것으로 추정된다. 이들 단백질은 변형(folding), 복합체(complex) 형성과 같은 구조적 변화 능력을 갖기 때문이다. 이들 단백체 발현을 가시화하는 일반적인 방법으로써 면역염색법(Immuno histochemistry, IHC) 방법이 있으며 이를 위해 앞서 설명한 항체가 필요하다. HPD는 인간 단백체를 대상으로 하기 때문에 상업적으로 판매되는 것 뿐만 아니라 협력기관을 통해 직접제작도 수행한다. HPD는 현재 16,000 여개 유전자에 대한 단백질 발현정보 데이터를 보유 중 이다.
앞서 설명한 바와 같이 HPD는 인간조직, 세포, 그리고 암조직, 이렇게 세 개의 분류로 되어있다. 검색엔진이 잘 갖추어져 있기 때문에 동의어(synonym)를 잘 인식하는 편이다. 따라서 유전자, 단백질 심볼, 이름 등 다양한 키워드를 이용해 검색 가능하다.
HPD는 Tissue atlas, Cell atlas, 가장 최근 구축된 Cancer atlas로 분류된다. 각각은 항체를 이용한 면역염색법을 사용한다는 점에서 공통점이 있지만 연구 목적에 맞는 조직, 혹은 세포를 대상으로 분류된다.
Tissue atlas #
44개의 세부 조직으로 나뉘어 있다. 물론 생식기관과 같이 여성과 남성의 독자적 기관을 구분한다. 기본적으로 정상인의 조직에서 면역염색을 진행한 후 고해상도 이미지를 추출한다. 현재 15,000여 개 유전자 단백질에 대한 발현 정보를 제공한다.
Cell atlas #
56개의 대표적인 정상 세포주 패널에 대한 단백질 발현 정보를 제공한다. 고해상도의 면역염색이미지를 통해 세포 내 위치를 확인한 정보도 담고 있다. 현재 12,000 여 개의 유전자로부터 기인한 단백질을 커버하고 있다.
Cancer atlas #
앞서 Cell atlas와 유사하나 암 세포주를 대상으로한 발현 정보를 제공한다는 점이 특징이다. 20 여 종 암의 216개의 시료를 대상으로 단백질 발현 정보를 보유하고있다. 또한 각 시료에 대한 개체의 기본적인 표현형 정보도 제공한다.
자료의 구성 #
-
General Information
유전자, 단백질의 이름, 심볼, 단백질의 분류, 세포에서의 위치등 기본 정보를 포함한다.
-
Human protein atlas information
전사체, 단백질의 주효 발현 기관을 보여준다.
-
RNA and protein expression summary
인간 신체모식도와 막대그래프를 이용해 검색한 단백질의 조직에서의 발현을 직관적으로 비교 할 수 있다.
-
Data reliability
해당단백질에 대한 항체의 실용성 검증 데이터를 제공한다.
-
Protein expression overview
면역염색을 통해 해당 단백질의 조직 별 상대발현 정보를 제공한다.
-
RNA expression overview
조직 내 전사체의 발현을 TPM(transcripts per killobase million)으로 나타낸다.
-
Gene information
해당 단백질가 코딩되는 유전자에 대한 정보를 담고 있다. [[ENSEMBL]], [[Uniprot]], [[refSeq]], [[Entrez]] 링크 등을 제공한다.
-
Protein browser
단백질의 서열 상 항체의 결합부 정보를 제공한다. 또 다양 아형(alternative splicing form) 별 로 구분되어 있다.
-
Protein information
해당 단백질의 아형에 대한 정보를 담고 있다.
출처 #
HPD page: <http://www.proteinatlas.org/>