Skip to content

BioGRID #
Find similar titles

Structured data

Category
Database

BioGRID #

BioGRID(Biological General Repository for Interaction Datasets)는 유전자들의 상호연관성(Genetic and Protein–protein interaction) 정보를 담고 있는 대규모의 데이터베이스로, 캐나다의 몬트리올 대학과 Mount Sinai 병원 등에 소속된 연구원들이 중심이 되어 운영하고 있다. 모든 데이터는 연구논문으로부터 텍스트마이닝 방식으로 수집정리(curation)된 것이며 2019년 현재 최신인 3.5.176버전에서는 총 70,417건의 연구논문으로부터 1,732,644건의 상호연관 정보와 28,093건의 화학적 조합(chemical association) 정보, 그리고 874,796건의 PTM(Post-translational modification)정보를 보유하고 있다. BioGRID에서 제공하는 모든 연관정보 데이터는 웹상에서 통합된 파일형태로 누구나 다운로드 받을 수 있으며, 어떠한 용도로도 자유롭게 활용이 가능하다. (다운로드 페이지 열기)

BioGRID 데이터의 구성 #

BioGRID에서는 다양한 쓰임새를 고려하여 데이터를 여러 타입으로 제공하고 있다.

BIOGRID-ALL-3.5.176.mitab.zip
BIOGRID-ALL-3.5.176.psi.zip
BIOGRID-ALL-3.5.176.psi25.zip
BIOGRID-ALL-3.5.176.tab.zip
BIOGRID-ALL-3.5.176.tab2.zip

BIOGRID-CHEMICALS-3.5.176.chemtab.zip

BIOGRID-IDENTIFIERS-3.5.176.tab.zip

BIOGRID-MV-Physical-3.5.176.mitab.zip
BIOGRID-MV-Physical-3.5.176.psi25.zip
BIOGRID-MV-Physical-3.5.176.tab2.zip

BIOGRID-ORGANISM-3.5.176.mitab.zip
BIOGRID-ORGANISM-3.5.176.psi.zip
BIOGRID-ORGANISM-3.5.176.psi25.zip
BIOGRID-ORGANISM-3.5.176.tab.zip
BIOGRID-ORGANISM-3.5.176.tab2.zip

BIOGRID-OSPREY_DATASETS-3.5.176.osprey.zip

BIOGRID-PROJECT-kinome_project_sc-3.5.176.zip

BIOGRID-PTMS-3.5.176.ptm.zip

BIOGRID-SYSTEM-3.5.176.mitab.zip
BIOGRID-SYSTEM-3.5.176.psi.zip
BIOGRID-SYSTEM-3.5.176.psi25.zip
BIOGRID-SYSTEM-3.5.176.tab.zip
BIOGRID-SYSTEM-3.5.176.tab2.zip

처음에는 파일 종류가 많아서 혼란스러울수도 있지만, 파일명 명명 규칙을 파악하면 개별적으로 용도에 맞는 데이터만 받아서 사용하면 되기때문에 효율적이다.

BIOGRID  -  ALL  -  3.5.176  .  mitab 
         데이터의 내용    버전     데이터 형식

데이터의 내용 #

ALL : 모든 종에 대한 데이터 전체를 가지고 있는 파일
CHEMICAL : 화학적 연계(chemical association)에 관한 데이터 중심
IDENTIFIERS : BioGRID에서 사용되는 ID와 관련된 매핑 정보
MV-Physical : Physical multi-validated interaction 정보
ORGANISM : 생물 종별로 분할된 데이터
OSPREY_DATASETS : Osprey라는 네트워크 시각화 도구에 적용할 수 있는 형식의 데이터
PROJECT-kinome_project_sc : BioGRID의 Kinome Project(Sc)를 위한 데이터
PTMS : PTM(Post-translational modification) 데이터
SYSTEM : 전체 데이터를 실험 시스템(Experimental system)에 따라 분할한 데이터
  • Osprey : 네트워크 정보를 시각화하여 보여주는 프로그램으로 2004년 이후로는 업데이트 중단
  • Kinome Project(Sc) : The Kinase and Phosphatase Interactome (Kinome) of S. cerevisiae project

데이터 저장 형식 #

mitab, tab : tab으로 구분된 텍스트 형식으로, 스프레드시트 등에서 사용하기에 적합
psi : XML로 구성된 단백질 상호연관 데이터 표기를 위한 표준 형식으로, HUPO에서 제정
osprey : Osprey프로그램에 바로 적용할 수 있는 형식의 데이터
  • mi : molecular interaction / psi : proteomics Standards Initiative (HUPO)

연관된 툴(분석프로그램)과 리소스 #

BioGRID는 기본적으로 제공하는 데이터 외에도, 데이터를 활용하는데 도움을 주는 툴이나 데이터를 이용해 생성한 또다른 리소스에 대한 정보를 제공하고 있다. 이러한 툴과 리소스는 BioGRID의 내부팀이 직접 제작에 참여한 것도 있고 관련 연구를 하는 외부팀(Third-party)에 의해 제작된 것들도 있다.

Partner Resources(협력 리소스) #

BioGRID ORCS : The BioGRID Open Respository of CRISPR Screens로, BioGRID의 데이터에 큐레이션을 거쳐 구축한 누구나 접속가능한 CRISPR screens 저장소이다.
PhosphoGRID : Saccharomyces cerevisiae(누룩의 일종)의 1495개 유전자 product에 대한 5000개가 넘는 특정 phosphorylated residue의 위치정보를 담고 있다.
Yeast Kinome : Saccharomyces cerevisiae Kinase와 Phosphatase interactome (KPI) 정보
Pathway Commons : 다양한 생물체에 대한 공개 pathway의 집합소
iRefWeb : 다른 데이터베이스들로부터 단일 non-redundant view로의 groups interaction 정보를 다룬다

Visualization(시각화) #

Osprey : 네트워크 시각화 시스템으로, 복합한 상호관계 네트워크를 위한 소프트웨어이다. 
Cytoscape : 오픈소스 기반의 생물정보 시각화 프로그램이다.
NDEX : 생물정보를 연구하는 과학자나 관련 단체가 생물계 네트워크 데이터를 공유/저장하기 위한 오픈소스 기반의 프레임워크이다.
Prohits-Viz : 단백질 상호작용 데이터를 분석하고 시각화하는 웹 기반의 툴이다.
GeneMANIA : 방대한 functional association 데이터를 활용하여, 사용자가 입력한 유전자와 연관된 유전자들을 찾아준다.
esyN : 대표적인 데이터베이스들로부터 상호작용 네트워크 정보를 통합하여 온라인에서 보여주는 시스템이다.

Data Management(데이터 관리) #

ProHits : 대용량의 spectrometry 실험정보를 처리할 수 있는 연구실정보 관리 시스템(LIMS)으로, BioGRID와 긴밀하게 통합되어 실험적인 결과와 논문으로 출판된 결과를 실시간으로 비교해준다.

Plugins(Cytoscape프로그램을 위한 추가기능들) #

BioGRID Tab File Loader Plugin for Cytoscape : 생물정보 시각화 프로그램인 Cytoscape 사용 시 BioGRID의 데이터를 쉽게 불러내어 활용할 수 있게 해준다
BiogridPlugin2 for Cytoscape : BioGrid에서 새롭게 제공하는 형식인 tab2 파일로 된 데이터를 Cytoscape에서 쉽게 활용할 수 있게 해준다.

Web Services(웹 서비스) #

BioGRID REST Service : BioGRID의 데이터를 REST방식으로 HTTP를 통해 활용할 수 있게 해주는 서비스이다. 이를 이용하면 사용자들이 자신의 프로그램이나 웹페이지에서 실시간으로 BioGRID의 데이터를 사용할 수 있다.
BioGRID ORCS Web Service : 위와 유사한 REST방식의 데이터 제공 서비스로, BioGRID ORCS CRISPR screen 데이터를 사용할 수 있다.
PSICQUIC : 프로그램적으로 molecular 데이터베이스에 표준화된 접속방식을 구축한 웹 서비스이다. 
Gene Info eXtension (GIX) : 유전자 공식명이나 synonym, accession 정보들을 이용하여 간단하게 유전자에 대한 정보를 인터넷 브라우저에서 받아볼 수 있는 브라우저 플러그인(extsntion)이다.
Pathway Commons : 공개된 pathway와 interaction 데이터베이스로부터 통합된 데이터에 접속하고 검색할 수 있게 해준다.

Incoming Links #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20140628_0