Skip to content

Database #
Find similar titles

Structured data

Category
Database

Database #

인터넷과 더불어 정보화사회를 가능하게 하는 양대 축 중 하나
당신이 접속한 문서들의 집합
데이터베이스의 사전적인 의미를 차용해보자면 『여러 사람에 의해 공유되어 사용될 목적으로 통합하여 관리되는 데이터의 집합을 말한다.』(출처:두산백과)라고 적혀 있다. 데이터베이스는 많은 사람들이 어떠한 주제를 가지고 방대한 데이터를 정리하여 모여진 집단적 지식을 다른사람들고 공유하는 것이다. 데이터베이스가 담고 있는 양은 상당하기 때문에 원하는 데이터를 골라 내기 위해서는 검색기능은 필수적이다. 현재는 생물학의 빅데이터시대로 생물학 관련 분야에도 전세계에서 쓰이는 많은 데이터베이스들이 있다.

생물학 데이터베이스(Biodatabase) #

생물정보 양이 급증함에 따라 데이터들을 관리를 할 필요가 있고, 많은 사람들에게 효율적으로 정보를 제공하기 위한 전세계적으로 대표적인 데이터베이스에는 미국 NCBI, 유럽 EBI, 일본 CIB에서 운영하는 데이터베이스가 있다. 그외에도 의학 분야에 특화되어 있는 PubMed나 효소에 정보 시스템인BRENDA도 유용하게 활용할 수 있다.

염기서열 데이터베이스 #

Genbank #

Image
NCBI에서 운영하며 유전자에 대한 정보를 가지고 있다. 공개 데이터베이스이기에 모든 사람이 사용 할 수 있다. NCBI에서 개발한 Genbank검색도구인 Entrez를 통해 다양한 정보를 검색 할 수 있다. 서열 중 특징을 나타내는 구간의 범위와 annotation을 표시해준다. gene, CDS, exon, intron등의 구간이 나타나있다.

EMBL #

Image
영국에 위치한 EMBL(European Molecular Biology Laboratory)의 산하기관으로 생물정보 관련 기관인 EBI(European Bioinformatics Institute)가 있다. EBI는 EMBL DB, SWISS-PROT DB, PDB등의 생물정보학 데이터베이스를 제공하고 있다.

DDBJ #

Image
DNA Data Bank of Japan이고, GenbankEMBL과 함께 데이터를 공유하고 있다. 매일 GenbankEMBL와 함께 수집한 정보를 교환하고 있다. 세계적으로 nucleoic acid 시퀀스의 데이터베이스라 하면 NCBI(미국), European Nucleotide Archive(ENA, 영국) 그리고 DNA Database Bank of Japan(일본)을 꼽습니다. 실제로 Genbank와 EMBL와 함께 서로 정보를 교환하기 때문에 가지고 있는 데이터는 같다고 할 수 있다.

단백질서열 데이터베이스 #

Swiss-Prot #

SWISS-PROT은 단백질 서열 정보 이외에 단백질의 기능과 구조, 각 도메인에 관한 정보, post-translational, modification, variants에 대한 정보 등 관련된 모든 정보들을 잘 가공하여 구축한 단백질 데이터베이스이다. 다른 단백질 데이터베이스와의 차별은 전문가에 의하여 선별된 단백질 서열정보와 타 데이터베이스들과의 유기적인 연결을 유지하고 있어 기존의 자동화로 구축된 데이터보다 질적으로 우수하다는 것이다.

Uniprot #

Image
Swiss-Prot, TrEMBL, PIR등의 데이터베이로 통합하는 프로젝트를 진행하였고 이를 UniProt이라고 명명하였다. UniProt Knowledgebase는 UnitProt database 중에서 가장 폭넓은 정보를 제공하며 중심 역할을 하는 핵심 데이터베이스이다. 이 데이터베이스는 정확하고 일관적이며 풍부한 서열 및 기능에 대한 주석을 포함하고 있다. 단백질 서열, 유전자 이름, 서열에 대한 설명, 계통 분류 및 인용 정보 등 기본적인 정보 뿐만 아니라 생물학적 존재, 생물학적 분류, 상호 참조와 실험 데이터, 컴퓨터 데이터를 바탕으로 한 명확한 주석 정보 등을 제공하고 있다.

유전체데이터베이스 #

Entrez Genome #

Image
글로벌 쿼리 데이터베이스 검색 시스템으로 유전체 정보에 대한 다양한 정보를 검색할 수 있다. Health care 쪽의 데이터를 주로 담고 있고 "Entrez"(프랑스어로 "인사"를 의미함) 미국 의학 국립 도서관(NLM)에서 제공하는 컨탠츠를 ㅜ대중이 쉽게 검색 할 수 있도록하는 정신을 반영하기 위해 명명되었다.

Ensembl #

Image
Ensembl은 Human Genome Project가 완성되기 이전부터 시작되었다. Ensembl의 목적은 유전체에 자동으로 annotation을 하고 이용가능한 다른 생물학적 데이터와 함께 통합할 수 있는 툴을 웹상으로 구현하는 것이다.

대사회로 데이터베이스 #

KEGG #

Image
KEGG는 Kyoto Encyclopedia of Genes and Genomes의 약자로 pathway 관련 데이터베이스이다. 일본 교토 대학의 화학 연구소 교수인 미노루 카네히사 교수가 1995년에 진행 된 인간 게놈 프로젝트에서 시작외었다. Genome seaqeunce의 생물학적 해석에 사용할 수 있는 컴퓨터화 된 자원에 필요성에 의해 제작되었다.

WikiPathways #

Image
위키기반의 pathway database로 방대한 양에 자료가 있어 그만큼 유의미한 정보를 찾기 힘든 점도 있다. 집단 지성의 결정체로 여러 사용자가 본인이 알고 있는 지식들을 활용하여 작성되어 있지만 정확하지 않은 정보도 일부 포함하고 있어 활용시 별도의 검증이 필요하다.

Incoming Links #

Related Data Sciences #

Related Articles #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20140628_0