Skip to content

DBMS Graph DB #
Find similar titles

Structured data

Category
Database

Graph DB #

Graph DB란 무엇인가? #

Graph DB는 데이터 자체만큼이나 데이터 간의 관계가 주요한 의미를 갖는 데이터를 그래프 형태로 저장하는 데이터베이스를 말한다. 위키피디아에서 아래와 같이 Graph Database를 정의한다.

A graph database is a database that uses graph structures with nodes, edges, and properties to represent and store data. -출처:wikipedia-

그래프DB

그림1. Graph DB 예
출처:위키피디아

Graph DB는 데이터를 그래프 형태로 저장하기 때문에 데이터는 nodes와 relationships 정보를 갖고 또한 각각은 속성값을 저장 표현할 수 있다. 저장된 결과는 그래프(네트워크) 구조로 데이터 간의 관계를 정보를 시각화하여 제공할 수 있다. 요즘 많이 듣는 '빅 데이터', '소셜 네트워크 서비스 (SNS)' 등의 대규모 데이터 간의 관계를 검색 분석하는 분야에서 다양하게 활용되고 있다.

Bioinformatics 데이터 기반의 Graph DB #

생물학적 데이터를 분석하거나 다루다 보면 많은 경우 그 데이터 구조가 그래프 형태로 적용 가능하다는 것을 알 수 있다. 가장 대표적인 예로 Geno Ontology는 그래프 형태의 데이터 구조를 되어 있다. GO term은 node로 term간의 관계는 relationship으로 적용 가능하다. GO뿐만 아니라 대표적으로 많이 알려진 public database의 데이터 또한 특정 유전체 정보를 node와 relationship, 여러가지 속성으로 표현 가능하다. 이런 Bioinformatics data의 특성을 이용한 오픈 소스 프로젝트인 Bio4j에 대해 간단히 소개하고자 한다.

Bio4J

그림2. Bio4j 예시
출처:bio4j.com

Bio4jNeo4j라는 Graph DB 대표적인 오픈 소스 DB를 차용하여 Biological Big Data를 통합한 Graph DB이다. Bioinformatics data의 대표적인 public DB(UniProt KB (SwissProt + Trembl), Gene Ontology (GO), UniRef (50, 90, 100), RefSeq, NCBI taxonomy, and Expasy Enzyme DB) 6가지를 통합하여 관련 데이터를 그래프 구조로 저장하여 연관 데이터를 빠르게 검색하고 결과를 그래프 형태로 시각화하여 제공해 준다.

Suggested Pages #

0.0.1_20140628_0