Skip to content

GEOmetadb #
Find similar titles

Structured data

Category
Database

GEOmetadb #

  • GEOmetadb는 국제적으로 가장 많은 마이크로어레이 데이터를 보유하고 있는 Gene expression omnibus (GEO) database를 SQLite로 접근하여 원하는 마이크로어레이 정보를 가져올 수 있는 R package이다. 이러한 패키지가 나오게된 것은 현재 구축되어져 있는 사이트에서 사용자가 관심있는 데이터를 찾는 것이 용이하지 않기 때문이다. GEOmetadb는 샘플, 플랫폼 및 데이터 세트와 관련된 메타 데이터에 훨씬 더 쉽게 접근할 수 있으며, 모든 NCBI GEO 메타 데이터를 로컬로 저장하고 SQLite 쿼리를 통해 데이터베이스로 파싱하여 정보를 가지고 온다. SQLite 데이터베이스는 GEO에 새로운 데이터가 추가되면 정기적으로 업데이트되며 최신 메타 데이터를 다운로드 할 수 있다.

설치방법 #

R 3.5버젼에서는 아래와 같이 입력하여 설치한다. 이전 버젼의 설치는 아래의 링크를 참조하면 된다(https://bioconductor.org/about/release-announcements/).

if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("GEOmetadb", version = "3.8")

GEO meta DB연결방법 #

dbConnect/dbDisconnect를 통해 연결 및 연결해제가 가능하다.

con <- dbConnect(SQLite(),'GEOmetadb.sqlite') # 연결
dbDisconnect(con) # 연결해제

GEO 필드리스트 확인 #

GEO정보에서 어떤 정보를 가져 올 수 있는 지 확인할 수 있다.

dbListFields(con,'gse') # gse 혹은 gsm 선택하여 확인할 수 있음

SQLite 쿼리를 통한 정보 가져오기 #

기본적으로 SQLite 쿼리에 대한 이해가 필요하며, dbGetQuery를 통해 GEO정보를 불러올 수 있다. SQLite 예시로 아래와 같이 select를 통해 gse에서 데이터를 불러 올것인지 gsm에서 불러 올것인지 선택하고 where에서 필드항목중 원하는 필터조건을 작성하여 쿼리를 작성한다.

rs <- dbGetQuery(con,paste("select gse,title from gse where",
                           "contributor like '%Sean%Davis%'",sep=" "))

Reference #

http://bioinformatics.oxfordjournals.org/cgi/content/short/24/23/2798.

0.0.1_20140628_0