GEOmetadb
#
Find similar titles
- (rev. 2)
- Kevin
Structured data
- Category
- Database
GEOmetadb #
- GEOmetadb는 국제적으로 가장 많은 마이크로어레이 데이터를 보유하고 있는 Gene expression omnibus (GEO) database를 SQLite로 접근하여 원하는 마이크로어레이 정보를 가져올 수 있는 R package이다. 이러한 패키지가 나오게된 것은 현재 구축되어져 있는 사이트에서 사용자가 관심있는 데이터를 찾는 것이 용이하지 않기 때문이다. GEOmetadb는 샘플, 플랫폼 및 데이터 세트와 관련된 메타 데이터에 훨씬 더 쉽게 접근할 수 있으며, 모든 NCBI GEO 메타 데이터를 로컬로 저장하고 SQLite 쿼리를 통해 데이터베이스로 파싱하여 정보를 가지고 온다. SQLite 데이터베이스는 GEO에 새로운 데이터가 추가되면 정기적으로 업데이트되며 최신 메타 데이터를 다운로드 할 수 있다.
설치방법 #
R 3.5버젼에서는 아래와 같이 입력하여 설치한다. 이전 버젼의 설치는 아래의 링크를 참조하면 된다(https://bioconductor.org/about/release-announcements/).
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("GEOmetadb", version = "3.8")
GEO meta DB연결방법 #
dbConnect/dbDisconnect를 통해 연결 및 연결해제가 가능하다.
con <- dbConnect(SQLite(),'GEOmetadb.sqlite') # 연결
dbDisconnect(con) # 연결해제
GEO 필드리스트 확인 #
GEO정보에서 어떤 정보를 가져 올 수 있는 지 확인할 수 있다.
dbListFields(con,'gse') # gse 혹은 gsm 선택하여 확인할 수 있음
SQLite 쿼리를 통한 정보 가져오기 #
기본적으로 SQLite 쿼리에 대한 이해가 필요하며, dbGetQuery를 통해 GEO정보를 불러올 수 있다. SQLite 예시로 아래와 같이 select를 통해 gse에서 데이터를 불러 올것인지 gsm에서 불러 올것인지 선택하고 where에서 필드항목중 원하는 필터조건을 작성하여 쿼리를 작성한다.
rs <- dbGetQuery(con,paste("select gse,title from gse where",
"contributor like '%Sean%Davis%'",sep=" "))
Reference #
http://bioinformatics.oxfordjournals.org/cgi/content/short/24/23/2798.