Skip to content

Connectivity Map #
Find similar titles

Structured data

Category
Database

Connectivity Map이란 #

Connectivity Map은 1,309가지의 생물체 작용 저분자 (bioactive small molecule)를 처리한 human cell을 배양하여 얻은 유전체 수준의 전사 발현 데이터 (genome-wide transcriptional expression data)를 모아 놓은 데이터베이스이다.

Image

이와 같이 기존에 알려진 chemical들의 유전자 발현 패턴 (gene expression pattern)을 데이터베이스화 한 후, 테스트 하고자 하는 chemical로 인한 유의 발현 유전자 (DEGs, Differentially Expressed Genes)의 발현 정도에 따른 순서를 구축된 데이터베이스에 있는 발현 정보와 비교하여 chemical 간에 존재하는 유전자 발현 activity의 유사성 (similarity, connectivity) 분석을 수행한다.

Cell line 종류 #

Connectivity Map build 02는 5가지 cell line에 대해 1,309가지의 생출체 작용 저분자를 처리한 6,100여 개의 유전자 발현 프로파일 (instance)이 포함되어 있다. 여기서 사용되는 5가지 cell line은 아래와 같다.

Human cell line Target
MCF7 Breast cancer
PC3 Prostate cancer
HL60 Leukemia
ssMCF7 Breast cancer (charcoal-strippped serum)
SKMEL5 Skin cancer

데이터베이스 업데이트 현황 #

2006년도에 처음 공개된 1세대 connectivity map은 5종의 cell line에서 164개의 chemical과 453개의 instance를 포함하고 있었다. 2009년도에 build02로 업데이트 되면서 1,309개의 chemical을 대상으로 6,100개의 instance로 확장되었다.

주요 활용 방법 #

  1. Query chemical과 유사한 activity를 보이는 chemical 발굴
  2. Query chemical과 반대의 activity를 보이는 chemical 발굴
  3. Activity가 알려지지 않은 chemical의 activity 추정
  4. Disease에 영향을 받는 유전자들의 발현 패턴과 유사한 발현 패턴을 보이는 chemical 발굴

아래는 이 데이터베이스에 구축되어 있는 instance의 일부로써, chemical 이름과 농도, 시간 등의 정보를 포함하고 있다.

Image

위의 6,100개 instance는 연구자가 query로 더진 instance와 유사성 비교, 분석을 통해 connectivity score 값으로 랭크를 정한다. Connectivity score, enrichment score는 Kolmogorov-Smirnov (KS) statistic을 기초로 비모수적 (nonparametric)이면서 순위 기반인 패턴 매칭 전략 (rank-based pattern-matching strategy)을 유전자 발현 변화 패턴 비교에 적용하였다. 그 이유는 다음과 같다. (1) Connectivity Map 데이터가 포유류 세포 배양을 통해 얻어진 것인데, 계측정 군집화를 적용한 결과에서는 cell type과 batch effect가 나타났다. (2) 계층적 군집화는 모든 프로파일이 동일한 microarray 플랫폼에서 얻어져야 하기 때문에 향후 유용성이 떨어진다고 지적하였다. (3) perturbation에 대한 세포 반응 안에서 다양한 요소들을 감지해낼 수 있는 분석 방법이 필요했지만 계층적 군집화는 그것을 충족시켜 주지 못했다.

주의사항 #

다음과 같은 결과를 얻기 위해서는 몇 가지 과정이 필요하다.

Image

무엇보다 유전자 발현 프로파일은 오직 Affy chip인 HG-U133A probe ID만을 인식하기 때문에 다른 칩으로 생성된 것이라면 U133A의 probe ID (probe identifier)로 변환하는 과정이 필요하다. 이렇게 변환된 probe ID는 Up or Down으로 구분하여 list로 만든 후, grp포맷으로 저장하고 query -> quick query -> up tag file, down tag file 업로드 -> execute query를 클릭하면 된다.

Image

Reference #

0.0.1_20140628_0