Skip to content

R (프로그래밍 언어) Bioconductor DNAcopy #
Find similar titles

Structured data

Category
Programming

CNV 칩 데이터(Array CGH)로부터 CNV를 분석하는 Bioconductor 패키지. Circular binary segmentation 알고리즘을 구현하였다.

Copy-number가 바뀌는 위치를 찾아, 그 위치에 Copy-number의 변화가 있었음을 추정한다.

Install #

Bioconductor 3.1 환경에서 다음과 같이 설치한다.

> source("http://bioconductor.org/biocLite.R")
> biocLite("DNAcopy")

Example #

GEO에 등록된 GM05296과 GM13330의 일부 데이터로 CNV를 분석하는 예제는 다음과 같다.

> library(DNAcopy)
> data(coriell)
> head(coriell)
        Clone Chromosome Position Coriell.05296 Coriell.13330
1  GS1-232B23          1        0            NA      0.207470
2  RP11-82d16          1      468      0.008824      0.063076
3  RP11-62m23          1     2241     -0.000890      0.123881
4  RP11-60j11          1     4504      0.075875      0.154343
5 RP11-111O05          1     5440      0.017303     -0.043890
6  RP11-51b04          1     7000     -0.006770      0.094144

coriell 데이터는 정규화를 마친 두 샘플의 칩데이터이다. 각 프로브에서의 발현양을 표시한다. 이 데이터를 segmentation 하기 앞서, CNA 객체를 생성한다.

> CNA.object <- CNA(cbind(coriell$Coriell.05296),
+                   coriell$Chromosome,coriell$Position,
+                   data.type="logratio",sampleid="c05296")

분석전 outlier를 smoothing하기 위해 다음 명령을 수행한다.

> smoothed.CNA.object <- smooth.CNA(CNA.object)

segmentation은 다음 명령으로 수행한다.

> segment.smoothed.CNA.object <- segment(smoothed.CNA.object, verbose=1)

이후, plot 명령으로 그림을 표시할 수 있다.

> plot(segment.smoothed.CNA.object, plot.type="w")

Image

여러 염색체를 하나의 그림에 표시하려면 다음 명령을 이용한다.

> plot(segment.smoothed.CNA.object, plot.type="s")

Image

참고정보 #

Suggested Pages #

0.0.1_20140628_0