R (프로그래밍 언어)
Bioconductor
DNAcopy
#
Find similar titles
- 최초 작성자
- 최근 업데이트
Structured data
- Category
- Programming
CNV 칩 데이터(Array CGH)로부터 CNV를 분석하는 Bioconductor 패키지. Circular binary segmentation 알고리즘을 구현하였다.
Copy-number가 바뀌는 위치를 찾아, 그 위치에 Copy-number의 변화가 있었음을 추정한다.
Install #
Bioconductor 3.1 환경에서 다음과 같이 설치한다.
> source("http://bioconductor.org/biocLite.R")
> biocLite("DNAcopy")
Example #
GEO에 등록된 GM05296과 GM13330의 일부 데이터로 CNV를 분석하는 예제는 다음과 같다.
> library(DNAcopy)
> data(coriell)
> head(coriell)
Clone Chromosome Position Coriell.05296 Coriell.13330
1 GS1-232B23 1 0 NA 0.207470
2 RP11-82d16 1 468 0.008824 0.063076
3 RP11-62m23 1 2241 -0.000890 0.123881
4 RP11-60j11 1 4504 0.075875 0.154343
5 RP11-111O05 1 5440 0.017303 -0.043890
6 RP11-51b04 1 7000 -0.006770 0.094144
coriell 데이터는 정규화를 마친 두 샘플의 칩데이터이다. 각 프로브에서의 발현양을 표시한다. 이 데이터를 segmentation 하기 앞서, CNA 객체를 생성한다.
> CNA.object <- CNA(cbind(coriell$Coriell.05296),
+ coriell$Chromosome,coriell$Position,
+ data.type="logratio",sampleid="c05296")
분석전 outlier를 smoothing하기 위해 다음 명령을 수행한다.
> smoothed.CNA.object <- smooth.CNA(CNA.object)
segmentation은 다음 명령으로 수행한다.
> segment.smoothed.CNA.object <- segment(smoothed.CNA.object, verbose=1)
이후, plot 명령으로 그림을 표시할 수 있다.
> plot(segment.smoothed.CNA.object, plot.type="w")
여러 염색체를 하나의 그림에 표시하려면 다음 명령을 이용한다.
> plot(segment.smoothed.CNA.object, plot.type="s")