Skip to content

CNV #

Find similar titles

9회 업데이트 됨.

Edit
  • 최초 작성자
    Hyungyong Kim
  • 최근 업데이트
    lca

Structured data

Category
Biology

복제수변이(CNV, Copy-number variation)는 구조변이(Structural variation)의 한 종류로 유전체의 특정 영역이 2개 이상으로 복사되거나 삭제되는 현상을 의미한다. SNP 처럼 개체마다 다른 변이를 갖는다. 즉 누구는 어떤 영역 혹은 유전자가 두 카피 있을 수 있고, 누구는 세 카피, 또 누구는 없을 수 있다.

Cancer CNV (SCNA) #

Copy-number는 세포에서 특히 크게 변화하여 암세포의 증식에 관여한다. 암세포에서의 CNV를 특별히 Somatic copy-number alteration (SCNA)라고 하는데, 증식과 관련된 유전자(Oncogene) 발현을 증가시키거나 (카피수가 많아져서 발현이 증가함, 이를 보통 증폭(amplify)되었다고 표현함) 암억제 유전자 (Tumor Suppressor Gene)를 삭제하는 역할을 한다. 2010년 Nature에 보고된 바에 의하면, 약 3천개의 암 시료를 분석한 결과 암세포 유전체의 17%가 증폭되고 16%가 삭제되어 있다고 한다. (정상세포 유전체는 약 0.35%가 증폭되고 0.1%가 삭제됨.) SCNA는 통상 arm-level과 focal로 구분하는데, arm-level은 유전체 팔(q arm, p arm)이 통채로 날아가거나 증폭되는 현상을 이야기 하고, focal은 좁은 일부 영역에 대한 CNV를 의미한다.

CNV를 확인할 수 있는 실험 방법은 다음과 같다.

FISH는 유전체 특정 영역을 형광표지한 뒤, 해당 영역이 증폭되었는지를 현미경적인 방법으로 확인하는 고전적 방법임에 비해 Array CGH는 칩위에 정상세포 DNA와 암세포 DNA를 섞어 암세포쪽이 더 많은 DNA를 찾는다. SNP array로도 이를 확인할 수 있는데, SNP를 타이핑하는 신호의 강도로 부터 복제수를 추정하는 방식이다. 최근에는 NGS 데이터로부터도 CNV 데이터를 얻을 수 있는데, 어셈블리 결과의 Read depth 혹은 Read count로부터 복제수를 추정한다. 이 방식은 False positive 오류로 인해 생물정보학적 테크닉이 특히 더 필요하며, 일반적인 경우 SNP array를 이용하여 CNV를 결정한다. (인간 CNV 분석을 위한 대표적인 SNP arrayAffymetrix사의 Genome-Wide Human SNP Array 6.0이다.) NGS 데이터를 이용하여 보다 정확하게 CNV 탐지하는 기술은 현재 다양한 그룹에서 연구 중에 있으며, 다수의 프로그램들이 알려져 있다.

2010년 Nature에 보고된 암유전체 CNV 총괄분석 결과에 의하면, 가장 자주 발견된 건 MYC amplification과 CDKN2A/CDKN2B deletion으로 전체 샘플의 14%가 이를 포함하고 있다. 그외 CNV로 증폭되는 유전자들로는 CCN1, ERBB2, CDK4, NKX2-1, MDM2, EGFR, FGFR1, KRAS가 있으며 이 유전자들의 기능 관련 키워드 첫번째는 Apoptosis이며 두번째는 NF-κB 신호전달 경로이다.

1) 유전체 전체를 검색하여 유전체에 존재하는 구조적 변이형을 찾아내는 방법 ex) karyotyping, array-CGH, SNP chip, sequencing-based 등 2) 특정 영영이나 유전자를 대상으로 구조적 변이형을 찾아내는 방법 ex) microsatellite genotyping, MAPH, MLPA, QMPSF, real-time qPCR, FISH, Southern blotting 등

  • 빈이형이 큰 경우, 주로 세포유전학 방법인 chromosome banding, karyotyping, FISH방법을 사용

CNV의 분석 방법 비교 #

CNV 조사는 주로 array-CGH방법과 SNP chip 방법을 사용 1) array-CGH : 전체 유전체를 커버하는 BAC clone을 사용하거나 olige probe 를 이용하여 tiling array chip을 제작하고 표준유전체시료와 주사 유전체 시료를 사용하여 두 유전체의 상대적인 양을 측정 (duplicated genomic region처럼 큰 CNV영역을 주로 검색

2) SNP chip: SNP genotyping 기술을 이용하여 표준 유전체 시료와 조사 유전체 시료 간의 상대적인 양을 측정함으로써 유전체 복제수의 변이형을 조사 (작은 CNV영역과 deletion에 의한 CNV검색에 매우 효과적

Array-CGHSNP chip을 이용하면 다양한 형태로 존재하는 복제수변이형을 검색할 수 있다. (예: deletion, duplication, deletion, duplication의 혼합형, multi-allelic, complex등의 형태 조사 가능)

SNP chip의 장점: CNV검색 방법은 SNP genotype정보와 더불어 CNV정보도 동시에 함께 얻을 수 있음 그러나 CNV위에 SNP genotype이 deletion이 되면 genotyping의 오류로 분류됨. 그래서 대부분 판매되는 SNP chip에 올려진 SNP들은 CNV 부위의 SNP들이 chip을 구성하는 과정에서 제거함

SNP chip에서 관찰되는 CNV부위는 1) 가계의 SNP genotyping data에서 멘델의 유전형태를 따르지 않는 유전형이 자손의 세대에서 관측 2) HWE에 벗어나는 SNP들이 일렬로 연속적으로 나타남 3) homozygote deletion이 일어난 부위에서는 null genotype결과가 관측될 것이다

유전자 복제수 변이형(CNV) 과 질병의 연관성 #

CNV에 의한 유전자 복제수의 변화

  1. 양적차이에 의한 효과(Gene dosage effect) : 2개의 유전자를 모두 갖고 있을때 정상이다가 한 유전자가 deletion되면 비정상적인 표현형이 나타난다. 특히 열성 유전을 하는 돌연변이 유전자 한개를 가지고 다른 한개는 결여된 경우 매우 심각한 유전병을 앓게 된다.

  2. 위치적 효과(position effect) CNV 영역이 유전자의 프로모터 부위에 존재하는 경우 유전자의 발현을 조절하는 부위의 결손으로 인해 중요한 유전자의 발현이 억제되어 심각한 문제를 유발하게 된다.

복제수 변이형과 질병간의 연관성을 밝히는 연구는 복제수 변이형의 빈도와 특성에 따라 다른 방법을 사용하게 된다. ex) 2개의 유전체로 구성된 세포에서 1copy또는 2copy 모두 결손(deletion)된 복제수 변이형의 경우에는 환자와 정상인 집단에서 0,1 & 2 copy 복제수 빈도 분포의 차이를 비교하게 된다.

그리고 gene duplication에 의해서 생성된 연속적인 복제수 변이형이 존재하는 경우에는 환자와 정상인 집단에서 더 낮은 또는 더 높은 복제수 빈도가 분포하는지를 조사한다. 만약 특정한 CNV를 genotyping할 수 있는 tagging SNP가 존재하는 경우에는 CNV genotyping 대신에 SNP genotyping정보를 이용하여 환자와 정상인 간의 질병 연관성 분석을 한다.

CNV 데이터베이스 #

Database of Genomic Variants (DGV) : 이 데이터베이스에 따르면 지금까지 정상인에게서 총 353,126개 CNV와 1,645개 inversion 변이형이 발굴되어 등록되어있다. DECIPHER : 환자들의 정보만 담고 있음 Korean Genomics Variant Database (KGV) : 질병관리본부에서 수행된 연구내용이 공개되어 있다.

참고문헌 #

이종극. 『질병 유전체 분석법 3』. 서울: 도서출판 월드사이언스, 2015.

Incoming Links #

Related Data Sciences #

Related Articles #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20231010_1_v71