Skip to content

Mutational signature #
Find similar titles

Structured data

Category
Biology

1. Mutational signature 란? #

모든 세포는 살아가는 동안 endogenous 또는 exogenous mutagen, replication error, defactive DNA repair, enzymatic modification등의 원인에 의해 somatic mutation이 축적된다. 이때 특정 원인에 의해서 생기는 mutation이 일정한 패턴을 보이는데 이를 mutational signature라고 한다.

2. 목적 #

Mutational signature 분석을 하게 되면 mutation이 생긴 원인(aetiologies)을 알 수 있어 암유전체에서 암 발달의 원인을 파악하기 위해 사용된다. 예를 들어 흑색종(melanoma)은 자외선 노출이 주요 원인이며 주로 C>T transision이 발생하게 된다.

3. 메커니즘 #

Mutational signature를 특정 mutation 패턴이라고 설명을 했는데 이에대해 더 자세히 알아보도록 하자. 염기서열 ATGC는 총 6가지 타입(C>A, C>G, C>T, T>A, T>C, T>G)으로 mutation을 일으킬 수 있다. 여기에서 바로 옆의 upstream, downstream에 올 수 있는 nucleotide는 16가지(4 x4) 경우의 수가 있고 총 96(16x6)가지를 생각해볼 수 있다.

Image
(출처: https://en.wikipedia.org/wiki/Mutational_signatures)




지금까지 과학자들이 여러 암 유전체를 분석한 결과 mutation 패턴이 암 종류 또는 원인에 따라 다르게 나타나는 것을 밝혀냈다.관련링크 아래 그림은 흑색종 환자에서 발견되는 somatic mutation을 96 nuclotide 분포를 나타낸것이다. COSMIC에서는 90가지의 single base substitutions에 해당하는 mutation signature를 잘 정리하고있다.

Image
(출처:https://cancer.sanger.ac.uk/signatures/)

4. 종류 #

최근에는 single base substitutions(SBS) 뿐아니라 doublet base substitutions(DBS), small insertions and deletions(ID) 더 나아가서 copy number variation과 structure variation에 대한 signature 패턴이 보고되고있다.

5. 구하는 방법 #

WGS 또는 WES 등의 DNA sequencing에서 유래된 somatic mutation 데이터가 필요하다. 데이터 형식은 MAF 또는 VCF 파일로 준비한다. mutation은 sample x 96 nucleotide type 테이블 형식으로 만들어준다. 만약 샘플 수가 충분히 크다면 NMF(Non-negative Matrix Factorization)을 이용한 denovo extraction 방식을 이용할 수 있고, 샘플 수가 적거나 기존에 잘 알려진 signature를 중심으로 분포를 알고 싶다면 COSMIC signature에 re-fitting 하여 자신의 데이터에 어떤 cosmic signature가 분포하는지 알 수 있다. 이러한 분석은 R package "MutationalPattern" 또는 "MutSignatures" 등을 참고하면 손쉽게 할 수 있다.

0.0.1_20210630_7_v33