개요 #
Bisulfite sequencing은 DNA의 methylated pattern을 파악하기 위하여 시퀀싱 전 단계에서 Bisulfite (아황산 수소 소듐) 처리를 수행하는 기법을 말한다. 일반적인 Bisulfite sequencing의 목표는 Cytosine 기의 5번 탄소에 결합한 methyl기의 존재 여부를 파악하기 위한 것으로 DNA sequencing을 통한 DNA methylated pattern을 파악하는 Gold standard로써 활용되고 있다.
Conversion Method #
Methyl기가 결합한 Cytosine의 경우 Bisulfite가 반응하지 못하지만, Methyl기가 없는 경우 Bisulfite에 의해 deamination 되어 Uracil로 전환된다.
출처 PLOSONE, PLOSONE
이후 Library를 PCR 하는 과정에서 Bisulfite 처리를 받은 DNA fragment는 Methylation이 없는 Cytosine 기의 경우 Thymine으로 전환되었을 것이며 Thymine의 쌍 염기인 Adenine 또한 생성될 것이다. 이후 시퀀싱을 수행하게 되면 Bisulfite 처리로 인해 conversion 된 DNA fragment들에 대한 시퀀싱 정보를 얻을 수 있는데 이 시퀀싱 정보를 Bismark와 같은 alignment pipeline을 사용하여 read를 mapping하고 methylation 정보를 calling 할 수 있게 된다.
Methylation call #
Bisulfite sequencing은 DNA 상에 존재하는 methylation 정보를 얻기 위한 실험적인 과정으로써 실제 Methylation 정보를 얻기 위해서는 실험을 통해 얻은 Library를 시퀀싱하여 read들을 mapping 하여야 한다. Bismark는 대표적인 Bisulfite sequencing data mapping pipeline 중의 하나로 아래 이미지와 같이 reference genome에 대해서 bisulfite 처리가 된 DNA sequence를 mapping을 하게 된다. Bisulfite 로 인한 DNA damage를 고려하여 unique best alignment를 수행하게 되며 모든 cytosine의 위치에 대해서 conversion 여부를 확인한 후 Bismark는 conversion 된 read와 conversion이 되지 않은 read의 count를 제공함으로써 사용자는 Methylation 여부에 대한 정보를 얻을 수 있게 된다.
출처, Bismark
출처 #
Yun Hwang et al 2010: https://doi.org/10.1371/journal.pone.0008888
Felix Krueger et al 2011: https://doi.org/10.1093/bioinformatics/btr167