Skip to content

Epigenomics #
Find similar titles

Structured data

Category
Biology

Epigenomics #

2003년 인간 유전체에 대한 서열해독 이후로, 유전체에 대한 기능적 분석에 연구가 증가하면서, 이른바 post genomics시대가 도래하고 유전체 연구와 함께 이들의 발현과 작용에 대한 연구들이 활발해 지고 있다. Epigenetics라는 분야는 이러한 흐름을 주도하는 분야로서, 유전되는 DNA서열로만 설명이 불가능한 부분의 해석을 돕고, 보다 발전적인 유전체 연구를 목적으로 진행되고 있다. Epigenetics에서 가장 주요하게 여겨지는 부분은 유전자의 발현으로서, 유전자가 유전체에 존재하지만, 발현여부에 따라 세포내 역할이 달리지고, 달라진 발현양상은 유전물질처럼 후대에게도 영향을 주는 것이다. 이는 기존의 유전체가 답하지 못했던 물음에 실마리를 제공하면서, 유전체를 좀 더 잘 이해하기 위한 수단으로 이용되고 있다1.

그림 1. DNA methylation에 의한 유전자 발현 및 억제.

Epigenomic study의 연구대상으로 가장 대표되는 것이 DNA methylation이다. DNA strand에서 CpG island가 있고 이중 cytosine이 5-methyl cytosine으로 modification 되는 현상이다. 이러한 methylation 현상은 유전체 전반에 걸쳐 일어나는 것으로 유전자의 단백질 코딩 영역이나 전사 조절 부위에서 관찰이 되며 이는 곧 유전자의 발현에 관여하게 된다2. 대표적인 예로 X-염색체 inactivation을 통한 유전자 dosage 조절이나 발달과정에서 필요한 유전자들의 발현을 성장 시기에 맞춰 선택적으로 조절 하는 것이 이에 해당 한다. 뿐만 아니라 외부의 Retrovirus나 transposon의 발현 억제와 cancer에 의한 repressor 유전자의 inactivation 기작 역시 DNA methylation을 통해서 이루어지고 있어 질병과 관련하여 유전체 연구에서 중요하게 다뤄지고 있다.

Methylation Analysis #

Genome methylation을 알아보기 위한 기존의 방법은 Methylation Sensitive Restriction Enzyme (MSRE)을 이용하거나, 살펴보고자 하는 특정 영역에 해당하는 프라이머를 작성하여 PCR을 수행 하는 방법 등이 이용되었다. 그러나 NGS 기술의 발달로 Epigenetics 분야의 연구 또한 대량의 functional gene study가 일반화 되어가고 있다. 가장 대중적인 방법은 genomic DNA를 추출하여 bisulfate를 처리한 후에 NGS를 통한 대량 sequencing을 수행하는 것이다(그림 2).

그림 2. Genomic DNA의 bisulfate처리로 methylation 여부를 확인.
Methylation 되어 있지 않은 cytosines은 bisulfite 처리로 uracil로 바뀌게 되고 반면, methylation 되어 있는 cytosines에는 변화가 없어 genome상의 서열변화로 methylation 여부를 확인한다3.

시퀀싱 된 NGS reads는 reference assembly를 통해 유전체 내의 전체적인 5-methyl cytosine의 분포를 확인 하는데 이용하게 된다. 이러한 분석은 ABI-SOLiD, Illumina의 Solexa 그리고 Roche 454 모두 가능한 플랫폼이긴 하나 long reads 시퀀싱을 수행하는 Roche 454가 조금 더 유용하게 이용되고 있다3.

Chip-seq #

단백질에 binding된 DNA 서열을 분리하여 NGS 방식의 시퀀싱을 통해 binding site를 동정하는 방법인 CHIP-Seq 분석 방법.

CHIP(chromatin-immunoprecipitation)은 특정 유전체 영역에 binding 하는 히스톤이나 전사 인자(Transcription Factors, TFs)와 같이 특정 DNA서열에 binding 하는 단백질과 genomic fragments를 분리하기 위해 많이 응용 되어 왔다. 이 기술은 빠르게 발전하여 large-scale의 TF-DNA interactions 혹은 chromatin packaging (histone modification을 통한 genomic DNA와의 packaging) 연구에 중심 기술로 자리 잡았다. CHIP-Seq은 기존의 CHIP-chip에서 보여 지던 해상도의 한계와 chip에 올려 진 프로브에 대한 한계를 극복하는 방법으로 단백질에 binding된 DNA 서열을 분리하여 NGS 방식의 시퀀싱 통해 binding site를 동정하는 방법으로 발전하였다(그림 3). 그 결과 genome wide epigenetic study가 가능하게 되었다.

그림 3. CHIP-Seq을 이용한 단백질 binding site 규명.
Genomic DNA와 특정 단백질의 binding 후 단백질 specific antibody를 이용하여
분리한다. 이후 단백질을 제거하고 NGS 기술을 이용하여 시퀀싱 한다5.

CHIP-seq은 실험적으로 짧은 DNA 절편에 binding하는 특성 때문에 non-specific binding complex의 background 처리가 반드시 필요하다. 이를 해결하기 위해 실험적으로는 antibody 만을 사용한 대조군을 설정하여 비교하는 방법과, 통계학적으로는 주어진 단백질이 주어진 위치에 정확하게 binding 할 확률을 계산하도록 하는 것이다. 이때 genome 전체 서열(g)에 주어진 서열(t)이 정확하게 mapping될 확률은 t/g로 포아송 분포 (poisson distribution) 혹은 negative binomial distribution을 이용하여 추정하게 된다3. 이후 consensus binding sequence를 도출하게 되면 이를 데이터베이스로 하여 다른 종의 분석에 이용할 수 있게 된다. 이렇게 TF와 그에 관련된 정보로 전문화 하여 구축된 데이터베이스 중 거의 유일한 곳이 BIOBASE의 TRANSFAC이다(그림4)6.

그림 4. TRANSFAC.
Transcription factor와 binding site 및 관련 pathway정보를 담고 있는 유일한 TF database.

TRANSFAC은 genome내의 유전자 upstream 분석에 기초 자료를 제공하여 유전자 조절 메카니즘 분석에 필수적으로 이용되고 있다. 실험적으로 검증된 TF의 정보를 manual curation을 통해 고품질의 데이터를 쌓아가고 있으며, 그간 CHIP-chip 방식의 데이터로 밝혀지던 정보들이 CHIP-seq 방식의 데이터로 전환 되면서 더욱 빠르게 진행되고 있어 이를 이용한 BIOBASE의 데이터베이스 또한 더욱 빠르게 쌓여갈 것으로 예상된다. 뿐만 아니라 이미 human의 경우 모든 유전자의 upstream을 분석하여 binding 가능한 TF를 제공하고 있으며, 이를 이용한 pathway 분석에도 많은 데이터와 분석 프로그램을 제공하고 있다. 그중 TRANSPATH는 affymatrix data를 이용한 발현 분석 시 DEGs의 pathway를 분석하는데 해당 유전자의 upstream에 존재하는 TFs와 관련 pathway를 분석하여 세포내 전체적인 유전자의 기능을 살펴볼 수 있도록 하였다6.

이러한 CHIP-Seq은 다양한 플랫폼에서 분석이 가능한 가운데, CLC NGS Cell을 이용하여 assembly를 진행하게 되면 genbank 형식의 ‘.gbk' 파일을 reference로 사용하여 GUI 형태로 유전체 전체의 분포를 확인할 수 있어 데이터 해석의 용이함을 얻을 수 있다(1-2. Assemble 참조). 또한 비슷하게 Illumina의 Genome Analyzer의 경우 ChIP-seq 분석을 통해 얻어진 작은 서열들을 ELAND를 이용하여 유전체에 정렬하게 되고 그 결과는 UCSC genome browser를 통해 유전체 내의 위치와 분포를 확인할 수 있다(그림 5).

그림 5. UCSC genome browser를 통한 TF binding site의 유전체 내 위치 확인.
붉은색으로 정렬된 바는 NGS로 시퀀싱 되어진 reads로 유전체와의 reference assemble를 통해 위치를 확인한다.4

출처 : http://insilicogen.com/blog/53
출처 : http://insilicogen.com/blog/56

Suggested Pages #

0.0.1_20140628_0