Skip to content

ChIP-seq #
Find similar titles

Structured data

Category
Analysis

ChIP-seq 이란? #

Chromatin ImmunoPrecipitation followed by sequencing (ChIP-Seq)으로 NGS 기술을 활용한 세포내 전사조절인자 규명을 위해 이용된다. 특정 단백질의 세포내 전자 조절인자로서의 기능을 알고자 할때 특정 단백질이 binding하는 DNA 서열을 NGS로 시퀀싱하여 유전체 전체에서 binding 가능한 motif 를 search 한다.

원리 #

  1. 알고자 하는 특정 단백질을 in-vitro 상에서 발현후 정제하여 해당 단백질에 특이적인 anti-body(항체)를 제작 한다.
  2. 정제된 단백질과 whole genome을 binding 시킨후 DNAase를 처리하여 단백질이 binding 되지 않은 비특이적인 DNA 서열은 모두 제거 되도록 한다.
  3. 정제된 단백질과 결합된 DNA 서열 겹합체를 앞서 제작한 anti-body를 이용해 분리해 낸다.
  4. 분리된 결합체로부터 DNA 서열만을 추출 하여 NGS library를 제작 한다.
  5. NGS sequencing을 수행한다 (TF binding site가 그리 길지 않은 점을 감안하여 1x 50 ~ 75bp로 시퀀싱한다).
  6. 시퀀싱된 서열을 해당종의 genome 서열에 mapping 하여 consensus motif site를 확인 한다.
  7. motif 서열을 기준으로 가장 가까운 유전자들을 대상으로 (promoter 영역) Functional annotation 수행으로 TFs의 downstream regulation study에 이용한다.
  8. 동일 condition 에 해당하는 Input DNA (control)를 추가 실험 및 분석하여 peak calling시 bias를 제거할 수 있다.

Workflow #

  1. Library construction & NSG sequencing

  2. pre-processing

  3. Reference assembly (mapping)

  4. Peak calling
    • Peak accuracy
      • translation to common coordinated for cross-species comparisons
      • liftover를 이용한 근연종과의 mapping pattern 확인
    • Peak calling
      • MACS (version 1.3.7.1; http://liulab.dfci.harvard.edu/MACS/)
        • install : /data/Bioinformatics/Tools/src/MACS-1.4.2 (in NGS2 server)
        • stringent FDR threshold (e.g., FDR ≤ 1%) to identify confident peaks and with the default P value (1e-5) to identify regions with nonrandom enrichments
    • Peak visualization
      • UCSC genome browser (BED file)
      • CLC Genomics Workbench (BED file)
    • De novo motif discovery
    • Known motif search
      • PWMs 이용 ( TRANSFAC/JASPAR database)
    • Sequence conservation
      • Alignments ( using PhastCons score, sequence identity)
  5. Differential peak calling
    • Peak conservation check
      • MACS out file 이용
    • Analysis of quantitative change
      • Define enriched region
        • MACS out file의 각 peak (region)의 score 이용
      • Data normalization
        • quantile normalization 이용
      • Quantitative change
        • Compute the differences between peak heights as log2 fold change
  6. Function study

Reference #

  1. Bardet AF1, He Q, Zeitlinger J, Stark A.A (2011) computational pipeline for comparative ChIP-seq analyses analyses Nat Protoc. 7 45-61
  2. Furey TS. (2012) ChIP-seq and beyond: new and improved methodologies to detect and characterize protein-DNA interactions Nat Rev Genet. 12 840-52
  3. Chen TW, Li HP, Lee CC, Gan RC, Huang PJ, Wu TH, Lee CY, Chang YF, Tang P. (2014) ChIPseek, a web-based analysis tool for ChIP data. BMC Genomics. 15 539
  4. Bailey T1, Krajewski P, Ladunga I, Lefebvre C, Li Q, Liu T, Madrigal P, Taslim C, Zhang J. (2013) Practical guidelines for the comprehensive analysis of ChIP-seq data. PLoS Comput Biol. 9 e1003326

Incoming Links #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20140628_0