ChIP-seq
#
Find similar titles
-
최초 작성자
yhshin@insilicogen.com
- 최근 업데이트
Structured data
- Category
- Analysis
Table of Contents
ChIP-seq 이란? #
Chromatin ImmunoPrecipitation followed by sequencing (ChIP-Seq)으로 NGS 기술을 활용한 세포내 전사조절인자 규명을 위해 이용된다. 특정 단백질의 세포내 전자 조절인자로서의 기능을 알고자 할때 특정 단백질이 binding하는 DNA 서열을 NGS로 시퀀싱하여 유전체 전체에서 binding 가능한 motif 를 search 한다.
원리 #
- 알고자 하는 특정 단백질을 in-vitro 상에서 발현후 정제하여 해당 단백질에 특이적인 anti-body(항체)를 제작 한다.
- 정제된 단백질과 whole genome을 binding 시킨후 DNAase를 처리하여 단백질이 binding 되지 않은 비특이적인 DNA 서열은 모두 제거 되도록 한다.
- 정제된 단백질과 결합된 DNA 서열 겹합체를 앞서 제작한 anti-body를 이용해 분리해 낸다.
- 분리된 결합체로부터 DNA 서열만을 추출 하여 NGS library를 제작 한다.
- NGS sequencing을 수행한다 (TF binding site가 그리 길지 않은 점을 감안하여 1x 50 ~ 75bp로 시퀀싱한다).
- 시퀀싱된 서열을 해당종의 genome 서열에 mapping 하여 consensus motif site를 확인 한다.
- motif 서열을 기준으로 가장 가까운 유전자들을 대상으로 (promoter 영역) Functional annotation 수행으로 TFs의 downstream regulation study에 이용한다.
- 동일 condition 에 해당하는 Input DNA (control)를 추가 실험 및 분석하여 peak calling시 bias를 제거할 수 있다.
Workflow #
-
Library construction & NSG sequencing
-
pre-processing
- quality checking
- FASTX-Toolkit (version0.0.13;http://hannonlab.cshl.edu/fastx_toolkit/)
- CLC Assembly cell
- quality checking
-
Reference assembly (mapping)
- Read mapping
- Bowtie (version 0.12.7; http://bowtie-bio.sourceforge.net/index.shtml)
- CLC Assembly cell
- manipulation
- SAMTools (version 0.1.16; http://samtools.sourceforge.net/)
- CLC Assembly cell
- BEDTools: bamToBed, bedToBam, genomeCoverageBed, intersectBed, shuffleBed, mergeBed and closestBed (version 2.10.0; http://code.google.com/p/bedtools/)
- Visualization
- Reproducibility and similarity
- PCC (Pearson correlation coefficient)
- Read mapping
- Peak calling
- Peak accuracy
- translation to common coordinated for cross-species comparisons
- liftover를 이용한 근연종과의 mapping pattern 확인
- Peak calling
- MACS (version 1.3.7.1; http://liulab.dfci.harvard.edu/MACS/)
- install : /data/Bioinformatics/Tools/src/MACS-1.4.2 (in NGS2 server)
- stringent FDR threshold (e.g., FDR ≤ 1%) to identify confident peaks and with the default P value (1e-5) to identify regions with nonrandom enrichments
- MACS (version 1.3.7.1; http://liulab.dfci.harvard.edu/MACS/)
- Peak visualization
- UCSC genome browser (BED file)
- CLC Genomics Workbench (BED file)
- De novo motif discovery
- MEME-ChIP ( MACS output 이용)
- Known motif search
- PWMs 이용 ( TRANSFAC/JASPAR database)
- Sequence conservation
- Alignments ( using PhastCons score, sequence identity)
- Peak accuracy
- Differential peak calling
- Peak conservation check
- MACS out file 이용
- Analysis of quantitative change
- Define enriched region
- MACS out file의 각 peak (region)의 score 이용
- Data normalization
- quantile normalization 이용
- Quantitative change
- Compute the differences between peak heights as log2 fold change
- Define enriched region
- Peak conservation check
- Function study
- Overlap with known regions
- Peak location
- UTRs, CDS, 2kb promoter, intergenic, intronic ( peak과 50%의 overlap이 최소 요구됨)
- Peak-to-gene assignment
- Expression analysis
- GO analysis
- http://epigen.hpc.cineca.it/cast/index.php
- http://webcache.googleusercontent.com/search?q=cache:http://www.bioconductor.org/help/course-materials/2013/BioC2013/ChIP-Seq.pdf
- http://chipseek.cgu.edu.tw/index_show.py
- http://www.ebi.ac.uk/training/online/course/ebi-next-generation-sequencing-practical-course/chip-seq-analysis/chip-seq-practical
- http://www.ncbi.nlm.nih.gov/geo/info/ENCODE.html (database : Drosophila, c.elegans, mouse, human, etc.)
Reference #
- Bardet AF1, He Q, Zeitlinger J, Stark A.A (2011) computational pipeline for comparative ChIP-seq analyses analyses Nat Protoc. 7 45-61
- Furey TS. (2012) ChIP-seq and beyond: new and improved methodologies to detect and characterize protein-DNA interactions Nat Rev Genet. 12 840-52
- Chen TW, Li HP, Lee CC, Gan RC, Huang PJ, Wu TH, Lee CY, Chang YF, Tang P. (2014) ChIPseek, a web-based analysis tool for ChIP data. BMC Genomics. 15 539
- Bailey T1, Krajewski P, Ladunga I, Lefebvre C, Li Q, Liu T, Madrigal P, Taslim C, Zhang J. (2013) Practical guidelines for the comprehensive analysis of ChIP-seq data. PLoS Comput Biol. 9 e1003326
Incoming Links #
Related Bioinformaticses (Bioinformatics 0) #
- DNA-Protein Interactions by sequencing
- R (프로그래밍 언어)/Bioconductor/DiffBind
- R (프로그래밍 언어)/Bioconductor/ShortRead
- Sequencing Methods
- Z-DNA
Suggested Pages #
- 0.025 [[http://vitaestart.blogspot.kr/2011/12/rna.html]]
- 0.025 eland
- 0.025 [[http://agelf.blog.me/140020017900]]
- 0.025 [[http://ko.wikipedia.org/wiki/%EC%A0%84%EC%82%AC%EC%9D%B8%EC%9E%90]]
- 0.025 유전자 조절
- 0.025 bed
- 0.025 Patch
- 0.025 MACS2
- 0.025 Match
- More suggestions...