Skip to content

EaSeq #
Find similar titles

Structured data

Category
Software

EaSeq? #

Chromatin Immunoprecipitation (ChIP) 시퀀싱은 단백체와 DNA의 interaction을 보는 기술이며, 유전자 조절과 후성유전학적 메카니즘을 연구하는데 많이 이용된다. 많은 ChIP-seq 전용 분석 소프트웨어나 브라우저가 있지만 분석에 있어서 전문적인 기술이 요구되어 분석 부분이 ChIPs-seq의 도전 과제였다. 이러한 문제점을 극복하기위해, Klaus Hansen research 그룹에서 사용자 중심의 쉽고 빠르게 분석할 수 있는 ChIP-seq 전용 분석 툴(EaSeq)을 개발하였다.

논문 #

An interactive environment for agile analysis and visualization of ChIP-sequencing data. Nat Struct Mol Biol. 2016 Apr;23(4):349-57.

기존 ChIP-seq 분석도구 #

1) MACS (Model-based Analysis for ChIP-seq)
- 가장 널리 알려진 peak calling 소프트웨어로서 MACS 1.4는 ENCODE project pipeline으로 사용된 도구.
- 논문: PeakSeq enables systematic scoring of ChIP-seq experiments relative to controls. Nat Biotechnol. 2009 Jan;27(1):66-75.

2) Homer (motif 분석과 NGS 데이터 분석을 위한 소프트웨어)
- Homer에 findPeaks 프로그램은 ChIP-seq에 peak calling을 하는데 사용되는 도구.
- 논문: Simple Combinations of Lineage-Determining Transcription Factors Prime cis-Regulatory Elements Required for Macrophage and B Cell Identities. Mol Cell 2010 May 28;38(4):576-589.

3) SPP
- Peak calling에 사용되는 R 패키지.
- 논문: Design and analysis of ChIP-seq experiments for DNA-binding proteins. Nat Biotechnol. 2008 Dec;26(12):1351-9.

4) GEM
- 유전체 전반적으로 ChIP-seq/ChIP-exo 데이터를 분석하는 자바를 이용한 소프트웨어 패키지.
- 논문: High resolution genome wide binding event finding and motif discovery reveals transcription factor spatial binding constraints. PLoS Comput Biol. 2012;8(8):e1002638.

5) PeakSeq
- Control샘플과 비교하여 ChIP한 샘플에서 튀는 영역을 찾아주는 분석도구.
- 논문: PeakSeq enables systematic scoring of ChIP-seq experiments relative to controls. Nat Biotechnol. 2009 Jan;27(1):66-75.

System #

추천 사양 (Hardware and software) #

  • Easeq은 Microsoft Visual Studio Ultimate 2012과 Microsoft에서 개발 되었다.
  • 다운로드: http://easeq.net/downloadeaseq/
  • 2.0-GHz Intel Core Duo processor
  • 4GB DDR2 RAM
  • 1,920 x 1,080 pixel monitor
  • 64-bit Windows

EaSeq 사용법 #

Peak-finding, controls, and average signal at peaks #

1) Data import
- 'Dataset'메뉴에 'Import' 버튼을 누른 후 파일 형태에 맞게 데이터를 불러온다.
- Raw data인 fastq 파일이나, 매핑이후 파일인 bam 파일, 관심영역의 bed 형태의 파일을 불러 들일 수 있다.
- 'Geneset'메뉴에서 레퍼런스 유전체를 다운로드 할 수 있다. (UCSC/Refseq)
- 'Tools' 메뉴에서 새로운 세트의 유전자 지역을 'Extract'버튼을 이용해 뽑을 수 있다.
- 'Session'메뉴에서 'Save'버튼을 클릭하여 원하는 곳에 로딩 파일을 저장할 수 있다.

2) Find peaks window
- Find peaks 윈도우에서 ChIP 데이터 샘플과 control샘플을 선택한 후 'Peaks'버튼을 누른다.

3) Controls
- Peak finding 분석 후, 'Controls'버튼을 누른다.

4) Quantify
- Quantify 윈도우에서 각 ChIP 데이터 세트의 peak의 양을 측정한다.

5) Average
- Select data sources 윈도우에서 각 ChIP peaks와 control을 선택 후, 'Average' 버튼을 누르면 peak의 평균값으로 보정 된다.

6) Overlay
- 각 ChIP peaks가 겹쳐지는 영역을 그려준다.

결과 #

1) Figure buttons
Easeq-Figure buttons

<그림1. Easeq-Figure buttons>


- 그림1은 EaSeq에서 만들 수 있는 Figure button의 종류를 보여준다. Easeq은 Box plot, Line plot, 외에도 Density plot, Heatmap, 1D histogram, 2D histogram 등 간단하게 Peak를 비교해 줄 수 있는 다양한 Figure를 만들 수 있다.

2) Easeq의 visualization 결과
Easeq-visualization 결과

<그림2. Easeq-visualization 결과>


- 그림2는 앞서 그림1에서 가능한 Figure버튼에서 만들 수 있는 Figure를 한눈에 볼 수 있게 그려 놓은 형태이다. 이처럼 EaSeq은 기존에 ChIP-seq 분석 외에도 그리기 어려운 여러종류의 Figure를 손쉽게 버튼 하나로 그릴 수 있다.

참고문헌 #

  1. https://www.linkit.nl/eng/knowledge-base/70/EaSeq_new_software_for_analyzing_the_big_data_of_genome_sequencing
  2. http://easeq.net/examples.pdf
  3. http://easeq.net/plots.pdf
0.0.1_20140628_0