Skip to content

Stacks #
Find similar titles

Structured data

Category
Software
Image
URL

Oregon 대학에서 개발한 Stacks(http://catchenlab.life.illinois.edu/stacks) 프로그램은 RAD-seq, GBS 데이터와 같이 Restriction enzyme 처리로 인해 얻어지는 한정된 영역에 대한 short read sequence 분석을 위한 파이프라인이다.

전체 샘플을 통합하여 master tag 서열 구축 후 샘플 각각에 대한 SNP를 분석하는 TASSEL과 달리 Stacks에서는 샘플별로 tag 서열 및 SNP 탐색을 마친 후 부모 세대가 시퀀싱 된 경우 (genotypes) 부모 세대의 tag 서열 정보를 이용하여 catalog를 형성하고 이에 각 샘플을 match하여 최종적으로 마커 정보를 제공한다. 또한 JoinMap, OneMap, R/qtl과 같은 Linkage map 구성 프로그램의 input 파일 형식으로 결과 파일을 출력할 수 있다는 장점이 있다.

부모 세대가 시퀀싱되지 않은 경우에는 population genomic 분석이 가능하며 집단간 비교를 통해 Heterozygosity, Inbreeding coefficient 등의 통계값 및 Phylogentic tree 분석을 위한 input 파일을 제공한다.

파이프라인 실행 프로그램 #

Reference genome 서열 유무에 따라서 denovo_map.pl 또는 ref_map.pl 중 선택하여 실행할 수 있다. 혹은 아래 주요 프로그램 중 개별적으로 선택하여 분석을 진행할 수도 있다.

  1. denovo_map.pl : ustacks, cstacks, sstacks 순으로 진행하여 샘플별 SNP를 분석하고 부모세대 데이터가 있는 경우 genotypes 프로그램을, 없는 경우 populations 프로그램을 실행

  2. ref_map.pl : ustacks이 아닌 pstacks 프로그램을 실행

    • ref_map.pl 프로그램 사용을 위해서는 GBS reads (clean data)의 reference genome에 대한 맵핑이 선행되어야 함 : GBS read mapping

주요 프로그램 #

  1. process_radtags : GBS를 위해 사용한 restriction enzyme과 바코드 서열을 이용하여 demultiplexing과 quality control 수행
  2. ustacks : 샘플별로 stacks 형성 (SNP, tag 파일 생성)
  3. pstacks : reference genome이 있는 경우 샘플별 stacks 형성 (Input file은 SAM 또는 BAM 파일 형식의 alignment 결과 파일)
  4. cstacks : 부모세대 시퀀싱 데이터가 존재하는 경우 부모세대 데이터를 이용하여 catalog를 형성하고 없는 경우 샘플 전체를 통합하여 catalog를 형성
  5. sstacks : cstacks을 통해 얻어진 catalog에 샘플별 stacks 정보를 맵핑
  6. genotypes 메뉴얼 페이지: 최종 마커 정보를 출력하고 결과 파일 출력 옵션에 따라 Linkage map 분석을 위한 input 파일 생성
  7. populations: populations genomic 분석을 위한 결과 파일 제공
  8. rxstacks : Stacks 파이프라인 종료 후 집단의 속성을 반영하여 샘플 각각의 genotype 및 haplotype을 교정할 수 있음

Incoming Links #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20140628_0