Skip to content

Allpaths-LG #
Find similar titles

Structured data

Category
Software

Allpaths-LG #

Allpaths-LG의 소개 #

ALLPATHS-LG는 whole-genome shotgun assembler로서 NGS 플랫폼을 통해 생성된 다양한 short reads 들을 이용하여 high-quality assemblies를 생성해낸다. 대표적인 de novo assembler인 SOAPdenovo와 마찬가지로, 주로 참조서열이 존재하지 않는 동, 식물의 경우, Allpaths-LG 프로그램을 통해 새롭게 종에 대한 참조서열을 생성할 수 있다.

Allpaths-LG의 요구 조건 및 제한사항 #

  1. Allpaths-LG는 Illumina Genome Analyzer와 같은 NGS 머신에서 생산된 Reads를 Assembly하는데 적합하다 (454 혹은 Sanger reads는 제한이 있음).
  2. 최소 2개의 paired-end library가 필요하다 (short, long).
    • 단, paired-end 는 반드시 overlap되어야 한다.
  3. Allpaths-LG를 수행하기 위해서는 최소 메모리 16GB, OS는 Linux 컴퓨터 환경이 필요하다.

Installation #

  • tar xzf allpathslg-.tar
  • cd allpathslg-.tar
  • ./configure --prefix=/path/to/install/directory
  • make
  • make install

Prepare input files #

Allpaths-LG를 수행함에 앞서 다음과 같은 3가지의 Input 파일이 필요하다.

  1. in_groups.csv : 각 Assembly 할 READS 파일에 대한 위치 정보 등을 가지고 있다.

    • group_name, library_name, file_name
  2. in_libs.csv : library별로 in_groups.csv 파일의 내용을 그룹화하여 library에 대한 정보를 가지고 있다.

    • library_name, project_name, organism_name, type, paired, frag_size, frag_stddev, insert_size, insert_stddev, read_orientation
  3. ploidy : Assembly하고자 하는 종의 배수체 수를 입력

Running Allpaths-LG #

미리 정의해 놓은 INPUT 파일들의 정보를 이용하여 RunAllPathsLG 명령어를 통해 Assembly가 수행된다.

RunAllPathsLG PRE=<user pre> DATA_SUBDIR=mydata  RUN=myrun   REFERENCE_NAME=staph TARGETS=standard

참고사이트 #

  1. http://www.broadinstitute.org/software/allpaths-lg/blog/

Suggested Pages #

0.0.1_20140628_0