Skip to content

fastq screen #
Find similar titles

Structured data

Category
Software

개요 #

FastQ Screen은 perl로 작성된 QC 프로그램 중 하나이다. FASTQ 형식의 서열 데이터를 사용자가 지정한 참조서열 데이터베이스와 비교하여 screening 하여 결과를 이미지 파일 및 html 파일로 출력한다. 서열 데이터의 contamination 여부를 판독하거나 meta genome 분석 등에 유용하게 사용할 수 있다.

설치 방법 #

Requirement #

  • aligner
    • 참조서열 데이터에 맵핑을 위한 aligner 설치가 필요하다. 지원하는 aligner 중 택1 하여 설치한다. aligner 목록은 아래를 참조한다.
    • Bowtie, Bowtie2, BWA 중
  • GD:Graph (perl module)

fastq screen 설치 #

# 소스 파일 다운로드 
    wget https://github.com/StevenWingett/FastQ-Screen/archive/refs/tags/v0.14.1.zip
# 압축해제 
unzip FastQ-Screen-0.14.1.zip

사용 방법 #

참조서열 다운로드 #

fastq_screen --get_genomes    #  aligner : bowtie2를 사용하는 경우
  • 실행 후 fastq_screen.conf 파일 자동 생성
  • bowtie2에서 공식적으로 제공하는 참조서열 데이터베이스만 다운로드 가능. 별도의 서열이 존재하는 경우 별도로 index 파일을 생성한 뒤 fastq_screen.conf 파일을 작성해야 함
  • bwa를 aliner로 사용하는 경우는 index 파일을 생성한 뒤 fastq_screen.conf 파일을 작성해야 함

fastq_screen 실행 #

# fastq_screen 실행 (서열 중 일부 데이터에 대한 mapping 수행) 
fastq_screen --subset 1000000 --aligner <aligner name>  --outdir <path/to/save>  <path/to/fastq file> 
# * 전체 서열에 대한 mapping을 수행하고자 할 경우 --subset을 0으로 설정

참조 문헌 #

0.0.1_20210630_7_v33