Skip to content

Overlapping paired-end reads #
Find similar titles

Structured data

Category
Analysis

Ovelapping paired-end reads #

NGS 기법이 발달함에 따라 한 번의 run으로 읽을 수 있는 read의 길이가 점점 길어지고 있다. 예를 들어 Illumina MiSeq 장비로 시퀀싱할 경우 300bpX2로 읽을 수 있고 Illumina NextSeq의 경우 150X2로 읽을 수 있다.

이때 fragment size보다 read length의 합이 더 큰 경우 아래 그림과 같이 하나의 fragment 내 forward-reverse reads가 중첩되는 영역이 발생한다.

Image

이렇게 중첩되는 read들을 병합하면 하나의 긴 single read를 형성할 수 있는데 이를 통해 read ambiguity를 줄여 De novo assembly 퀄리티 향상에 기여할 수 있다. fragment size가 550bp인 MiSeq reads (300bpX2)의 경우 최대 550bp의 long single reads를 형성하여 고비용의 GS454 플랫폼을 대체할 수 있을 것으로 기대된다.

Tools #

COPE (Connecting Overlapping Paired End reads) #

BGI에서 개발한 오픈소스 프로그램으로 4가지 read connection mode (-m 옵션)를 지원한다. Fragment size가 일정하지 않고 sequencing error가 포함되어 simple connection mode (-m 0)에서 놓칠 수 있는 것들을 k-mer frequency assisted connection mode (-m 3)를 통해 보완 가능하다.

$ ./src/kmerfreq/kmerfreq -k 17 -t 8 -p kmer_table -q 33 >kmerfreq.log 2>kmerfreq.err

$ ./src/cope/cope -a read1.fq -b read2.fq -o connect.fq -2 left1.fq -3 left2.fq -m 3 -t kmer_table.cz -f kmer_table.cz.len >cope.log 2>cope.error

SeqPrep #

Adapter trimming을 동시에 수행할 수 있다는 특징이 있다. Output 파일은 항상 gzip 포맷으로 생성된다.

$ ./SeqPrep -f read1.fq -r read2.fq -1 read1_out.fq -2 read2_out.fq

FLASH #

Error correction을 선행한 후 overlapping reads joining을 수행한다.

$ ./flash read1.fq read2.fq --phred-offset=33 -read-len=151 -fragment-len=250 --output-prefix=out --threads=8

fastq-join #

fastq processing utilities 중 하나인 ea-utils의 accessory tool이다.

$ ./fastq-join read1.fq read2.fq -o out.fastq

PANDAseq #

리눅스 서버(CentOS)에 설치 및 실행을 위해서는 bzip2-devel 라이브러리 설치가 선행되어야하며, PANDAseq 역시 error correction을 지원한다.

$ ./pandaseq -f read1.fq -r read2.fq -F -T 8 -w out.fastq -L 300

clc_overlap_reads #

CLC Assembly Cell의 악세사리 툴 중의 하나로 overlapping region의 최소 길이 및 match identity를 설정해 줄 수 있다. 병합되는 영역의 quality는 Q40으로 부여된다.

$ ./clc_overlap_reads -r -i read1.fq read2.fq -j overlap.fq -n nonoverlap.fq -l 50 -p fb -f 33

mergePairs.py #

Velvet assembler의 악세사리 툴 중의 하나이다.

abyss-mergepairs #

ABySS assembler의 악세사리 툴 중의 하나이다.

외부링크 #

Suggested Pages #

0.0.1_20140628_0