Skip to content

GENALICE MAP #
Find similar titles

Structured data

Category
Software

GENALICE MAP은 GENALICE社(네덜란드, 2011년에 만들어진 신생기업, 바이오의학 빅데이터 솔루션 기업)에서 만든 NGS read alignment 및 variant calling 솔루션이다. 편리성, 정확도, 빠르기 면에서 BWA같은 기존의 툴들을 압도한다. 실제로 Human 1000 Genome data를 align하는 속도를 비교했을 때 BWA는 초당 1.1 Megabases, GENALICE MAP은 초당 115.8 Megabases 수준으로 100배 이상 빠른 것으로 확인되었다. reference 유/무에 따라 차이를 보이는데, 야생 토마토의 경우는 38배 정도 빠르다. 유사한 실험으로 50X depth로 시퀀싱된 Whole Genome Sequencing data를 프로세싱하는데 소요되는 시간을 비교하였다(GENALICE MAP vs.BWA-MEM/GATK). GENALICE MAP은 high quality variant인 790 million read pair를 align하는데 45분이 걸리지 않았다. 반면 BWA-MEM/GATK의 경우는 80시간 이상 소요된다.

MarkDown

GENALICE MAP의 variant caller는 매우 정확하게 SNP를 찾아낸다. Genome in a Bottle Consortium의 high confidence SNP call set만을 이용한 실험에서 GENALICE MAP이 BWA-MEM/GATK보다 높은 비율로 SNP를 찾아냈음을 알 수 있었다. 더 자세히 말하면 GENALICE MAP의 경우 Genome in a Bottle Consortium와의 concordance가 98%에 가까운 반면, BWA-MEM/GATK는 95% 수준이었다.

GENALICE MAP을 사용하면 GAR(GENALICE Aligned Reads, FASTQ, BAM file 대신 사용) file이 생성되는데, 이것은 추후 다른 세팅이나 최신 reference를 가지고 realignment를 하는데 필요한 모든 정보를 가지고 있다. 그럼에도 저장 공간을 BAM, FASTQ 대비 약 1/100 줄일 수 있다. 재배 토마토의 Whole Gemome Seq. data의 경우, FASTQ는 88.1 Gigabytes, BAM은 25 Gb이고 GAR file은 겨우 1.6Gb가 필요하다.

최근 마크로젠이 이 솔루션을 도입했는데, 속도와 정확성이 개선되고 파일 사이즈가 작기 때문에 데이터 저장면에서도 효율적이기 때문에 대용량 NGS 데이터를 빈번하게 다루는 기업 및 연구소에서 사용하기 적합한 솔루션이다.

MarkDown

참고문헌 http://www.genalice.com/product/genalice-map/

0.0.1_20140628_0