Skip to content

K-mer #
Find similar titles

Structured data

Category
Analysis

K-mer? #

Computational genomics(GPCG)에서 주로 사용되는 단어로써 모든 가능한 substring에서의 k의 길이(wet-lab에서는 oligonucleotide)를 말하며, Sequence alignment 또는 Sequence assembly에서 사용된다.

K-mer 분석 방법 #

k-mer를 Count 하는 방법을 기반으로 해서 유전체 크기 및 특징(heterozygous정도)을 추정이 가능하다.

Base Coverage = Total base Number/Genome Size가 k-mer Coverage = Total K-mer Number/Genome Size 임을 이용해서 Genome Size = Total k-mer Number/k-mer Coverage로 유전체 크기를 예측해볼 수 있다.

또한 K-mer frequency peak의 양상에 따라서 heterozygosity의 정도(유전체 특징)를 추정할 수 있다. 만약 K-mer frequency peak가 두 곳에서 발생한 것으로 확인이 된다면, 앞의 K-mer frequency peak의 k-mer depth가 2배가 되는 부분에서 또 하나의 K-mer frequency peak가 나타나는 것을 확인 할 수 있다. 이 경우 앞의 K-mer frequency peak로 heterozygosity를 보이는 K-mer들을 판단해볼 수 있고, 뒤의 K-mer frequency peak는 실제 genome size을 나타내는 Peak로 판단 할 수 있다. K-mer frequency peak가 한 곳에서 발생했다면 이는 적은 heterozygosity를 가지고 있는 genome으로 판단해 볼 수 있다.

REFERENCE #

김민선/Analysis of k-mer with NGS sequencing data for genome assembly/한국교육학술정보원/2015/

Incoming Links #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20140628_0