Skip to content

Mate-pair #
Find similar titles

Structured data

Category
Analysis

Mate-pair 개요 #

mate pair는 긴 길이의 insert를 가지는 paired-end(Long-insert Paired End Reads)로 sequence의 양 끝 정보를 가지고 있다. Mate-pair 와 Paired-end를 동일한 개념으로 생각할 수도 있으나, paired-end는 300~500bp의 insert를 가지는 데 반해 mate-pair는 2kbp~10kbp 의 길이를 가진다. paired-end Sequencing 과 수행 과정에서도 차이가 있으므로 구분해야 한다.

Mate-pair sequencing #

Paired-end sequencing에서는 short-insert paired-end reads(SIPERs) 및 long-insert paired-end reads(LIPERs)라는 두 종류의 read를 만들 수 있다. 둘의 차이는 insert 길이로, Mate-pair sequencing은 이 중 후자이며 paired-end read를 긴 insert와 함께 생성하는 방법이다. short-insert paired-end reads(SIPERs)의 insert 길이는 200~800 bp인데 반해, long-insert paired-end reads(LIPERs)의 insert 길이는 2~5 kb까지도 될 수 있다. 둘의 생성 방법 또한 다르다. short-insert paired-end reads(SIPERs)의 경우 유전체를 200~800 bp 크기로 조각낸 다음 adapter를 붙인다. 이런 방식으로 생성하게 되면 더 긴 insert로 reads 간 장거리를 커버하기에는 어려움이 있다. long-insert paired-end reads(LIPERs)는 유전체를 1~5 kb의 크기로 조각낸 다음, biotine을 붙이고 서열 조각을 원형으로 만드는 방법이다. 이 원형 고리를 400~600 bp로 자르게 되면, biotin tag가 붙은 조각들이 많아지고 여기에 adapter를 붙이게 된다. 이 때 생성된 조각(400~600 bp)들은 원래 긴 조각(2~5 kb)의 양 끝을 포함하고 있으므로 sequencing이 끝나면 원래 조각의 정보를 얻을 수 있게 된다.

Image

Mate-pair reads의 방향성 #

일반적으로 mate-pair라고 하면 Illumina사의 mate-pair 라이브러리를 떠올릴 것이다. 위의 그림에서 보는 것과 같이 2kbp~10kbp의 긴 길이를 갖는 하나의 DNA fragment 양쪽 만달에 adapter를 부착 후 두 adapter 영역을 서로 이어 붙여 하나의 circle form을 형성하고 이를 다시 절단하여 adapter 영역을 포함하는 절편을 sequencing하게 된다. 이때 일반적인 paired-end sequencing 방법과 동일한 데 이 경우 라이브러리 구축 시 앞서 설명한 것과 같이 독특한 형식을 취하기 때문에 paired-end의 forward-backward의 방향성에서 mate-pair의 경우 backward-forward로 변경되게 된다. 이점을 꼭 유의하여 분석을 수행해야 한다. 특히 SOAPdenovo와 같은 assembler는 input reads의 방향성 또한 같이 입력받아 분석을 수행하기 때문에 라이브러리 구축에 대한 정확한 이해를 바탕으로 정확한 값을 입력해 주어야 정확한 결과를 얻을 수 있을 것이다.

활용 #

  • De novo sequencing
  • Genome finishing
  • Structural variant detection
  • Identification of complex genomic rearrangements

Reference #

0.0.1_20210630_7_v33