Skip to content

BAM #

Find similar titles

4회 업데이트 됨.

Edit
  • 최초 작성자
    Myunghee Jung
  • 최근 업데이트
    jmchoi

Structured data

Category
Analysis

BAM 파일이란? #

BAM은 Binary Alignment Map의 약자이며, 시퀀싱 후 나온 FASTQ 파일을 reference genome에 맵핑 시킨 후 만들어지는 파일이다. 따라서 BAM 파일로는 reads 서열과 reference genome에서의 reads 서열의 위치를 확인할 수 있다.

BAM 파일과 SAM 파일의 차이 #

SAM 파일과 BAM 파일은 모두 Sequence 정보를 저장하며, 같은 정보를 담고 있다. SAM 파일은 텍스트 파일의 문자열 형식으로 저장하여 바로 열람이 가능하지만, BAM 파일은 SAM 파일을 바이너리 형식으로 저장하여 바로 열람할 수 없다.

BAM 파일은 압축된 바이너리 파일이기 때문에 SAM 파일보다 용량이 작기 때문에 대용량의 NGS 데이터들은 사용하는 분석이나 주요 프로그램(SAMtools, GATK tool kit 등)에서는 BAM파일을 주로 이용한다.

BAM 파일 생성 #

Samtools를 사용하여 손쉽게 SAM 파일을 BAM 파일로 변환할 수 있다.

$ samtools view test.sam > test.bam

BAM 파일 인덱싱 #

BAM 파일을 분석 프로그램에서 사용하기 위해서는 인덱싱된 BAM 파일이 필요하기 때문에 BAM 파일을 이용하여 색인파일(test.bam.bai)을 생성한다.

$ samtools sort test.bam
$ samtools index test.bam

Incoming Links #

Related Data Sciences #

Related Articles #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20230725_7_v68