BAM
#
Find similar titles
- 최초 작성자
- 최근 업데이트
Structured data
- Category
- Analysis
Table of Contents
BAM 파일이란? #
BAM은 Binary Alignment Map의 약자이며, 시퀀싱 후 나온 FASTQ 파일을 reference genome에 맵핑 시킨 후 만들어지는 파일이다. 따라서 BAM 파일로는 reads 서열과 reference genome에서의 reads 서열의 위치를 확인할 수 있다.
BAM 파일과 SAM 파일의 차이 #
SAM 파일과 BAM 파일은 모두 Sequence 정보를 저장하며, 같은 정보를 담고 있다. SAM 파일은 텍스트 파일의 문자열 형식으로 저장하여 바로 열람이 가능하지만, BAM 파일은 SAM 파일을 바이너리 형식으로 저장하여 바로 열람할 수 없다.
BAM 파일은 압축된 바이너리 파일이기 때문에 SAM 파일보다 용량이 작기 때문에 대용량의 NGS 데이터들은 사용하는 분석이나 주요 프로그램(SAMtools, GATK tool kit 등)에서는 BAM파일을 주로 이용한다.
BAM 파일 생성 #
Samtools를 사용하여 손쉽게 SAM 파일을 BAM 파일로 변환할 수 있다.
$ samtools view test.sam > test.bam
BAM 파일 인덱싱 #
BAM 파일을 분석 프로그램에서 사용하기 위해서는 인덱싱된 BAM 파일이 필요하기 때문에 BAM 파일을 이용하여 색인파일(test.bam.bai)을 생성한다.
$ samtools sort test.bam
$ samtools index test.bam
Incoming Links #
Related Data Sciences (DataScience 0) #
Related Articles (Article 1) #
Related Bioinformaticses (Bioinformatics 2) #
- Alignment
- CoNIFER
- GATK
- MappingQuality
- PICARD/MarkDuplicates
- R (프로그래밍 언어)/Bioconductor/DiffBind
- R (프로그래밍 언어)/Bioconductor/ShortRead
- Reference-guided Alignment
- SRA Excel
- STAR/Outputs
- Unmapped reads filtering
- 생물정보 데이터 형식
Suggested Pages #
- 0.192 PICARD
- 0.140 PDB
- 0.107 BioJava/MSA
- 0.084 GBS read mapping/BWA
- 0.054 CSA
- 0.053 계통수
- 0.042 UniProt 데이터베이스의 구성
- 0.039 자가불화합성
- 0.035 GATK/VariantCalling
- 0.034 Assembly
- More suggestions...