Skip to content

POLYSOLVER #
Find similar titles

POLYSOLVER(POLYmorphic loci reSOVER) #

Motivation #

대표적인 면역에 관여하는 세포인 T-cell은 다른 세포의 세포막 수용체에 결합된 항원을 인지한다. 이러한 항원에 결합된 세포막 수용체의 구조는 유전적으로 정해져 있기 때문에 모든 사람마다 차이가 있다. 이 세포막 수용체를 Major Histocompatibility complex(MHC)라고 한다.

MHC Complex는 class I과 class II로 두 가지의 종류가 있다.

1. class I MHC
핵을 가진 모든 세포의 표면에는 Class I MHC 단백질이 존재한다.
Class I MHC에는 세포 내에서 생성되어 세포막으로 운반된 작은 펩티드 분자들이 결합되어 있는데, 세포가 건강하고 펩티드가 정상인 경우에는 T-cell의 반응이 일어나지 않는다.
하지만 비정상적인 이종 펩티드, 바이러스 혹은 세균의 펩티드가 Class I MHC Complex에 결합이 되어 있으면 T-cell 이 활성화 되어 세포를 파괴한다.

2. class II MHC
Class II MHC 단백질은 림프구와 antigen-presenting cell(APC)라고 하는 포식세포의 세포막에 존재한다.
여기서의 포식세포는 항원 전달 세포로서 T-cell을 활성화시켜 이종세포(세균)과 이종 단백질을 공격하게 하는 특수한 세포로, 항원 전달세포가 병원체나 이종단백질을 잡아먹으면, 이들이 세포내에서 분해하고, 항원조각이 세포 표면의 classII MHC에 결합하여 항원전달세포의 세포막에 접촉한 T-cell은 활성화되어 면역 반응을 시작하게 된다.

Definition #

POLYSOLVER 는 HLAminer와 마찬가지로, whole exome sequecing(WES) data를 통해 인간의 MHC Complex 에 해당하는 HLA 유전자 가운데서도 Class I 에 속하는 HLA-A, B, C 유전자에 대한 allele을 예측하는 프로그램이다.

Method #

POLYSOLVER 프로그램은 2가지 STEP을 통해 수행된다.

1. HLA read alignment
WES data에서 chr6번에 해당하는 HLA region 에 해당하는 read들을 선별하고, 그 read 들을 가지고 잘 알려진 HLA allele에 Novoalign 프로그램을 통해 alignment를 수행한다.

2. HLA allele inference
alignment를 수행한 이후, 매핑된 read에 대한 각 base quality, 측정된 read의 insert size 그리고 frequency에 대한 우선순위를 통해 two-step bayesian classification 방식으로 해당 샘플에 대한 HLA allele을 추론한다.

Image

INSTALL #

Download #

polysolver를 다운로드 받기 위해서는 라이센스가 필요하다.

즉, CGA(Cancer Genome Analysis) 홈페이지에서 회원가입 및 로그인을 한 후에,

메일을 이용하여 POLYSOLVER를 다운로드 받을 수 있다.

Image

필수 프로그램 #

Samtools (http://samtools.sourceforge.net/)
GATK (https://www.broadinstitute.org/gatk/download)
Novoalign (http://www.novocraft.com/main/downloadpage.php)- 라이센스가 필요함
Perl modules ((http://www.cpan.org/modules/INSTALL.html)
- Math::BaseCalc
- List::MoreUtils
- List::Util
- Parallel::ForkManager
- POSIX
- Dumpvalue
- Data::Dumper
Bioperl (http://www.bioperl.org/wiki/Installing_BioPerl)
Mutect (http://www.broadinstitute.org/cancer/cga/mutect_download)- optional(for mutation)
Strelka(https://sites.google.com/site/strelkasomaticvariantcaller/home/download) - optional(for mutation)

프로그램 실행 #

프로그램 실행은 "shell_call_hla_type" 라는 명령어를 이용하여 수행할 수 있다.

예시 : shell_call_hla_type test.bam Unknown 1 hg19 STDFQ 0 test

Input parameters:
 -bam: path to the BAM file to be used for HLA typing 
 -race: ethnicity of the individual (Caucasian, Black, Asian or Unknown)
 -includeFreq: flag indicating whether population-level allele frequencies should be used as priors (0 or 1)
 -build: reference genome used in the BAM file (hg18 or hg19)
 -format: fastq format 
 (STDFQ, ILMFQ, ILM1.8 or SLXFQ; see Novoalign documentation)
  * STDFQ : Fastq format with Sanger coding of quality values
  * ILMFQ : Fastq with Illumina coding of quality values
  * ILM1.8 : Illumina Casava V1.8 fastq files with Sanger coding of quality values
  * SLXFQ : Fastq format with Solexa style quality values
 -insertCalc: flag indicating whether empirical insert size distribution should be used in the model (0 or 1)
 -outDir: output directory

수행결과로는 "winners.hla.txt" 라는 파일이 출력되는데,

이는 각 HLA-A, B, C 타입에 대한 가장 이상적으로 추론된 HLA-allele 정보를 담고 있다.

참고 #

http://archive.broadinstitute.org/cancer/cga/polysolver_run
http://blog.naver.com/chjy1o/221137874200
https://www.nature.com/articles/nbt.3344
http://www.bcgsc.ca/platform/bioinfo/software/hlaminer

0.0.1_20140628_0