Skip to content

PLINK #
Find similar titles

Structured data

Category
Software

GWAS 분석을 위한 PLINK #

GWAS란 ? #

Genome Wide Association Study (GWAS)는 생물체의 특정 형질과 관련된 유전적 요인이 어떤것 인지를 밝히는 것을 목적으로 유전체 전반에 걸쳐 유전적 요인을 검사하고, 여러 개체들 사이에서 공통적으로 나타나는 특징을 통계학적으로 예측하는 방법으로 진행된다. 특히 유전적 질병과 관련된 유전적 요인을 연구하는데, NGS 시대의 개체 별 변이 정보는 이를 연구하는 기초 자료로 제공 되고 있다.

PLINK 란? #

GWAS 분석을 위해 가장 많이 이용되는 프로그램으로 개체 별 가계정보, 표현형 정보 및 유전형 정보를 이용하여 통계학적 가설을 바탕으로 한 질병과 관련된 유전적 요인을 예측한다. 유전형 정보에 대한 기본적인 MAF(Minor allele frequency), HWE(Hardy-Weinberg equilibrium) 등의 파라미터를 이용한 기본적인 QC(quality control) 기능, 결측 된 유전자형에 대한 imputation 기능 및 개체의 표현형과 유전형에 대한 연관분석, SNP 간 LD (Linkage disequilibrium) 분석 등의 GWAS 분석에 필요한 기능을 가지고 있다.

필요 정보 #

  • 표현형 정보 : 질병을 비롯한 각 개체별 표현형 정보로 성별, 나이, 가족관계, 식습관등 상세한 정보일수록 통계학적 확률값의 신뢰도가 좋아진다.
  • 유전형 정보 : 개체별 유전형 정보로 Chromosome(염색체) 자위 상의 Allele(대립유전자) 정보를 이용한다. 이때 사용하는 마커와 같은 변이 정보는 genome 전체에서 선발된 것이며, 각 개체별로 동일 자위에 Allele 정보를 이용한다.

입력 파일 #

GWAS 분석수행을 위해서는 개체 별 해당 마커 (SNP 등) 의 유전형 정보에 대한 ped 파일, 각 SNP 등의 마커에 대한 위치 정보를 포함한 map 파일, 추가적으로 개체에 대한 표현형 정보를 포함하는 phe 파일 등이 필요하다. 다음은 해당 파일의 항목 정보이다.

  • PED 파일
    • Family ID - 개체의 가계 고유 번호
    • ID - 개체 고유 번호
    • Paternal ID - 개체의 부계 고유 번호
    • Marternal ID - 개체의 모계 고유 번호
    • Sex - 개체 성별 (male: 1, female: 2, other: unknown)
    • Phenotype - 타겟하는 개체의 표현형 정보
  • MAP 파일
    • chromosome - 염색체 정보. 사람에 대한 유전체 수를 기본으로 인식함
    • Marker ID - 각 마커의 고유번호
    • Genetic distance - 각 마커별 물리적 거리
    • position - 각 마커의 유전체상 위치 정보 (bp)
  • PHE 파일 (Optional)
    • Family ID - 가계 정보 고유 번호
    • ID - 개체 고유 번호
    • Trait value - 개체 표현형 정보

분석 방법 #

Incoming Links #

Related Articles #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20140628_0