Table of Contents
정의 #
dbNSFP는 human genome에서 가능한 모든 non-synonymous single-nucleotide variants (nsSNVs)의 기능 예측 및 주석을 달기 위해 개발된 데이터베이스이다.
즉, human nonsynonymous single-nucleotide variants (nsSNVs)와 splice-site variants (ssSNVs)에 대한 기능 예측과 주석 달기를 한 번에 제공하여, exome sequencing 연구에서 발견된 많은 SNV 목록으로부터 필터링하고 우선순위를 매기는 단계를 용이하게 하기 위함이다.
현재 버전은 Gencode release 22 / Ensembl version 79를 기반으로 하고, 총 83,422,341개의 nsSNV 및 ssSNV를 포함하여 각 SNV에 대한 기능 예측 및 주석이 큐레이션 되고 컴파일되었다.
- 가장 최신 버전 UPDATE (August 6, 2017): dbNSFP v3.5.
내용 #
이 데이터베이스는 다음의 내용을 포함한다.
- 20가지 예측 알고리즘으로부터 (SIFT, Polyphen2-HDIV, Polyphen2-HVAR, LRT, MutationTaster2, MutationAssessor, FATHMM, MetaSVM, MetaLR, CADD, VEST3, PROVEAN, FATHMM-MKL coding, fitCons, DANN, GenoCanyon, Eigen coding, Eigen-PC, M-CAP, REVEL, MutPred) 예측 점수를 출력
- 6개의 conservation score (PhyloP x 2, phastCons x 2, GERP++ and SiPhy
- 1000 Genomes Project phase 3 데이터, UK10K cohorts 데이터, ExAC consortium 데이터 그리고 the NHLBI Exome Sequencing Project ESP6500 데이터로부터 allele frequency를 포함한 정보들
- 여러 데이터베이스의 다양한 gene ID
- 유전자, 유전자 발현 및 유전자 상호 작용의 기능적 설명
Access #
ANNOVAR, KGGSeq, VarSome, UCSC Genome Browser의 Variant Annotation Integrator, Ensembl Variant Effect Predictor, SnpSift 및 HGMD를 통해 일부 dbNSFP 내용을 엑세스 할 수 있다.
Reference #
https://sites.google.com/site/jpopgen/dbNSFP