Skip to content

Interpretation DB - InterVar #
Find similar titles

Structured data

Category
Database

개요 #

게놈 데이터베이스(GDB)는 유전체에 존재하는 유전변이 정보들을 수집하고, 데이터베이스화함으로써, 유전체 맞춤의학 연구를 위한 기반을 다져왔다. 이와 관련하여 Interpretation DB 중, Poyphen, SIFT, InterVar에 대해서 알아보자.

InterVar #

InterVar는 ACMG / AMP 2015 가이드라인에 의한 유전 변이의 임상적 해석을 위한 생물 정보학 소프트웨어 도구이다. InterVar에 대한 입력은 ANNOVAR에서 생성된 주석이 달린 파일이며, InterVar는 변이형을 '양성', '양성 가능성 높음', '불확실성 유의성', '가능성이 있는 병원성' 및 '병원성'으로 분류한다. 미국 유전학 및 유전체 학회(ACMG)와 분자 병리학 협회(AMP)는 2015년 28개 기준에 근거하여 인간 질병과 관련한 서열 변이의 임상적 해석에 대한 업데이트된 표준 및 지침을 발표했다. 그러나 개별 지침서의 이해가 다르거나 지침을 구현하기 위한 표준 알고리즘이 없기 때문에 개별 통역사 간의 다양성이 광범위할 수 있지만, 반자동화 변형 해석을 위한 계산 도구는 사용할 수 없다. 이러한 문제를 해결하기 위해 우리는 이러한 기준을 구현할 수 있는 방법 모음을 제안하고 사용자가 variant의 임상적 중요성을 해석할 수 있도록 InterVar라는 도구를 개발했다. InterVar는 사전 주석이 달린 파일이나 VCF 파일을 입력으로 받아 18가지 기준에 대한 자동 해석을 생성할 수 있다. 또한, 자동화된 해석 단계와 수동 조정 단계를 통해 사용자 친화적인 variant 해석을 가능하게 하는 웹 서버 wInterVar를 개발했다. 이러한 도구는 특히 높은 침투력을 가진 심각한 선천성 또는 매우 초기 발달 장애를 해결하는 데 유용하다. 이미 나와 있는 서열 연구 결과를 사용하여, 서열 variants의 임상적 중요성을 해석하는 데 걸리는 시간을 현저하게 줄이는 데 있어 InterVar의 유용성을 입증했다.

그림 1. InterVar의 2-step 절차에 대한 순서도

Image

그림 2. ACMG / AMP2015 가이드 라인의 28가지 기준

Image

그림 3. wInterVar의 그림. (A) 여러 가지 방법으로 입력할 수 있는 genentic variants의 자동 해석 (B) 사용자가 "Adjust"를 클릭하면 수동으로 조정하여 최종 결과를 도출할 수 있는 전체 기준 목록이 표시된다.

Image

WHAT DOES IT DO #

InterVar은 임상적 중요성의 다양한 해석을 위해 파이썬 스크립트로 구성되어 있다.

PREREQUISITE #

  • Python >=2.6.6.
  • ANNOVAR version >= 2016-02-01.
  • OMIM으로부터 mim2gene.txt와 같은 파일 다운로드
  • OMIM르오부터 should be generated: >= 2016-09, 최신버전이 아니면 에러 발생함.

OPTIONS #

-h, --help
    show this help message and exit

--version
    show program''s version number and exit

--config=config.ini Load your config file. The config file contains all options.
    if you use this options,you can ignore all the other options bellow.

-i INPUTFILE, --input=INPUTFILE
    input file of variants for analysis

--input_type=AVinput The input file type, it can be AVinput(Annovar''sformat),VCF

-o OUTPUTFILE, --output=OUTPUTFILE
    prefix the output file (default:output)

-b BUILDVER, --buildver=BUILDVER
    version of reference genome: hg18, hg19(default)

-t intervardb, --database_intervar=intervardb The database location/dir for the InterVar dataset files

-s your_evidence_file, --evidence_file=your_evidence_file

이 옵션은 각각의 varinat 분석을 위해 사용자가 설정하여 사용할 수 있다.

The format for upgrad/downgrade of criteria should be like:
grade_PS1=2;           1 for Strong; 2 for Moderate; 3 for Supporting)

 Chr Pos Ref_allele Alt_allele  evidence_list
 1 123456 A G PM1=1;BS2=1;BP3=0;PS5=1;grade_PM1=1

--table_annovar=./table_annovar.pl The Annovar perl script of table_annovar.pl

--convert2annovar=./convert2annovar.pl The Annovar perl script of convert2annovar.pl

--annotate_variation=./annotate_variation.pl The Annovar perl script of annotate_variation.pl

-d humandb, --database_locat=humandb The database location/dir for the Annovar annotation datasets

--table_annovar =. / table_annovar.pl table_annovar.pl의 Annovar perl 스크립트

--convert2annovar =. / convert2annovar.pl convert2annovar.pl의 Annovar perl 스크립트

--annotate_variation =. / annotate_variation.pl annotate_variation.pl의 Annovar perl 스크립트

-d humandb, --database_locat = humandb Annovar 주석 데이터 세트의 데이터베이스 위치 / 디렉토리

EXAMPLE #

./InterVar.py -c config.ini  # Run the examples in config.ini
./InterVar.py  -b hg19 -i your_input  --input_type=VCF  -o your_output

HOW DOES IT WORK #

InterVar는 VCF 형식 또는 ANNOVAR 입력 형식의 미리 주석이 달린 파일 또는 주석이 없는 입력 파일을 사용한다. 여기서 각 줄은 하나의 유전 변이에 해당한다. 입력 파일에 주석을 달지 않으면 InterVar가 ANNOVAR를 호출하여 필요한 주석을 생성한다. InterVar의 실행은 크게 두 가지 주요 단계로 이루어져 있다. 1) 자동으로 28개의 코드를 해석한다. 2) 임상적 중요성을 재해석하기 위해 사용자에 의한 수동 조정, 그러나 사용자는 "-evidencefile = your_evidence_file" 인수를 사용하여 고유한 증거 코드를 지정하고, InterVar로 가져올 수 있으므로 한 단계만으로 최종 결과를 생성할 수 있다. 결과물에서 자동으로 생성되거나 사용자가 제공하는 모든 28가지 증거 코드를 기반으로 각 변종은 "병원성", "가능성이 있는 병원성", "불확실한 중요성", "가능성이 양성" 또는 "양성"으로 지정된다. 또한 http://wintervar.wglab.org에서 액세스할 수 있는 wInterVar라는 InterVar 웹 서버를 개발했다. 사용자는 wInterVar에서 염색체 위치, dbSNP 식별자 또는 핵산 변경 정보가 포함된 유전자 이름을 사용하여 직접 missense 변이형을 입력할 수 있다. wInterVar 서버는 변형에 대한 모든 증거 코드를 포함하여 변형에 대한 모든 세부 정보를 제공한다. 그런 다음 사용자는 이러한 증거 코드를 수동으로 조정하고 서버에 다시 제출하여 재해석을 수행할 수 있다. 가능한 모든 동의어가 아닌 변형에 대한 모든 코드가 우리에 의해 사전 계산되었으므로 wInterVar의 실행은 결과를 얻기 위해 일반적으로 1초 미만으로 매우 빠르다. 그러나 wInterVar 서버는 다른 유형의 변형 (예 : indels)을 처리할 수 ​​없으므로 사용자는 대신 InterVar를 사용해야 한다.

Reference #

0.0.1_20140628_0