ASTRAL
#
Find similar titles
- (rev. 10)
- syp
Structured data
- Category
- Database
구조정보와 서열정보의 연결 #
단백질 데이터 은행(PDB)은 단백질 3D구조 정보를 제공하고 이를 가공한 3Dee, CATH, DDBASE, SCOP 등의 도메인 및 분류 데이터베이스를 통하여 기능을 분석한다. 특히 SCOP는 수작업을 통하여 단백질 도메인을 정의하기에 좀 더 정확하며, 구조 기반의 2차 정보는 단백질 기능관점의 구조 및 진화를 이해하는 데 중요한 자료로 활용된다. PDB파일 내 서열정보를 직접 활용하기는 쉽지 않다. 이는 종종 단백질의 생물학적 서열과 구조 사이의 연결이 되지 않기 때문이다. 이럴 경우 도메인 등의 기능정보를 활용하여 서열과 구조 사이를 연결한다. 특히 PDB 내의 도메인 서열은 서로 매우 유사하기에 쉽게 분별하기 어려우며, 이를 해결해야만 고품질의 서열 정보를 활용할 수 있다.
ASTRAL 데이터베이스 #
단백질 구조 및 연관된 시퀀스의 사용을 돕기 위하여 구조 분류 정보인 SCOP를 활용한 구조 영역의 서열 데이터베이스가 ASTRAL이며 낮은 중복성 및 높은 품질의 서열 정보를 제공한다.(그림1)
<그림1. ASTRAL 메인페이지(2018, 2.07 버전 기준)>
ASTRAL 데이터 현황 #
ASTRAL 정보는 단백질 구조의 해상도(결정학적 성질)의 규칙에 대한 추정치를 제공하는 지수(SPACI)를 활용하며, pdb2cif 프로그램에 의해 제공된 정렬정보를 기초로 PDB 내 원자 및 서열정보 사이의 매핑으로 생성한다.(그림2)
현재 ASTRAL은 SCOPe와 통합하여, SCOPe 사이트에서 제공하고 있으며, 최신 2.07버전에서는 PDB리코드 기준으로 40% 미만으로 일치하는 14,324개의 서열과 95% 미만으로 일치하는 30,202개의 서열을 Fasta 형식으로 제공하고 있다.(그림3)
<그림2. ASTRAL DB 생성 모식도 >
<그림3. ASTRAL 2.07 데이터 현황>