Skip to content

ASTRAL #
Find similar titles

Structured data

Category
Database

구조정보와 서열정보의 연결 #

단백질 데이터 은행(PDB)은 단백질 3D구조 정보를 제공하고 이를 가공한 3Dee, CATH, DDBASE, SCOP 등의 도메인 및 분류 데이터베이스를 통하여 기능을 분석한다. 특히 SCOP는 수작업을 통하여 단백질 도메인을 정의하기에 좀 더 정확하며, 구조 기반의 2차 정보는 단백질의 기능관점의 구조 및 진화를 이해하는데 중요한 자료로 활용된다. PDB파일 내 서열정보를 직접활용하기는 쉽지 않다. 이는 종종 단백질의 생물학적 서열과 구조사이의 연결이 되지 않기 때문이다. 이럴 경우 도메인등의 기능정보를 활용하여 서열과 구조사이를 연결한다. 특히 PDB 내의 도메인 서열은 서로 매우 유사하기에 쉽게 분별하기 어려우며, 이를 해결해야만 고품질의 서열 정보를 활용할 수 있다.

ASTRAL 데이터베이스 #

단백질 구조 및 연관된 시퀀스의 사용을 돕기 위하여 구조 분류 정보인 SCOP를 활용한 구조 영역의 서열 데이터베이스가 ASTRAL이며 낮은 중복성 및 높은 품질의 서열 정보를 제공한다.(그림1)

ASTRAL 메인페이지

<그림1. ASTRAL 메인페이지>

ASTRAL 데이터 현황 #

ASTRAL 정보는 단백질 구조의 해상도(결정학적 성질)의 규칙에 대한 추정치를 제공하는 지수(SPACI)를 활용하며, pdb2cif 프로그램에 의해 제공된 정렬정보를 기초로 PDB 내 원자 및 서열정보사이의 매핑으로 생성한다.(그림2)

현재 ASTRALSCOPe와 통합하여, SCOPe 사이트에서 제공하고 있으며, 최신 버젼 2.05에선는 SCOPe 데이터와 40% 이하로 일치하는 13,366개의 서열과 95% 이하로 일치하는 17,883개의 서열을 Fasta 형식으로 제공하고 있다.(그림3)

ASTRAL 데이터 생성 방법

<그림2. ASTRAL 데이터 생성 방법>

ASTRAL 데이터 현황

<그림3. ASTRAL 데이터 현황>

출처 #

출처 http://astral.berkeley.edu/

0.0.1_20140628_0