Computational Biology
#
Find similar titles
- (rev. 1)
- cloudgo
Structured data
- Category
- Biology
계산생물학(Computational Biology) 개요 #
컴퓨터의 발달은 인간의 삶에 많은 영향을 주고 있을 뿐만 아니라 여러 분야의 학문연구에도 중대한기여를 하고 있다. 특히 컴퓨터가 자연과학연구에 이용되어온 사례는 컴퓨터 발달사와 어깨를 나란히 할 만큼 긴역사를 가지고 있다. 수학과 물리학에서의 응용수학분야나 이론물리학분야에서 기존에 해석적으로 풀 수 없었던각종 문제들을 컴퓨터의 계산 속도를 극대화하는 수치적분을 이용하여 해결하거나, 혹은 모의실험연구등에서컴퓨터를 이용한 연구가 진행되어왔다. 화학에서도 1960 년대부터 시작된 양자역학을 이용하여 전자에너지를계산하거나, 1980 년대부터 시작된 다양한 분자현상을 컴퓨터를 이용하여 모의실험 하는 분야 등에서 컴퓨터가이용되고 있으며 오늘날에는 계산화학 (Computational Chemistry) 이라는 분야로 자리매김 하게 되었다.이처럼 자연과학의 연구에 있어서 컴퓨터의 이용은 시대적인 흐름이었고 이러한 분위기는 자연스럽게생명과학 연구에서도 적용되게 되었다. 1980 년대부터 시작된 작은 유기분자들을 대상으로한분자동력학모의실험법이 컴퓨터의 발달과 더불어 발전을 거듭하게 단백질과 같은 거대생물분자들을 상호작용연구에도 응용되어 질 수 있게 되었다. 1990 년대에 이르러 이런 모의실험연구법의 정확도가 만족할 만한 수준에이르자 이 방법은 생명현상의 기본이라고 할 수 있는 단백질-지질 상호작용에 관한 연구를 원자수준에서 수행할수 있는 아주 강력한 새로운 생물학 연구수단으로 자리 잡게 되었다. 또한 2001 년 Human Genome Project 의완성으로 폭발적인 관심을 모으고 있는 유전체나 단백체연구에 도움을 주고 있는생물정보학(Bioinformatics)분야등 수많은 생명과학연구에 컴퓨터가 이용 되고 있다. 이와 같이 주로 컴퓨터만을이용하여 생물학 혹은 생명과학 현상을 연구하는 분야를 계산생물학(Computational Biology) 혹은이론생물학(Theoretical Biology)이라고 부른다.
계산생물학 분류 #
일반적으로 계산생물학이란 단어가 의미하는 뜻 그대로 컴퓨터를 이용하여 생물학연구를 수행하는학문분야를 지칭한다. 이 정의에 의하면 수많은 세부 분야들이 존재하게 되는데 그중에서 가장 대표적인 몇 가지주요세부분야로 계산생물학을 분류해 보고 그 각각에 대하여 간략하게 알아보기로 하자. 전체 계산생물학을 여러 개의 세부분야로 나누는데는 여러 가지 방법이 존재하겠지만 <그림 1>처럼 크게 다음의 네 가지 세부분야로 분류하고자 한다: 1) 컴퓨터모의실험, 2) 컴퓨터를 이용한신약설계, 3) 생물정보학, 4) 기타분야. 이는 계산생물학의 발전의 역사와도 어느 정도 관련이 있고 또 분야 간구분도 어느 정도 분명하게 존재하여 본인이 즐겨 사용하는 구분법이다.Pople 과 Kohn 등에 의해서 1960 년대부터 시작된 양자역학(Quantum Mechanics, QM)적 계산법에컴퓨터를 이용한 이용하여 화학분자들의 전자에너지나 구조를 계산하는 분야가 시작 되면서 계산화학이 시작되었다고 볼 수 있다.
1980 년대에 이르러 Dewar에 의해서 거의 완성된 이 양자역학적계산법은 매우정확한 결과를 제공하는 장점이 있기는 하지만 막대한 계산시간이 요구되는 관계로 인하여 연구대상물이 작은화학분자로 제한되는 약점을 가지게 되었다. 이러한 한계 때문에 이 계산방법은 생물학자들에게는 큰 관심을끌지 못하였다. 그러나 1980 년대에 들어서 Allinger 등이 분자역학(Molecular Mechanics, MM) 라는 전혀 새로운방식의 분자계산법을 개발하였는데 이 방법은 양자역학적 계산법에 비하여 정확성은 다소 떨어지지만 괄목할만한계산시간단축을 실현함으로서 분자에너지및 구조계산분야에 새로운 전기를 맞이하게 되었다. 분자역학이라는 새로운 빠른 계산엔진을 이용하여 분자에너지계산은 물론이고 Newton 방정식을수치적으로 풀어내어 분자들의 실시간 움직임을 관찰 할 수 있는 분자동력학(Molecular Dynamics, MD)모의실험이라는 꿈같은 계산도 가능하게 하였다. 이러한 상황에 이르자 거대한 분자를 연구대상으로 삼던 생물학자들은이러한 계산 분야를 주목하게 되었고, 이처럼 1980 년대에 시작된 분자역학을 이용하여 거대분자에 대한 에너지및 분자동력학모의실험 계산이 계산생물학의 효시라고 볼 수 있다. 초기에는 계산생물학 하면 이 분야를지칭하였지만, 1990 년대에 들어서 컴퓨터를 이용한 생물학 연구에 있어서도 다양한 방식으로 컴퓨터가 이용되기시작함에 따라 이러한 전통적인 계산 분야를 '컴퓨터 모의실험' 분야로 구분지어 부르게 되었다. 다음절에서 좀 더자세히 살펴보겠지만, 이 컴퓨터모의실험 분야에는 분자동력학 모의실험을 대표로 하여 몬테카를로(Monte Carlo,MC)모의실험, 브라운동력학(Brownian Dynamics, BD)모의실험, 그리고 단백질-지질 혹은 단백질-단백질 간의결합모드를 연구하는 분자도킹(Molecular Docking)모의실험 분야등이 있다.
<그림1. 계산생물학의 대표적인 세부분야들>
1980 대 후반부터는 신약을 개발하는 도구로도 컴퓨터가 이용되어져 왔다. 그 이전에는 실험자의경험과 축적된 지식을 기반으로 하여 분자구조와 약리활성관계를 정성적으로 연구하는 구조활성관계(StructureActivity Relationships, SAR)라는 연구 분야가 존재하였었다. 그러나 계산화학의 발달로 인하여 분자구조가밝혀지면 그에 따라는 다양한 물리량들을 정확하게 계산할 수 있게 되자 이렇게 계산된 물리량들과 약리활성을통계적 처리를 거쳐 회귀방정식을 이용하여 연결시킨다. 이렇게 되면 이 방정식을 이용하여 비슷한 새로운구조에 대하여 약리활성을 예측할 수 있게 되는데 이러한 연구 분야를 정량적구조활성관계(Quantitative SAR,QSAR)라 부르는데, 이러한 개념은 1960 년대 말 Hansch 에 의해서 처음 시도되었고 계산법이 발달한1980 년대 말에 이르러 본격적인 발전을 이루게 되었다. 이처럼 컴퓨터를 이용하면 신약개발에 드는 비용을절감하고 개발시간을 단축시킬 수 있으므로 이런 분야를 합리적신약설계(Rational Drug Design)라고도 부르며보다 일반적인 용어는 컴퓨터를 이용한 신약설계(Computer-Aided Drug Design, CADD)라고부른다. 초기에는 2 차원 혹은 3 차원 QSAR 이 이 분야 연구의 주종을 이루었지만, 최근에는 더욱 강력하고 다양한 소프트웨어와 데이터베이스의 개발로 인하여 신약개발에 있어서 없어서는 안 되는 중요한 연구 분야로자리 잡게 되었다. 생물학의 연구의 특징 중에 하나는 중심요소의 구조뿐만 아니라 단백질의 아미노산서열이나 유전체의염기서열 같은 관심대상물의 기본단위들의 서열분석도 중요한 연구대상 된다는 점이다. 그러므로 유사한단백질이나 DNA 의 단위체를 비교하고 분석하고 필요한 서열을 찾아내는 연구 분야의 필요성이 일찍부터 대두되어 1990 년대 초부터 FASTA와 BLAST로 대변되는 다양한 서열분석(Sequence Analysis)프로그램들이 개발되어 여러 분야 연구에 기여하고 있다. 2001 년 Human Genome Project 가 거의 완성되자 이를기점으로 유전체나 단백체연구에 많은 관심이 집중되었고 이 서열분석 연구 분야는 생물정보학(Bioinformatics)이라는 새로운 이름으로 자리매김하고 있는 추세이다. 계산유전체학(Computational Genomics)이나계산단백체학(Computational Proteomics)등으로도 부를 수 있을 것이다. 미국에서는 이 분야도 새로운 용어 사용없이 기존의 계산생물학이라고 부르는데 반하여, 영국을 중심으로 한 유럽에서는 이분야를 일컫을 때생물정보학이라는 용어를 선호하는 추세이다. 계산생물학에는 앞에서 언급된 세 가지 주요 연구 분야 이외에도 Homology 모델링, pKa 계산,Electrostatic potential 계산 그리고 단백질구조 visualization 도구 개발 분야등 작은 여러 가지 분야들이존재하는데 이들을 기타분야로 분류 하였다.