Transcription factor 예측 방법
#
Find similar titles
- 최초 작성자
- 최근 업데이트
Structured data
- Category
- Analysis
Table of Contents
Microarray 발현 분석을 통한 transcription factor 예측 #
차등발현 유전자의 선택 #
Microarry 발현 분석을 할 때, 가장 중요한 것은 어떤 발현 변화를 의미있는 발현으로 취급할지 이다. 단순히 fold change가 2이상 차이나는 유전자군을 선택하는 것이 아니라 통계적인 유의성 검증을 통해 유전자를 선별하는게 좋다. 사용되는 통계방법은 t-test와 ANOVA 방식이 있다. t-test는 2가지의 서로 다른 조건의 샘플을 비교할 때 사용하며, 3가지 이상의 parameter를 갖는 샘플들을 비교할 때는 ANOVA분석을 시행하게 된다. 예를 들어, 약물을 처리하고 안한 샘플과 wild type이나 knokout 샘플을 같이 비교하기 위해서는 ANOVA를 사용한다.
전자 인자 실험 모델 #
Microarray 분석에 의한 Transcription factor(이하 TF) 조절 유전자 군은 환경에 따라 다르게 발현되는 유전자이거나 특정 TF에 의해 조절되는 전체 유전자군일 수 있다. 특정 TF에 의해 조절되는 유전자군을 선별할때는 특정 TF의 영향을 받는 세균과 그렇지 않은 세균을 대조군으로 비교하면 된다. 즉 Wild type과 특정 TF의 isogenic mutatant를 서로 비교한다. 하지만 이 경우, 특정 isogenic mutant들이 환경의 변화에도 민감하게 반응할 수 있있기 때문에 이미 알려진 mutant 세균이 받는 영향을 최소로 할 수 있는 성장인자를 사용하게 된다.
다른 통계 방법들 #
TF를 선별하기 위해 통계분석 외에도 clustering방법을 사용하게 된다. hierarchical clustering, K-means clustering, self-organizing maps(SOMs), principle component analysis(PCA)가 있다. Hierarchical clustering은 비슷한 발현패턴의 유전자들과 조건들을 연결시켜준다. 다음은 Partek을 이용하여 clustering을 한 것이다.
또 K-means clustering은 같은 패턴을 갖는 유전자들을 그룹핑을 해주는 것이다.
SOMs는 고차원에서 저차원으로 분석하는 방법이며, 다음과 같이 시각화될 수 있다.
PCA는 주성분 분석법으로 2차원 혹은 3차원에서 같은 좌표에 같은 성분의 유전자들을 나타낸다.
Time course로 실험하여 mutant 세균의 유전자 발현을 시간에 따라 추적하는 방법으로 특정 TF를 찾을 수 있다. 주의할 점은 시간을 너무 짧게 잡으면 정확한 TF를 찾기가 힘들고, 시간을 너무 길게 잡으면 발현 프로파일 noise가 증가해 TF선별이 어렵다. 실제 SMD(stanford Microarray Database)에서 보고된 바로는 time point를 8개 이하로 잡는게 대부분이다.
출처: 1. http://bric.postech.ac.kr/biowave/archive/biowave201504/index.php 1. http://www.partek.com/Tutorials/microarray/User_Guides/HierarchicalClustering.pdf 1. http://folk.uib.no/nmaja/public/speed/c3278-CH04.pdf 1. http://compbio.pbworks.com/w/page/16252903/Microarray%20Clustering%20Methods%20and%20Gene%20Ontology 1. http://stackoverflow.com/questions/16653581/color-pca-depending-on-predefined-groups