Skip to content

유전자 발현 관련 Public 데이터베이스 및 분석 도구 #
Find similar titles

유전자발현 공공데이터베이스 #

유전자 발현 분석은 크게 두 가지 방법으로 진행이 된다. 첫 번째는 NGS 데이터를 이용한 발현 분석이며, 두 번째는 microarray를 이용한 방법이다.

NGS 데이터베이스 #

Micro array 데이터베이스 #

Gene Expression Omnibus #

유전자발현 분석도구 #

유전자 발현 분석에 사용하는 public 툴에 대해서 소개하고자 한다. Public 툴로 분석 시에는 여러 가지 툴을 이용하며 리눅스를 베이스로 하기 때문에 명령어를 입력하여 분석을 진행한다. 추천하는 RNA-seq 분석은 레퍼런스 데이터에 따라 조금씩 달라진다.
* 참조

참고논문은 2016년에 퍼블리쉬된 것으로 RNA-seq 데이터 분석 방법에 대해서 잘 설명되어 있다. 이 페이퍼에서는 레퍼런스가 genome인지 transcriptome인지 레퍼런스가 없는지에 따라 세 가지 방법으로 파이프라인을 제시하고 있다.

레퍼런스에 따른 다른 분석방법 #

레퍼런스 : Genome #

Image

레퍼런스 서열이 genome 일 경우에는 mapper를 TopHat이나 STAR를 사용한다. TopHat은 정통적인 툴이며 2012년 STAR라는 속도가 비교적 굉장히 빠른 mapper가 개발되었다. (STAR에 대한 자세한 정보는 링크를 통해 확인할 수 있다.)
레퍼런스에 리드를 mapping하고 난 뒤, TopHat output으로 분석하는 Cufflinks를 이용하여 read를 계산한다. 이때 GFF가 있는 경우에는 transcript에 따라 expression value를 보여주고 GFF annotaion 파일이 엇는 경우에는 발현 차이가 많이 나거나 관심 있는 부분의 유전자를 Blast2GO를 통해 anntation을 하여 function을 알아본다.

레퍼런스 : Transcriptome #

Image

레퍼런스가 transcriptome일 경우에는 갭을 고려하지 않아도 되는 mapper인 Bowtie를 이용한다. 그리고 RSEM이나 Kallisto를 이용하여 transriptome에 mapping된 리드를 센다.

레퍼런스 : none #

Image

레퍼런스서열이 없는 경우에는 RNA-Seq 데이터를 가지고 de-novo assembly를 먼저 진행하여 reference를 대신할 서열을 만든다. 이 때, De Bruijin 알고리즘을 이용하는 Trinity를 이용하여 진행을 한다. 이 역시 레퍼런스로 transcriptome 데이터가 사용되었기 때문에 갭을 고려하지 않아도 되는 mapper인 Bowtie로 mapping한다. 그뒤에 각 transcript마다 붙어있는 리드를 세고 Blast2GO 등의 툴을 이용하여 각 서열마다 기능 annotation을 진행하여 서열의 의미를 찾는다.

Suggested Pages #

0.0.1_20140628_0