Skip to content

MapMan #
Find similar titles

Structured data

Category
Software

MapMan, 난 이렇게 사용했다. #

The 생물 안에서는 where, what 유전자가 일하고 있을까? #

NGS(Next Generation Sequencing)를 이용한 분석, 특히 RNA-seq을 이용한 전사체 분석을 하다보면 종종 떠오르는 궁금증이 있다.

"이 생물 안에선 도대체 무슨 일이 벌어지고 있길래 이런 현상을 보이는 걸까?"

이 궁금증을 해결하는 방법에는 정말 다양한 분석법들이 존재하지만, 그 중 분석의 큰 그림을 그려주는 좋은 방법이 있다.

바로 MapMan을 이용하는 것이다.

ManMan? MapMan symbol MapMan! #

MapMan유전자 발현 데이터와 같은 큰 데이터 셋을 visualization 해주는 소프트웨어다. 이것이 궁금증 해소와 분석의 큰 그림을 그리는데 유용한 이유는 단순한 visualization 만을 해주는 것이 아닌, 생물내의 metabolic pathways 그리고 각종 processes 별로 나눠 visualization 이 가능하다는 점 때문이다.

MapMan은 독일의 Max Planck Institute of Molecular Plant Physiology 에서 Mark Stitt 그룹과 함께 개발됐다. 현재(08.04.2014)까지는 19.06.2013에 업데이트된 version 3.6.0RC1 이 가장 최신 버전이다. 몇 차례의 업데이트를 통해서 초기의 계획된 것 보다 많은 기능을 갖고 있으며 다양한 기능을 잘 활용한다면 매우 유용한 분석 도구가 될 것으로 생각된다.

ManMap을 개발 한 곳

위치는 독일의 베를린에서 조금 떨어진 곳!

MapMan의 큰 그림 #

MapMan의 장점은 앞에서 언급했듯 분석의 큰 그림을 한눈에 볼 수 있다는 점이다. 다시 말하자면 The 생물 안에서의 다양한 pathways 나 processes 에 관계된 유전자(혹은 전사체)의 발현양상을 한눈에 확인 할 수 있다.

MapMan_exam

Fig.1 Metabolism overview 에 대한 visualization 예시

위 그림에서 확인 할 수 있듯이 metabolism 에 속한 TCA cycle, Cell membrane 등 다양한 pathways, processes 에서의 발현양상을 한눈에 확인 할 수 있다. Metabolism overview 외에도 Secondary Metabolism, RNA-ProteinSynthesis 등 다양한 categories를 제공하고 있다. 더욱 대단한 것은 기본으로 제공하는 것 외에도 MapMan store (pathways)를 통해서 더욱 많은 종류의 pathway categories를 제공한다는 점이다. 기본제공으로도 충분해 보이지만 한번쯤 둘러보는 것도 좋다.

큰 그림을 보기 위해서만 개발된 것은 아니다. 큰 그림을 위해서만 개발됐다면 나무없는 숲과 같다.

도와줘요. MapMan #

실제로 나의 데이터에 MapMan의 도움을 받기 위해선 준비해야 할 것들이 몇가지 있다. (파란 바지위에 빨간 속옷을 입은 슈퍼맨은 그냥 도와주지만...)

  1. 배경 그림판 격인 pathway file

    처음에 언급한데로 pathway file은 MapMan store (pathways) 에서 추가적인 활용이 가능하다.

  2. 배경 그림판과 발현값을 연결해주는 mapping file (.m02)

    mapping file은 pathway file과 expression file 을 연결해주는 매개체 같은 역할을 담당한다. 예를 들어 Arabidopsis 의 expression data를 metabolism overview 에 띄우고 싶다면 Arabidopsis의 mapping file이 필요하다. 이 mapping file은 바이너리 파일로 되어있어 개개인이 만드는 것은 불가능에 가깝다. 따라서, MapMan은 pathway file과 마찬가지로 MapMan store (mapping) 에서 다양한 mapping file을 제공하고 있다. 링크된 store 에서 확인 할 수 있듯이 Arabidopsis, Oryza sativa, Maize 등 매우 다양한 종에 대해 제공하고 있으니 분석 종에 맞는 mapping file을 다운받아 사용할 수 있다.

  3. 각 유전자(혹은 전사체)의 RPKM값을 담은 expression file (.txt or .csv)

    expression file 은 각 조건별(or 샘플별) RPKM 값을 담은 tab delimited txt file 을 준비해야 한다. 위 두 파일은 MapMan에서 제공하는 파일을 사용하면 되지만 expression file 은 자신의 NGS data를 이용해 계산된 RPKM으로 직접 만들어야 한다. gene id 는 mapping file 의 gene id 와 일치화를 해야하는데 일반적으로 Genome project를 진행한 model 종의 id 를 사용하면된다. 따라서 tophatcufflinks를 이용하면 단번에 해결된다.

더하기1 #

모델종이 아닌데요!? 혹은 분석하고자 하는 종에 대한 mapping 파일을 MapMan store에서 지원하지 않아요.

위와 같은 문제점에 대해서도 100%는 아니지만 미약하게나마 해결책은 존재한다. 바로 Ortholog gene을 이용해 gene id 를 변환시키는 것이다. 이 부분에 대해서는 추후에 작성해보겠다.

더하기2 #

샘플(or 조건) 간 차이를 하나의 Pathway에서 보고싶어요.

2개의 샘플을 갖고 분석을 진행할 때 FC(Fold Change)를 이용해 그리면 한 눈에 하나의 페이지에서 샘플간 변화를 관찰할 수 있다. 이 때, FC에 log2를 취하면 좀 더 significant한 결과를 확인 할 수 있다.

마치면서 #

MapMan은 이번 글에서 알아 본 것외에도 굉장히 많은 기능을 갖고 있다. 기능을 하나하나 공부하면서 자신의 분석에 적용해보는 것이 가장 MapMan을 MapMan답게 사용하는 방법이라 생각된다. 큰 숲과 하나의 나무를 보여주는 MapMan과 이 글을 통해 좋은 연구 결과로 이어졌으면 한다.

Posting by Seung1.Yoo

Incoming Links #

Related People #

Suggested Pages #

0.0.1_20140628_0