Skip to content

Greengenes #
Find similar titles

Structured data

Category
Database

Greengenes #

http://greengenes.lbl.gov 16s rRNA 데이터베이스이면서 16s rRNA를 분석할 수 있는 기본적인 툴을 포함하고 있다.

Image

Taxonomy #

두개의 계와 분류되지 않은 것 총 세가지의 카테고리로 나뉘어 시작하며 점점 하위단계로 세분화되어 있다.

  • Archea
  • Bacteria
  • Unidentified

총 40만여종이 K_;P_;C_;O_;F_;G_;S_의 형식으로 ;(세미콜론)으로 하위단계를 표시해준다.

다운로드 #

아래를 클릭하면 최신 버전(May, 2013)의 Greengenes Database를 다운받을 수 있다.
http://greengenes.secondgenome.com/downloads/database/13_5

OTU Database #

OTU DB 뒤 숫자는 similarity를 의미한다. Greengenes의 경우에는 61%부터 99%까지 3%의 갭으로 14개의 DB가 존재하는데 similarity가 낮은 데이터는 similarity가 높은 데이터의 subset이다. Similarity가 높으면 자세한 종까지 시퀀스와 비슷해야 인정하지만 similarity가 낮으면 시퀀스의 유사도가 낮아도 비슷한 그룹으로 인정해준다. Metagenomics에서 16s rRNA 시퀀싱데이터를 가지고 OTU분석을 할 때 사용된다.

Suggested Pages #

0.0.1_20140628_0