Skip to content

Metagenomics #
Find similar titles

Structured data

Category
Analysis

Metagenomics #

Metagenome은 1998년 Handelsman 등의 연구에 의해 처음으로 도입한 개념으로 자연계에 존재하는 모든 미생물의 유전체 집합으로 정의되며, 최근에는 특정 환경 시료로부터 추출한 유전체 또는 유전자를 포함하는 클론을 총칭하기도 한다. 이러한 일련의 미생물 군집을 분석하고 환경과 미생물 간의 생태학적인 의미를 연구하는 것을 Metagenomics라고 하며, NGS 플랫폼이 발전하면서 현재 다양한 환경 시료를 통해 미생물 군집분석이 진행되고 있다. 모델 균주나 표준 균주의 분석에 국한되지 않고 유전체 정보 비교를 위한 환경 분리 미생물이나 유연관계가 가까운 미생물의 분석으로도 확장되고 있다. 또한, 배양할 수 없는 미생물의 경우 BAC (Bacterial artificial chromosome) 및 fosmid를 이용한 단편 서열분석으로부터 전체 환경 유전체 염기서열에서 개별 미생물 유전체를 완전하게 조립하거나 개별 세포에서 유전체를 획득하고 이로부터 유전체를 분석한다.

16S/ITS community surveys #

특정 시료의 미생물 군집분석을 위해서는 16s rRNA와 18s rRNA, ITS 영역을 주로 시퀀싱 하여 확인하는데, 분석은 물론 동일 영역을 증폭하여 비교하여야 하며, 길이가 비교적 짧아 대량의 군집분석에 빠른 결과를 확인할 수 있다. 또한, 박테리아 같은 경우에는 Taxonomy 분석을 위해서 마커로 활용되는 유전자로 위에서 언급했던 16s ribosomal RNA를 많이 사용한다. 그 이유는 rRNA는 모든 종에서 매우 유사한 기능을 하지만, 뉴클레오타이드의 실제 서열은 종마다 매우 다양하여, 생물학적 유의미성이 매우 크기 때문에 분류학에서 종 다양성을 분석하기 쉬운 마커이기 때문이다.

16S/ITS sequence processing workflow #

Filter for contaminants and low quality reads #

1. Quality plot과 서열 트리밍 #

  1. FastQC : http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
  2. FASTX : http://hannonlab.cshl.edu/fastx_toolkit
  3. QIIME2 : https://qiime2.org/

2. Chimera removal #

  1. AmpliconNosie : http://code.google.com/p/ampliconnoise/
  2. UCHIME : http://www.drive5.com/uchime/
  3. QIIME2 : https://qiime2.org/

Assemble overlapping reads #

1. Merge overlapping paired end reads #

  1. FLASH : http://www.genomics.jhu.edu/software/FLASH/index.shtml
  2. FastqJoin : http://code.goole.com/p.ea-utils/wiki/FastqJoin
  3. CD-HIT read-linker : http://weizhong-lab.ucsd.edu/cd-hit/wiki/doku.php?id=cd-hit-auxtools-manual
  4. QIIME2 : https://qiime2.org/

Reduce datasets (Clustering) #

1. Clustering with high stringency #

  1. UCLUST/USEARCH (16s only) : http://www.drive5.com/usearch/
  2. CD-HIT-OTU (16s only) : http://weizhong-lab.ucsd.edu/cd-hit-otu/
  3. phylOTU (16s only) : http://gitub.com/sharpton/PhylOTU
  4. QIIME2 (16s only) : https://qiime2.org/

Perform taxonomic classification and comput diversity metrics #

1. Composition based classifiers #

  1. RDP database + classifiers : http://rdp.cme.msu.edu/classifier/classifier.jsp

2. Homology based classifiers #

  1. ARB + Silva database (16s only) : http://www.arb-home.de/
  2. GreenGenes database (16s only) : http://greengenes.lbl.gov/cgi-bin/nph-index.cgi
  3. SILVA database (16s, 18s only) : https://www.arb-silva.de/
  4. UNITE database (ITS only) : http://unite.ut.ee/
  5. FungalIPSPipeline (ITS only) : http://www.emerecia.org.funfalitspipeline.html

Incoming Links #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20210630_7_v33