Skip to content

CD-HIT #
Find similar titles

Structured data

Category
Software

소개 #

CD-HIT은 aligment를 통해 NR Dataset을 만들어주는 프로그램이다. BLAST와 비교하자면, formatdb와 같으나 cd-hit의 장점은 매우 빠른 속도에 있다. CD-HIT 메뉴얼에 따르면 다른 클러스터링 프로그램보다 약 100배정도 빠르다고 한다.

2001년 처음으로 릴리즈가 되었으며, 현재 v4.6이 가장 최신이다. 또한 현재 CD-HIT은 많은 패키지 프로그램을 가지고 있다. 패키지 프로그램은 다음과 같다.

  • cd-hit, cd-hit-2d, cd-hit-est, cd-hit-est-2d, cd-hit-para, cd-hit-2d-para, psi-cd-hit, psi-cd-hit-2d, cd-hit-454

설치 #

CD-HIT은 C++로 개발되었으며 프로그램 다운로드 및 설치는 다음과 같이 수행한다.

$ wget https://cdhit.googlecode.com/files/cd-hit-v4.6.1-2012-08-27.tgz
$ tar xvf cd-hit-v4.6.1-2012-08-27.tgz
$ cd cd-hit-v4.6.1-2012-08-27
$ make
$ make openmp=yes

설치후 make를 이용해서 컴파일을 하면 해당폴더에 cd-hit, cd-hit-2d, cd-hit-454, cd-hit-div, cd-hit-est, cd-hit-est-2d가 생성되어 있다. 그리고 cd-hit를 실행시키면 사용법을 볼수 있다.

참고 #

Incoming Links #

Related Bioinformaticses #

0.0.1_20140628_0