Skip to content

JELLYFISH #
Find similar titles

Structured data

Category
Software

JELLYFISH #

JELLYFISH란? #

  • JELLYFISH는 memory를 효율적으로 사용하여 빠르게 DNA 내 k-mer를 count하는 프로그램이다. 정확히 말하면 JELLYFISH는 k-mer(k 길이의 substring)가 서열 내 차지하는 정도를 counting하여 DNA 서열의 많은 분석에서 이용할 수 있는 정보를 제공한다. 무엇보다 Genome size estimation에 이용할 수 있다.
  • 또한, JELLYFISH는 command-line 프로그램이며, DNA 서열을 포함하고 있는 FASTA 그리고 multi-FASTA read들을 input으로 사용한다. JELLYFISH의 output은 k-mer를 count한 binary format이다. 이것을 jellyfish dump command를 사용해서 사람이 읽을 수 있는 text로 전환시킬 수 있다.

JELLYFISH 설치요구 조건 #

JELLYFISH는 64-bit intel-compatible processor로 운영되는 Linux 또는 FreeBSD에서 작동하며 GNU GCC(v4.4)로 compile한다.
  • Compilation
    • 기본적인 설치방법
      ./configure
      make
      sudo make install
    • RedHat 5 그리고 6(또는 CentOS), default compiler 대신
      install version 4.4가 필요하다.
      yum install
      gcc44-c++
      그리고 나서 configure를 실행한다.
      ./configure
      CXX=g++44
    • 1.3 default로는 /usr/local에 install되기 때문에 다른 directory에
      install하려면 아래와 같은 방법으로 설정해야 한다.
      ./configure --prefix=${설정하고자 하는 driectory}

JELLYFISH 시작하기 #

  • 모든 k-mer를 count하는 기본적인 command는 " jellyfish count -m 21 -s 100M -t 10 -C reads.fasta "
  • 이것은 canonical(-C) 21-mers로 100 million 요소들과 함께(-s 100M) hash와 reads.fasta file을 10개의 thread(-t 10)들을 사용해서 count한다는 의미이다. output은 'mer_count.jf'로 이것은 default 옵션을 쓴다(이것은 -o 를 사용해 변경할 수 있다.).

  • k-mer로 발생되는 histogram을 계산하기 위해서, histo subcommand를 사용한다.(section 3.1 참고) : " jellyfish histo mer_counts.jf "

  • 특정 k-mer를 계산하기 위해서, query subcommand를 사용한다.(section 3.3참고) : " jellyfish query mer_counts.jf AACGTTG "

  • File 내 모든 k-mer에 대해서 모두 count하기 위해서, dump subcommand를 사용한다.(section 3.2 참고) : " jellyfish dump mer_counts.jf > mer_counts_dumps.fa

  • 언제, 어디서 jellyfish file이 생성되어지는지 알 수 있는 정보를 얻기 위해서, info subcommand를 사용한다.(section 3.4 참고) : " jellyfish info mer_counts.jf "

## Reference * Gudie : http://www.genome.umd.edu/docs/JellyfishUserGuide.pdf * Home : http://www.cbcb.umd.edu/software/jellyfish/

Incoming Links #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20140628_0