Skip to content

MAFFT #
Find similar titles

Structured data

Category
Software

MAFFT #

개요 #

서열정렬 (sequence alignment)은 단백질 서열이나 핵산 서열 사이의 상관관계를 나타내는 것으로 '서열간의 관계'는 서열들이 기능적으로나 진화적으로 얼마 만큼의 연관성이 있는지, 서열의 어느 부분들이 그러한 연관성을 가지고 있는가를 나타내는 방법으로 사용한다. 많은 생물학자들은 MSA (Multiple Sequence Alignment)를 하기 위하여 ClustalW, Clustal Omega 등을 기반한 프로그램들을 이용한다. 그러나 같은 툴을 이용하더라도 웹 사이트마다 gap open, gap penalty 등의 값이 다르므로 서열 매칭 결과도 조금씩 다를 수 있음을 인지하고 있어야 한다.

MAFFT란? #

Clustal-Omega와 muscleMSA 목적으로 일반적으로 많이 사용하는 프로그램이다. 이 프로그램들은 short length 서열에 적합하며, 긴 서열일 경우에는 alignment를 하지 못한다는 단점이 있다(실제로 Colustal-O를 수행하였을 때, 오랜 시간이 지났음에도 나중에는 job이 멈춰버렸다). 이때, 100K 이상의 길이를 가지고 있다면 UNIX와 같은 운영체제에서 사용 가능한 MAFFT라는 프로그램을 추천한다. 기본적으로 multiple alignment 방법으로 L-INS-i (정확성, 200 sequences 이하의 alingment를 위해), FFT-NS-2 (빠름, 30K sequences 이하의 alignment를 위해) 등을 이용한다.

Download and Installation #

Mac OS X, Linux, Windows 등의 다양한 운영체제를 지원한다.
2017년 3월 기준으로 7.310의 최신 버전을 이용할 수 있다.

사용법 #

  • input : protein or sequence fasta file

기본 사용법

% mafft [arguments] input > output

200 sequences X 2,000 sites까지 alignment (accurate option:L-INS-i)

% mafft-linsi input > output

larger sequence alignment (fasta option:FFT-NS-2)

% mafft input > output

만약 어떤 option을 써야할 지 모르겠다면,

% mafft --auto input > output

Tip #

% mafft --retree 1 --thread 20 input
  • error1 : input file에 alphabet "U"가 있는 경우

    nthread = 20 stacksize: 10240 kb
    Gap Penalty = -1.53, +0.00, +0.00
    ==================================== 
    === Alphabet 'U' is unknown.
    === Please check site 1053825 in sequence 3.
    === To make an alignment having unusual characters (U, @, #, etc), try
    === % mafft --anysymbol input > output
    Illegal character U
    
  • solution1

    % mafft --retree 1 --thread 20 --anysymbol input >& output &
    
  • error2 : /dev/stderr: Not a directory 발생

    /usr/local/bin/mafft: line 732: /dev/stderr: Not a directory       
    /usr/local/bin/mafft: line 1535: /dev/stderr: Not a directory 
    /usr/local/bin/mafft: line 1536: /dev/stderr: Not a directory 
    /usr/local/bin/mafft: line 1537: /dev/stderr: Not a directory 
    /usr/local/bin/mafft: line 1538: /dev/stderr: Not a directory 
    /usr/local/bin/mafft: line 1542: /dev/stderr: Not a directory
    
  • solution2

    % mafft --quiet --anysymbol --retree 1 --thread 20 input >& output &
    

Reference #

MAFFT version 7 HOMEPAGE
MAFFT manual

Suggested Pages #

0.0.1_20140628_0