• 简介

最经典和广为熟知的多序列比对软件是 clustalw 。 但是现有的多序列比对软件较多,有文献报道:比对速度(Muscle>MAFFT>ClustalW>T-Coffee),比对准确性(MAFFT>Muscle>T-Coffee>ClustalW)。因此,推荐使用 MAFFT 软件进行多序列比对。

  • 安装

 1 $ wget http://mafft.cbrc.jp/alignment/software/mafft-7.158-without-extensions-src.tgz
2 $ tar zxf mafft-7.158-without-extensions-src.tgz
3 $ cd mafft-7.158-without-extensions/core
4 $ perl -p -i -e 's#PREFIX =.*#PREFIX = /opt/biosoft/mafft#' Makefile
5 $ perl -p -i -e 's#BINDIR =.*#BINDIR = /opt/biosoft/mafft/bin/#' Makefile
6 $ make
7 $ make install
8 $ echo 'PATH=$PATH:/opt/biosoft/mafft/bin/' >> ~/.bashrc
9 $ source ~/.bashrc
10
11 检测软件是否正确安装
12 $ cd ../test
13 $ rehash # if necessary
14 $ mafft sample > test.fftns2 # FFT-NS-2
15 $ mafft --maxiterate 100 sample > test.fftnsi # FFT-NS-i
16 $ mafft --globalpair sample > test.gins1 # G-INS-1
17 $ mafft --globalpair --maxiterate 100 sample > test.ginsi # G-INS-i
18 $ mafft --localpair sample > test.lins1 # L-INS-1
19 $ mafft --localpair --maxiterate 100 sample > test.linsi # L-INS-i
20 $ diff test.fftns2 sample.fftns2
21 $ diff test.fftnsi sample.fftnsi
22 $ diff test.gins1 sample.gins1
23 $ diff test.ginsi sample.ginsi
24 $ diff test.lins1 sample.lins1
25 若 diff 的结果不换回异常,则正确安装。
  • 使用

输入文件为fasta 的aa/nt

1 较为精确方法

(1)最准确的方法。适合于 <200 条序列,且序列长度 <~2000 aa/nt 的比对

1 mafft --maxiterate 1000 --localpair ex1.txt >ex1.mfa

ex1.txt 输入文件, ex1.mfa 输出文件

(2)适合于序列长度相似的多序列比对。序列条数 <200, 序列长度 <~2000 aa/nt

1 mafft --maxiterate 1000 --globalpair --clustalout ex2.txt >ext2.clw

--clustalout 输出文件格式为clusw,否则为fasta

(3)  适合序列中包含较大的非匹配区域。序列条数 <200, 序列长度 <~2000 aa/nt

1 mafft --maxiterate 1000 --ep 0 --genafpair ex1.txt >ex1.mfa

2 节约速度的方法

(1)减少迭代次数,最大迭代次数减为 2

1 mafft --retree 2 --maxiterate 2 ex1.txt >ex1.mfa

(2)最大迭代次数减为 0

1 mafft --retree 2 --maxiterate 0 ex1.txt >ex1.mfa

(3)此方法非常快速,适合 >2000 条序列的多序列比对。

1 mafft --retree 1 --maxiterate 0 ex1.txt >ex1.mfa

(4)迭代过程中不进行 FFT aproximation

1 mafft --retree 2 --maxiterate 2 --nofft ex1.txt >ex1.mfa

1 mafft --retree 2 --maxiterate 0 --nofft ex1.txt >ex1.mfa

(5)3 个参数都设置为最不消耗时间的类型,适合于 ~10,000 到 ~50,000 条序列的比对

1 mafft --retree 1 --maxiterate 0 --nofft --parttree ex1.txt >ex1.mfa

关注下方公众号可获得更多精彩

参考

陈连福的生信博客

最新文章

  1. jQuery2.0.3源码分析系列之(29) 窗口尺寸
  2. JSTL跳出&lt;c:forEach&gt;循环
  3. 【leetcode】Validate Binary Search Tree(middle)
  4. EAS使用中FineUI的配置
  5. Objective-C代码的文件扩展名
  6. python模块基础之OS模块
  7. Python3简单的输入输出及内置函数查看
  8. Java虚拟机16:Metaspace
  9. android EventBus详解(一)
  10. jenkins log文件突然占满磁盘空间
  11. 【linux】Linux系统SELinux简介
  12. 20165234 《Java程序设计》第八周学习总结
  13. Django-- KindEditor 富文本编辑器使用
  14. OWASP安全编码规范快速参考指南
  15. 基础练习 回形取数 (循环 + Java 输入输出外挂)
  16. 破产姐妹第六季/全集2 Broke Girls迅雷下载
  17. 聊聊Java中的拆箱和装箱操作
  18. Linux系统部署Web项目
  19. Centos7 vnc
  20. maven向本地库添加jar包

热门文章

  1. Sequence Model-week3编程题2-Trigger Word Detection
  2. Beta阶段第七次会议
  3. 大闸蟹的项目分析——CSDN APP
  4. [火星补锅] 非确定性有穷状态决策自动机练习题Vol.3 T3 &amp;&amp; luogu P4211 [LNOI2014]LCA 题解
  5. C/C++编程笔记:浪漫流星雨表白装b程序
  6. java中的泛型设计
  7. 从0到1使用Kubernetes系列(六):数据持久化实战
  8. Redis核心原理与实践--事务实践与源码分析
  9. Beyond compare 4.2.3 激活和秘钥
  10. 大一C语言学习笔记(5)---函数篇-定义函数需要了解注意的地方;定义函数的易错点;详细说明函数的每个组合部分的功能及注意事项