NextPolish由未来组开发对基因组序列进行polish的工具,对三代以及二代均可进行polish。

gituhp地址:https://github.com/Nextomics/NextPolish

基因组进行de novo组装后,得到contig,必须使用三代(尤其是没有consensus,比如minimap2+miniasm),二代进行纠错。NextPolish是一个非常不错的选择,同时支持三代,二代,hifi进行纠错。

1 安装

本次安装的最新版本为v1.3.1, 下载后

tar -vxzf NextPolish.tgz && cd NextPolish && make

2 配置文件

[General]
job_type = local ## local, sge, pbs... (default: sge)
job_prefix = nextPolish # 输入名
task = best # 有【all, default, best,1,2,5,12,1212..】1,2 针对二代reads,5 针对长reads,默认为best即可
rewrite = no # 以后文件是否覆盖结构;默认 no
rerun = 3 # 未完成jobs进行再次运行;默认 3
parallel_jobs = 2 # 并行的任务;默认6
multithread_jobs = 3 # 每一个任务线程; 默认 5
genome = ./raw.genome.fasta # 基因组文件
genome_size = auto # 自动即可
workdir = ./01_rundir # 输入文件
polish_options = -p {multithread_jobs} # 进行polish的进行数量 [sgs_option] ## 短reads参数设置
sgs_fofn = ./sgs.fofn # 含有二代reads路径的文本,每行一个文件
sgs_options = -max_depth 100 -bwa # 默认用bwa进行比对,还可以选择minimap2 [lgs_option] # 长reads 参数设置(如果仅用二代,这个可以删除)
lgs_fofn = ./lgs.fofn # 含有长reads的文本文件
lgs_options = -min_read_len 5k -max_depth 100
lgs_minimap2_options = -x map-ont ## pacbio为map-pb, ont为map-ont

3 运行示例文件

nextPolish test_data/run.cfg

结果为/NextPolish/test_data/01_rundir/genome.nextpolish.fasta

序列小写字母表示低质量碱基,一般由于杂合导致

欢迎扫码交流

参考

最新文章

  1. C#经典机试题(猫叫)
  2. html5 调用摄像头
  3. decode 横竖转换 2
  4. js判断用户的浏览器设备是移动端还是pc端
  5. Linker scripts之Intro
  6. 【CSS3】---块状元素、内联元素(又叫行内元素)和内联块状元素
  7. UVALive 7278 Game of Cards (sg函数)
  8. RHCA442学习笔记-Unit10内存地址及分配
  9. 转:基于HTTP协议的轻量级开源简单队列服务:HTTPSQS
  10. eclipse修改豆沙绿
  11. [Python]Codecombat攻略之远边的森林Forest(1-40关)
  12. cookie session区别
  13. ARC068E - Snuke Line
  14. Django rest framework 源码分析 (1)----认证
  15. 控制反转IOC
  16. Java中的instanceof和isInstance基础讲解
  17. java — 静态绑定和动态绑定
  18. Linux基础命令---忽略挂起信号nohup
  19. bzoj 3122 随机数生成器 - BSGS
  20. Enum,Int,String的互相转换 枚举转换

热门文章

  1. 冲刺noip2021模拟16
  2. Linux多线程实例解析
  3. Java:final,finally 和 finalize 的区别
  4. (继承)Program2.1
  5. hdu 2189 来生一起走(DP)
  6. Swift进阶-内存管理
  7. node 中第三方模块的加载过程原理
  8. js 事件流和事件冒泡阻止
  9. 菜鸡的Java笔记 日期操作类
  10. 【linux系统】java环境搭建