samtools faidx 能够对fasta 序列建立一个后缀为.fai 的文件,根据这个.fai 文件和原始的fastsa文件, 能够快速的提取任意区域的序列

用法:

samtools faidx input.fa

该命令对输入的fasta序列有一定要求:对于每条序列,除了最后一行外, 其他行的长度必须相同,

>one
ATGCATGCATGCATGCATGCATGCATGCAT
GCATGCATGCATGCATGCATGCATGCATGC
ATGCAT
>two another chromosome
ATGCATGCATGCAT
GCATGCATGCATGC

最后生成的.fai文件如下, 共5列,\t分隔;

one 66 5 30 31
two 28 98 14 15

第一列 NAME : 序列的名称,只保留“>”后,第一个空白之前的内容;

第二列 LENGTH: 序列的长度, 单位为bp;

第三列 OFFSET : 第一个碱基的偏移量, 从0开始计数,换行符也统计进行;

第四列 LINEBASES : 除了最后一行外, 其他代表序列的行的碱基数, 单位为bp;

第五列 LINEWIDTH : 行宽, 除了最后一行外, 其他代表序列的行的长度, 包括换行符, 在windows系统中换行符为\r\n, 要在序列长度的基础上加2;

提取序列:

samtools faidx input.fa chr1 > chr1.fa

samtools faidx input.fa chr1:100-200 > chr1.fa

PS:

引用:http://www.cnblogs.com/xudongliang/p/5200655.html

bwa  index   产生的是:

/*/Public_dir/Database/Human/Hg19_ref/bwaIndex/下的hg19.fasta.amb、hg19.fasta.ann、hg19.fasta.bwt、hg19.fasta.pac、hg19.fasta.sa四个文件.作用是为后续比对做准备。

 

最新文章

  1. 实现从Oracle增量同步数据到GreenPlum
  2. (转)学习使用Jmeter做压力测试(三)--数据库测试
  3. Ruff is in the house
  4. javascript 利用匿名函数对象给你异步回调方法传参数
  5. install 命令用法详解
  6. linux 下 jdk tar.gz 包安装方法
  7. 转 DevExpress-ASPxPageControl 动态添加 TabPage 内容
  8. SharePoint 2010 产品六大功能模块
  9. MySQL中的insert ignore into, replace into等的一些用法小结(转)
  10. Linux笔记(五) - 用户管理命令
  11. gcc编译
  12. 【Socket编程】通过Socket实现UDP编程
  13. Play中JSON序列化
  14. mysql游标错误
  15. ubuntu禁用n卡驱动(进系统卡死)
  16. min cost max flow算法示例
  17. POJ.1986 Distance Queries ( LCA 倍增 )
  18. table--边框样式设置
  19. python 使用getopt 获取配置参数
  20. 每天一个linux命令(文件操作):【转载】find 命令概览

热门文章

  1. HDU 2544最短路 【dijkstra 链式前向星+优先队列优化】
  2. ESlint
  3. JDK8 Stream操作整理
  4. 实验吧MD5之守株待兔解题思路
  5. VMVare的窗口自适应
  6. 面向对象:MATLAB的自定义类 [MATLAB]
  7. FB面经 Prepare: LCA of Deepest Nodes in Binary Tree
  8. HTML表单简单练习
  9. PHP提交失败保留填写后的信息
  10. cshtml razor