【只要有ENA千万别用NCBI】拆分SRA文件,通过SRAtoolkits
2024-08-25 02:13:22
只要有ENA千万别用NCBI!!!!
最近开始分析网上Download的数据,一开始用人家现成的GWAS数据,后来觉得反正自己的数据到手该做的也是要做的,出来混早晚是要还的,所以就开始从头分析一些SRA的数据,我以为会很简单,事实证明是我简单了。
首先我们下了这样的一串数据,*.sra格式:
-rwxrwxrwx genomics genomics 6月 : SRR1206512.sra
-rwxrwxrwx genomics genomics 6月 : SRR1206514.sra
-rwxrwxrwx genomics genomics 6月 : SRR1206516.sra
-rwxrwxrwx genomics genomics 6月 : SRR1206517.sra
-rwxrwxrwx genomics genomics 6月 : SRR1206518.sra
-rwxrwxrwx genomics genomics 6月 : SRR1206519.sra
这些数据需要把他们变成fastq格式我们才好下手,这些数据是双端有150,也有200bp的重测序,也就是说这里的数据是被称为paired-end的格式,我们在解包的时候就需要注意,一个不小心就把fastq的head弄得乱七八糟没法往下进行。
sratoolkit
在NCBI里下这个工具集,这里的工具都是分开的,也就是用哪个把路径复制到哪就可以了,而且需要make一下,安装完我们就可以用这个来进行SRA的解包工作了。
代码如下:
这里要注意使用--split-3 这个参数,只有用这个才能正确解开双端测序的包。
/home/genomics/sratoolkit.2.9.--ubuntu64/bin/fastq-dump.2.9. --split- <prefix>.sra
最新文章
- ssl + nginx + tomcat 部署方案
- Storm集群的安装配置
- WPF中资源引用方式汇总
- android关于uses-permission权限列表
- 去除list集合中重复项的几种方法
- JSP ajax跨域问题 怎么处理 原因:CORS 头缺少 &#39;Access-Control-Allow-Origin&#39;)。 ajax http 415
- Ugly Number II 解答
- 10-UIKit(UIDatePicker、UIPickerView、UIWebView、Storyboard)
- Android 定义自己的学习(5)它们的定义Progressbar
- Java类的加载及实例的创建
- nodeJs配置
- python学习第40天
- EF 数据版本号,处理具体使用方法 RowVersion / Timestamp 使用方法。进行自动处理并发修改
- JDK1.7安装和配置及注意事项
- AOP,过滤器,监听器,拦截器【转载】
- .NET 常用ORM之iBatis
- cmd使用管理员权限运行,启动路径不是当前目录
- Html - Table 表头固定和 tbody 设置 height 在IE不起作用的解决
- [转载]AngularJS视图
- 入门常用SQL及官方文档的使用