目前,在NCBI中下载SRA数据主要有三种方式:

  • 利用Aspera工具下载。
  • 利用SRA Toolkit下载。
  • 利用wget命令直接下载

第三种最为方便。其中的关键是得到下载数据的链接,即ftp的地址

进入NCBI网页后,按如下步骤操作:

  • Step1.设置NCBI的分类为:SRA
  • Step2.输入感兴趣的样本号:IRIS_313-11156,点击Search,弹出四条item,说明该样本分四次run上级,我们需要全部下载
  • Step3.点击右上角的Send to
  • Step4.在Choose Destination中选择File
  • Step5.在Format输入栏选择RunInfo
  • Step6.点击Create File,此刻会生成一个名为SraRunInfo.csv的文件,图中标黄的一列即为不同次run数据的ftp地址。

wget -c 50 下载地址

若想批量下载则把下载地址放到一个list里面,然后运行下面的代码:

wget -c 50 -i list.txt

下面这个网址里面也有一些内容可供参考:

https://www.jianshu.com/p/0694fcb77157

https://www.cnblogs.com/zdwu/p/8473986.html

下载好的数据是sra压缩格式,这个格式是ncbi特有的一种格式,需要将此格式的文件转换成fastq文件的格式

sra是NCBI 推出的存储高通量数据的格式,而平常我们工作用得多是fastq格式。如果需要把sra 转成fastq,从
http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?cmd=show&f=software&m=software&s=software
下载相应的软件。
或者下载最新的source code,在服务器上用make 编译。
然后使用如下命令行:
sra_sdk-2.0.0rc1/linux/rel/gcc/x86_64/bin/fastq-dump -A SRR034580 -D SRR034580.sra
这样就可以很简单的把sra格式转成fastq格式了。

转换 .sra 文件成  .fastq/fasta 文件

#single-end 单端测序

.../fastq-dump  DRR000003.sra               # 结果生成DRR000003.fastq

.../fastq-dump  --fasta  DRR000003.sra   # 结果生成DRR000003.fastq

#pair-end  双端测序

.../fastq-dump --split-3  DRR002018.sra    #  结果生成   DRR002018_1.fastq,DRR002018_2.fastq

REF:
http://blog.sina.com.cn/s/blog_4055a5940100o1mg.html
http://hi.baidu.com/wuyu466/item/152006eb4363eac3baf37d29
http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software
http://blog.sina.com.cn/s/blog_70b2b6020100liee.html

最新文章

  1. Delphi_02_Delphi程序的结构
  2. string的实现
  3. .NET设计规范————命名规范
  4. Rhino Mock
  5. Jquery validate插件使用方法详解
  6. C#winform中TrackBar的使用
  7. mr的logs的查看
  8. 解决"the currently displayed page contains invalid values"
  9. HTML标签CSS属性默认值汇总
  10. bzoj1061 志愿者招募
  11. 打印Fibonacci数列方法汇总(前20项,每行5个)
  12. C# 读写文本文件乱码解决方案
  13. spring data jpa开启批量插入、批量更新
  14. 堆(heap)与栈(stack)
  15. 无备份mysql删除表后恢复
  16. dubbo+zookeeper+spring实例
  17. Mysql依赖库Boost的源码安装,linux下boost库的安装
  18. display:inline-block与float
  19. Sql动态查询拼接字符串的优化
  20. MySQL -- 全文检索(自然语言全文检索)

热门文章

  1. 1,docker遇到的问题1
  2. 【笔记】archlinux缺少部分常用工具
  3. 【git】3.3 git分支-分支管理
  4. JS字符串拼接的方法及性能比较
  5. R语言广义线性模型(GLM)、全子集回归模型选择、检验分析全国风向气候数据|附代码数据
  6. PyTables 教程(三) 执行撤消/重做功能,使用枚举类型,表中的嵌套结构
  7. 从FGUI中取一张图片并返回一个Sprite
  8. centos7升级内核 ,wireguard优化
  9. Java lombok包中的常用注解,便捷化开发POJO类
  10. 打包exe