转载 :http://blog.sina.com.cn/s/blog_83f77c940102xuro.html

Kalatskaya I, Trinh Q M, Spears M, et al. ISOWN: accurate somatic mutation identification in the absence of normal tissue controls[J]. Genome Medicine, 2017, 9(1):59.
 
变异检测可以分为三类:
single nucleotide variant (SNV), insertion and deletion (indel), and structural variant (SV, including copy number variation, duplication, translocation, etc.)典型的SNV和小的indel一般小等于10bp
 
比对:
Illumina(BWA)、TMAP (for Ion Torrent reads) for DNA reads
splice-aware aligners such as TopHat and STAR for RNA sequencing
 
关于在比对之前是否要做数据质控的问题,在这里做数据质控也只是去掉接头序列。因为很多变异检测的软件都是基于位点的检测策略,所以整条reads的质量情况不是那么重要,另外局部重比对也就是BQSR (base quality score recalibration)。基于PCR扩增的数据不需要在数据比对后去除PCR冗余。
 
tumor-normal变异检测模式
 
基于启发式算法的编译检测算法有VarScan2, qSNP, Shimmer, RADIA, SOAPsnv, and VarDict
加入genotype analysis的分析软件有SomaticSniper, FaSD- somatic, SAMtools, JointSNVMix2, Virmid, SNVSniffer, Seurat, and CaVEMan,这些软件一般使用在低覆盖的数据分析中(WGS, WES, or targeted sequencing with low depth),但是对低频突变不敏感
基于Haplotype-based strategy检测策略不需要局部重比对,因为该变异检测方法是基于reads组装后的结果进行编译检测的,这样的软件有Platypus, HapMuC, LocHap, FreeBayes, and MuTect2 。
基于机器学习方法的软件MutationSeq, SomaticSeq, SNooPer, and BAYSIC
 
如果是高测序覆盖深度的低频突变建议使用Strelka, MuTect, LoFreq, EBCall, deepSNV, LoLoPicker, and MuSE,启发式算法的软件对于发现低频突变也有较好的效果(1% variant calling with VarDict) and (< 5% variant calling with VarScan2)
 
Single-sample 变异检测模式
 
SNVMix2, Shearwater, SPLINTER, SNVer, OutLyzer, and Pisces这些软件都可以进行单样本变异检测但是不能区分somatic and germline
ISOWN, SomVarIUS, and SiNVICT可以提供单样本的变异检测但是同时也可同时区分somatic and germline,ISOWN软件是依赖于MuTect2,随后依赖somatic (COSMIC) and germline mutations (ExAC and dbSNP)来做进一步区分,OutLyzer, Pisces, ISOWN, SomVarIUS, SiNVICT已经被应用到靶向测序的应用
 
UMI-based variant calling
一般低频突变定义为((VAF ≤5%) )目标就是排出测序错误Illumina(0.01–0.1 ),目前给予UMI分析的软件有三款: DeepSNVMiner, MAGERI, and smCounter
其中 DeepSNVMiner, MAGERI, and smCounter输入都是原始数据而只有smCounter的输入是BAM格式,基于PGM平台已经有了一个处理UMI的插件TVC。此外还有一个开源的软件Fgbio。Illumina建议DNA输入量30ng 测序层数40000X 中值覆盖度可达到~2500X 敏感性变异检测为:0.4%
 
RNA-seq variant calling
 
基于RNA数据变异检测的软件有RADIA, Seurat, VarDict, VarScan2, SNPiR, and eSNVdetect,但是RADIA and Seurat 需要整合RADIA and Seurat 的DNA数据
 
2014年Genome in a Bottle Consortium简称(GIAB)通过整合多种测序科技和比对分析软件公布了NA12878 cell line 细胞系高质量可信的变异检测结果
Zook J M, Chapman B, Wang J, et al. Integrating human sequence data sets provides a resource of benchmark SNP and indel genotype calls[J]. Nature Biotechnology, 2014, 32(3):246-51.

最新文章

  1. django 强制登录最佳实践
  2. Exchange超级实用命令行
  3. 微博RPC框架motan入门笔记
  4. Java Web2
  5. Some About Spring
  6. Linux -RAID
  7. Ext.Loader
  8. ARM Cortex-M instructions
  9. linux下修改IP信息
  10. Java I/O学习(一)
  11. LIS(最长的序列)和LCS(最长公共子)总结
  12. 谁占用了我的Buffer Pool
  13. javascript模拟鼠标双击事件
  14. 手把手 学习Git
  15. RA layer request failed
  16. 【最小生成树】UVA1494Qin Shi Huang&#39;s National Road System秦始皇修路
  17. Git的基本使用方法和安装&amp;心得体会(使用git命令行)
  18. 【 Linux 】单台服务器上并发TCP连接数(转)
  19. c# 加密工具类
  20. scrapy 为每个pipeline配置spider

热门文章

  1. Docker 0x05: Dockerfile制作镜像
  2. layui 自定义字体图标 扩展
  3. Linux下关于Qt无法调用fcitx的中文输入
  4. cobbler部署错误总结
  5. Solr的集群搭建(索引库)
  6. 项目Beta冲刺(3/7)(追光的人)(2019.5.25)
  7. “为了交项目干杯”对“那周余嘉熊掌将得队”、“男上加男,强人所男”的Beta产品测试报告
  8. Intellij IDEA运行报Command line is too long解法
  9. 让iOS 开发更便捷-JSONConverter
  10. linux学习13 Linux运维常用文件管理命令及系统变量基础