注意:本文的内容主要来自于GATK官网的讲解,所以vcf也是GATK产生的,用其他caller,比如varscan2产生的vcf文件的内容注释可能不一致。

参考:https://gatkforums.broadinstitute.org/gatk/discussion/1268/what-is-a-vcf-and-how-should-i-interpret-it

VCF:由HEADER和RECORDS组成。

RECORDS的FORMAT内容详解:

QUAL:指的是caller正确的识别该变异位点的可能性,属于phred-scale quality score的一个应用。

GT,GQ,PL三者的关系:

GT是指该位点最有可能的基因型。

GQ是该位点第二有可能的基因型的PL值。

PL是不同基因型对应的标准化的可能性。

对于二倍体生物来说,PL有三个值,分别对应0/0,0/1,1/1。最有可能的基因型的PL值为0,第二小的是第二个可能。GQ反映的是第二个小的基因型的PL值,如果该值超过99,则定位99,因为超过了99,其几乎不能威胁第一个可能的地位。

计算方法:

PL(0/1) = 0 (the normalized value that corresponds to a likelihood of 1.0) as is always the case for the assigned allele,

but the next PL is PL(1/1) = 26 (which corresponds to 10^(-2.6), or 0.0025).

QUAL和GQ的区别:

GVCF和VCF的最大区别是在于GVCF文件会记录所有的点,包括哪些没有突变的点。

在GVCF模式下,那些没有变异的点会形成一个未变异块,non-var block record。

GVCF的好处:能更方便把一群样本的GVCF联合起来,以便进行下一步分析,提高分析效率。而且GVCF的records还会提供一个

The records in a gVCF include an accurate estimation of how confident we are in the determination that the sites are homozygous-reference or not. This estimation is generated by the HaplotypeCaller's built-in reference model

最新文章

  1. xp IP安全策略 ipseccmd
  2. Django之Form、CSRF、cookie和session
  3. EMLS项目推进思考
  4. hiho一下第91周《Events Arrangement》(前半部分)
  5. MySQL 5.7 参数 – log_timestamps
  6. 【LA 5713 】 Qin Shi Huang's National Road System (MST)
  7. eclipse开发servlet应用,Tomcat无法访问jpg图片 ===第二版===
  8. 蜗牛—JSP学习乘法表页面输出
  9. Iframe 自适应高度
  10. jquery/Js属性无效
  11. Pycharm 出现Unresolved reference '' 错误的解决方法
  12. Semaphore实现的生产者消费者程序
  13. axios写法
  14. linux 显示系统执行的进程
  15. python 生成器 迭代器
  16. 如何决定Web应用的线程池大小
  17. HDU 2298(纯物理加解一元二次方程)
  18. 探究js正则匹配方法:match和exec
  19. React之状态(state)与生命周期
  20. ArcGIS 编程中对接口的理解

热门文章

  1. java web页面跳转 总结
  2. POSTFIX服务简介
  3. Ajax 常用资源
  4. 用linux c求最大公约数
  5. Java实现断点续传
  6. Centos7下实现免密码登录
  7. MFC Spin 控件
  8. 出现 Request Entity Too Large问题的解决方法
  9. vs开发nodejs api文档生成神器-apidoc
  10. 汉字转换为拼音的JavaScript库