annovar提供三种注释方式

一,基于基因的注释 给定变异,看变异是否影响编码蛋白的改变
支持基因定义系统:RefSeq genes, UCSC genes, ENSEMBL genes, GENCODE genes, AceView genes, or many other gene definition systems.

二、基于区域的注释 看变异是否在基因组的特定区域

三、基于过滤的注释 看变异是否在特定数据库中,如dbSNP

annotate_variation.pl 主程序
table_annovar.pl 常用注释程序

关键参数

—-buildver    数据库版本, 如hg19
—-protocol refGene, exac03

anno_refgene.sh

#!/bin/bash

name=$1
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/table_annovar.pl $name
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/humandb
-buildver hg19
-otherinfo
-remove
-nastring .
-protocol refGene
-operation g
--outfile ${name}.annovar

13 20797176 21105944 0 - comments: a 342kb deletion encompassing GJB6, associated with hearing loss

annovar_latest.sh

#!/bin/bash

name=huaxi-7.varscan.vcf
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/table_annovar.pl $name
/rawdata/Zhangyu/software/ANNOVAR_latest/annovar/humandb
-buildver hg19
-otherinfo
-remove
-nastring .
-protocol refGene,SAOdbSNP150,cosmic83,gnomad_exome,NovoDb_WES_2573,NovoDb_WGS_568,clinvar_20170905,HGMD,genomicSuperDups,gff3
-operation g,f,f,f,f,f,f,f,r,r 大专栏  【software】变异注释工具:annovaran class="se">
--gff3dbfile hg19_rmsk.gff
--vcfinput
--outfile ${name}.annovar

TJ集群annovar注释

name=$1
/PUBLIC/software/HUMAN/ANNOVAR_2017Jun08/table_annovar.pl ./${name}
/TJNAS01/OBD/Zhangyu/software/annovar_new_db_all_2019.1.8
-buildver hg19
-otherinfo
-remove
-nastring .
-protocol refGene,avsnp150,SAOdbSNP150,1000g2015aug_all,exac03,esp6500siv2_all,gnomad_exome,NovoDb_WES_2573,NovoDb_WGS_568,cosmic83,clinvar_20170905,HGMD,ljb26_pp2hvar,ljb26_pp2hdiv,ljb26_sift,gerp++gt2,caddgt10,genomicSuperDups,gff3
-operation g,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,r,r
--gff3dbfile hg19_rmsk.gff
--outfile ${name}.annovar

TJ集群annovar注释, input为VCF

name=$1
/PUBLIC/software/HUMAN/ANNOVAR_2017Jun08/table_annovar.pl ./${name}.vcf
/TJNAS01/OBD/Zhangyu/software/annovar_new_db_all_2019.1.8
-buildver hg19
-otherinfo
-remove
-nastring .
-protocol refGene,avsnp150,SAOdbSNP150,1000g2015aug_all,exac03,esp6500siv2_all,gnomad_exome,NovoDb_WES_2573,NovoDb_WGS_568,cosmic83,clinvar_20170905,HGMD,ljb26_pp2hvar,ljb26_pp2hdiv,ljb26_sift,gerp++gt2,caddgt10,genomicSuperDups,gff3
-operation g,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,f,r,r
--gff3dbfile hg19_rmsk.gff
--vcfinput
--outfile ${name}.annovar

关于indel的处理

目前没有描述indel的普遍认同的方式。

作为使用者我们应该这样做:(1)分割VCF文件确保每一行只包含一个变异;(2)left-normalize所有的VCF文件; (3)使用ANNOVAR注释

所以使用命令:

bcftools norm -m-both -o ex1.step1.vcf ex1.vcf.gz

bcftools norm -f human_g1k_v37.fasta -o ex1.step2.vcf ex1.step1.vcf

第一个命令分割多allels变异检出为单独的行,第二个命令运行真正的 left-normalization。
(有时候第一个命令可能出现没有变异能被分解,尽管在文件中存在这些变异,这种情况下,你可以使用vt program 代替)

参考:

ANNOVAR进行突变注释

-END-

最新文章

  1. Android学习一:文件操作
  2. hdwiki 编码规范
  3. 计算excel列的名字
  4. 学习Linux第二天
  5. 包管理器Bower使用手册之一
  6. Python进阶之路---1.3python环境搭建
  7. CentOS 7 多网卡绑定
  8. List转DataSet
  9. ReactiveSwift框架
  10. phpcms v9 sql注入脚本
  11. >/dev/null 2>&1
  12. Variant does not reference an auomation object
  13. Bootstrap-常用图标glyphicon
  14. 关于Excel分析图插入到论文的问题
  15. 《FPGA全程进阶---实战演练》第九章 计数器要注意
  16. Python day16 tag式整体退出技巧
  17. Spring Boot 2 实践记录之 使用 Powermock、Mockito 对 UUID 进行 mock 单元测试
  18. oracle逐步学习总结之oracle分页查询(基础三)
  19. mysql数据库中的存储引擎是什么意思呢
  20. HTML格式布局

热门文章

  1. 使用meshgrid生成热图和单位向量场
  2. Tarjan算法:求解无向连通图图的割点(关节点)与桥(割边)
  3. 吴裕雄--天生自然 PYTHON3开发学习:XML 解析
  4. logstash 使用glusterfs网络存储偶发性文件解析异常的问题
  5. std::string和ctime之间的转换
  6. php time()时间戳作为文件名产生文件同名的bug
  7. rsync配置文件
  8. trie(字典树)原理及C++代码实现
  9. iOS分段选择器、旅行App、标度尺、对对碰小游戏、自定义相册等源码
  10. 用logstash 作数据的聚合统计