1. 准备文件:

  • ref.fa
  • ref.gtf或者gff3,最好是gtf3,可将gff3转化为gtf
  • sample.vcf

2. 用gff3ToGenePred与gtfToGenePred工具将gtf或gff3文件转化为reference_refGene.txt (软件来自http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/)

gtfToGenePred.dms -genePredExt  ref.gtf SP_refGene.txt &

gtf:

SpoScf_00032 maker exon 12508 13665 . + . transcript_id "Spo06120"; gene_id "Spo06120";
SpoScf_00032 maker exon 14070 17062 . + . transcript_id "Spo06120"; gene_id "Spo06120";
SpoScf_00032 maker exon 17626 17899 . + . transcript_id "Spo06120"; gene_id "Spo06120";
SpoScf_00032 maker exon 17979 18066 . + . transcript_id "Spo06120"; gene_id "Spo06120";

3. 将ref.fa文件转化为SP_refGeneMrna.fa 

1 perl retrieve_seq_from_fasta.pl --format refGene --seqfile ref.fa SP_refGene.txt Sp_refGeneMrna.fa

4. 再将vcf文件转化为annovar格式

 1 perl convert2annovar.pl -includeinfo -allsample -withfreq -format vcf4 sample.VCF >sample.avinput
2
3
4
5
6 ##
7 --includeinfo: 输出文件含有特定额外的信息
8 --allsample: 多样本的vcf,输出多个样本的结果
9 --withfreq: 输出文件包含频率信息
10 --format: 输入文件格式

5. 用table_annovar.pl进行注释(可一次性完成三种类型的注释, 本次只有基于基因)

1 perl ../table_annovar.pl  test.avinput sp/ --buildver SP --outfile myanno --protocol refGene --operation g
2
3 ##参数
4 sp: 含有SP_refGeneMrna.fa和SP_refGene.txt文件夹
5 --buildver: 基因组建立的版本
6 --outfile: 输出文件前缀
7 --protocol: 逗号分隔的注释流程,代表库的名字
8 --operation: g(gene),r(region),f(filter)

最终得到两个注释文件文件和一个log文件exonic_variant_functionvariant_function

关注下方公众号可获得更多精彩

最新文章

  1. 禁用Win10显卡更新
  2. css布局之两列布局
  3. google快捷键
  4. JS控制文本框textarea输入字数限制
  5. 利用ICSharpCode.SharpZipLib.Zip进行文件压缩
  6. LocalDB 的创建与迁移
  7. Object传入String类型和其他
  8. Android Assert工具类
  9. vs2013 ADO联系SQL server2012数据库
  10. 什么是Servlet,Servlet的作用,生命周期,如何创建、配置Servlet
  11. 08_Android中的SimpleAdapter的使用
  12. Google高级搜索技巧十则
  13. yum和rpm
  14. Cookie、Session和自定义分页
  15. 学习docker——命令总结
  16. 5.cgroup资源控制
  17. C# 之 Structure 和 Class的区别
  18. Lodash JavaScript 实用工具库
  19. linux下安装Oracle时交换空间不足的解决方法
  20. oracle的常用99条语句

热门文章

  1. 【技术博客】Flutter—使用网络请求的页面搭建流程、State生命周期、一些组件的应用
  2. Stack2 攻防世界题目分析
  3. 最容易出错的C语言指针
  4. numpy中的nan和常用方法
  5. TCP/IP参考模型(应用层、传输层、网际层、网络接口层)、五层参考模型(应用层、传输层、网络层、数据链路层、物理层)、OSI与TCP/IP参考模型比较
  6. 到底能不能用 join
  7. minimum-depth-of-binary-tree leetcode C++
  8. ELK 脚本自动化删除索引
  9. Spark记录(二):Spark程序的生命周期
  10. Git基本教程