查询、下载GWAS目录数据的R包(gwasrapidd)
目前GWAS方向发了很多文献,但是并没有一个很完善的R包对这些文献的数据进行汇总。
接下来推荐的这个是最新发表的GWAS数据汇总R包。看了一下功能齐全,但是数据不是收录的很齐全。
下面具体讲一下。
在R上安装
install.packages("remotes")
remotes::install_github("ramiromagno/gwasrapidd")
查询是否有发表关于自身免疫性疾病的文章
library(gwasrapidd)
my_studies <- get_studies(efo_trait = 'autoimmune disease')
查询发表自身免疫性疾病文章的数量
n(my_studies)
获取发表自身免疫性疾病的文章ID
my_studies@studies$study_id
查询发表自身免疫性疾病的文章标题
my_studies@publications$title
查看发表自身免疫性疾病文章在pubmed的界面信息
open_in_pubmed(my_studies@publications$pubmed_id)
获取发表身高文献的SNP关联信息
my_associations <- get_associations(study_id = my_studies@studies$study_id)
查询P值小于1e-6的位点
dplyr::filter(my_associations@associations, pvalue < 1e-6) %>% # Filter by p-value
tidyr::drop_na(pvalue) %>%
dplyr::pull(association_id) -> association_ids # Extract column association_id
提取显著信号位点信息
my_associations2 <- my_associations[association_ids]
显示显著信号位点的个数
n(my_associations2)
显示显著信号位点的RS ID, risk allele, 频率
my_associations2@risk_alleles[c('variant_id', 'risk_allele', 'risk_frequency')] %>%
print(n = Inf)
获取含有rs12752552位点的文献
s2 <- get_studies(variant_id = 'rs12752552')
测试了一下,优点是减去了很多信息检索的工作,缺点是这个包刚开发不久,信息还不够齐全
更多详细信息请看gwasrapidd
参考文献:Magno R, Maia A T. gwasrapidd: an R package to query, download and wrangle GWAS Catalog data[J]. bioRxiv, 2019: 643940.
最新文章
- Ubuntu 16.04 安装mysql并设置远程访问
- php大力力 [055节] 大力力阅读文章集锦
- docker ui
- 动态创建的DOM元素进行事件绑定
- Action类为何要继承ActionSupport
- Python 2.7.9 Demo - ini文件的读、写
- 深入浅出ghostbuster剖析NodeJS与PhantomJS的通讯机制
- Binomial Showdown
- 单片机IO口驱动能力
- AJAX 中Sys.WebForms.PageRequestManager的事件激发顺序 《转》
- HDU 5793 - A Boring Question
- D3DXMatrixMultiply 函数
- [置顶] 浅谈Android的资源编译过程
- EntityFramework6 用 PostgreSQL
- 拒绝回调,拥抱async await
- docker遇到超时
- mysql解决select * from 表名 (where + 约束条件为空)
- vue error:The template root requires exactly one element.
- Django Rest framework 框架之解析器
- mixpanel umeng talkingdata