前段时间有位小可爱问我,为什么她的QQ图特别飘,如果你不理解怎样算飘,请看下图:

理想的QQ图应该是这样的:

我当时的第一反应是:1)群体分层造成的;2)表型分布有问题。因此让她检查一下数据的群体分层情况,如果没有问题就看一下表型分布。

这段时间有空了,我觉得有必要梳理一下这个飘逸的QQ图,到底是怎么回事儿以及如何确定这么飘逸的QQ图有没有问题。

1.产生飘逸的QQ图的原因

产生飘逸的qq图的原因有很多,比如我们喜闻乐见的:基因多效性(polygenicity)。也有可能是混淆偏倚,比如群体分层,假如样本中混合了欧洲、非洲、亚洲等各个地方的群体,本身各个群体的SNP频率差异就很大,如果不加以群体分层控制,关联分析的时候就会产生很多偏离预期值的SNP位点。

很久以前,出现飘逸的QQ图的话,我们可以搭配膨胀系数(膨胀系数的计算)一起看,膨胀系数如果接近1(比如1.01,1.2这种不算接近1),那么也还算过得去。

但,膨胀系数接近1这种是比较理想的情况。实际情况是,很多人的QQ图不仅飘逸,膨胀系数还老高

这就尴尬了,连膨胀系数都无法确定这个QQ图飘的正不正常了。

所以呢,接下来还有什么方法确定我们的基因组数据有没有问题呢?

2.怎么确定是基因多效性还是混淆偏倚呢

接下来我要介绍一款神人工具LDSC (LD SCore),全称是LD Score regression

这款工具就是帮我们实现如何区分飘逸的QQ图正不正常

具体来说,就是通过LDSC工具计算基因组数据的LD回归截距,如果是基因多效性,那么截距会接近1(比如1.004),如果是群体分层等混淆因素引起的,那么LD回归截距就会远离1(比如1.30)。

除了看截距数值,我们还可以通过画LD Score的图来确定数据是否有问题。

2.1基因多效性

如果画出来的LDscore图是下面这种形式,说明GWAS结果是没有问题的,QQ图飘逸就让它飘逸吧。

2.2混淆偏倚

如果画出来的LDscore图是下面这种形式,说明QQ图是有问题的。

3.总结

总之,看截距。

截距很接近1,就不用管QQ图好不好看了。

远离1(1.3这种),说明基因组数据是有问题的,检查一下PCA加够了没有、群体分层有没有控制好、是否混了很多有亲缘关系的样本在里面。

如果你想了解怎么用LDSC计算截距,请见下回解析。

最新文章

  1. html标签快速转换思想方法
  2. WebService 生成类的命令语句
  3. host,nslookup,dig 命令安装
  4. html5+css3
  5. iOS8中用UIVisualEffectView实现高斯模糊视图(毛玻璃效果)
  6. selenium 处理iframe
  7. Java正则表达式测试用例
  8. c# 扩展方法奇思妙用集锦
  9. Kindeditor+web.py+SAE Storage 实现文件上传 - 开源中国社区
  10. oracle触发器中增删改查本表
  11. Unity3D音频播放器 动态装载组件
  12. OO第二单元总结——多线程电梯
  13. TensorFlow资料汇总
  14. C++设计模式——迭代器模式
  15. Data type
  16. 【题解】Luogu P2221 [HAOI2012]高速公路
  17. Spring aop框架使用的jar包
  18. 从高德采集最新的省市区三级坐标和行政区域边界,用js在浏览器中运行
  19. HomeFragment 嵌套关系
  20. 代码管理工具Git的安装及使用

热门文章

  1. Spring源码窥探之:xxxAware接口
  2. python - 栈与队列(只有代码)
  3. LightOJ - 1058 - Parallelogram Counting(数学,计算几何)
  4. [Flutter] Router Navigation
  5. greenplum 下载地址
  6. YAML_18 ansible 判断和循环
  7. learning java 正则表达式
  8. Ubuntu 系统安装教程
  9. python写一个随机点名软件
  10. RNN梯度消失和爆炸的原因 以及 LSTM如何解决梯度消失问题