1、PED简介

PED文件格式是广泛使用的用于连锁系谱数据分析的格式,并用作plink程序的输入。PLINK是一个免费的,开源的全基因组关联分析工集,旨在以高计算效率的方式执行一系列基本的,大规模的分析。PED能够处理二倍体SNP数据。

空格(空格或制表符)分隔的文本文件*.ped
每一行对应一个individual
以下前6列是必须的(id是字母数字):
  o Family ID (Family ID用来表示家族,同一个家族用同一个family ID表示)
  o Individual ID (用来表示个体,family ID和Individual ID连起来必须能够唯一表示每个样本)
  o Paternal ID (表示父本ID,)
  o Maternal ID (母本ID,)
  o Sex (1代表male,2代表female, 其他数字表示unknown。)
  o Phenotype (代表表型,其中表型可以是离散型的(比如关联性状),也可以是连续型的(比如数量性状),plink会自动识别对应的类型。通过以上6个必须的字段,可以完整的映射到某一性状的家系图上。)
关联性状应该这样编码:
  o -9 missing
  o 0 missing
  o 1 unaffected
  o 2 affected
column 7 onwards: Genotypes (对于关联分析而言,除了表型相关信息,还需要基因型信息)
  any character (e.g.: 1,2,3,4 or A,C,G,T or anything else)
  missing genotype: 0
  所有的标记必须是双等位的(二倍体)。要么两个等位基因都缺失,要么两者都不缺失。单倍体数据:编码为二倍体纯合子。两个等位基因依次出现。
Comments: line starts with #

ped文件中,每个snp位点的基因型需要两列来表示,分别表示major allel 和 minor allel。在表示基因型时,既可以使用A,C,G,T字母的形式,也可以采用1,2数字编码的形式。默认情况下,用0来表示基因型的缺失。

2、MAP简介

MAP文件的每一行描述一个 single marker且必须包含4列:

chromosome (1-22, X, Y, MT or 0 if unplaced)   #染色体编号为数字, 未知为0
rs# or snp identifier #SNP名称为字符或数字, 可以从1编号, 注意要和bed文件SNP列一一对应
Genetic distance (morgans) (missing: 0) #遗传距离(摩尔)
SNP物理坐标

MAP必须包含与PED文件中一样多的markers。‘

PED文件中的标记不需要按照基因组顺序排列,但是MAP应该与PED文件maker顺序一致

PGDSpider软件中对于不同的文件格式有一个详细的说明。

http://pngu.mgh.harvard.edu/~purcell/plink/data.shtml#ped

最新文章

  1. 封装一个mysql类(ggshop)
  2. Qt容器类——1. QList类、QLinkedList类和QVector类
  3. JavaScript学习笔记- 正则表达式常用字符集及方法
  4. intellJ实用技巧
  5. Angular4 后台管理系统搭建(1) - 建立一个通用的Wijmo5 flexgrid分页器组件
  6. PDO详解
  7. 自己搭建CA颁发证书做https加密网站
  8. Struts(二十八):自定义拦截器
  9. django——web框架简介
  10. 简单配置jena在eclipse的开发环境
  11. 在云服务器跑Python程序
  12. MySQL索引底层实现原理
  13. 类 __new__方法实现单例
  14. pyspider爬取数据存入es--1.安装驱动
  15. openvpn push "route
  16. MySQL ·InnoDB 文件系统之文件物理结构
  17. C++ 读书笔记1
  18. AngularJS filter:search 是如何匹配的 ng-repeat filter:search ,filter:{$:search},只取repeat的item的value 不含label
  19. 第二天:让我们一起来玩玩css精灵(css sprites)
  20. 快速启动工具Rulers 4.1

热门文章

  1. NOIP 2012 文化之旅
  2. Windows10 下利用Hyper-V安装CentOS系统
  3. Mybatis关联查询之二
  4. 如何将Azure SQL 数据库还原到本地数据库实例中
  5. 10-Django中间件
  6. 【学习笔记】动态规划—各种 DP 优化
  7. 计算机组成原理——cache高速缓存存储器
  8. Redis for OPS 02:消息订阅和事务管理
  9. 关于matlab2014a中生成dll文件,打包成com组件出现的问题和解决方法
  10. Redis系列---redis简介01