Genomic SelectioninPlant Breeding: Methods,Models,and Perspectives

国际玉米小麦改良中心(CIMMYT)José Crossa 2017年发表在《Trends in Plant Science》上的综述。

1. GS/GP在植物育种中的角色

  • 过去的植物育种主要借助分子标记辅助选择法(MAS)来进行表型选择(Phenotype selection, PS)。对于简单性状,使用QTL关联标记具有主效应,但对复杂性状、多环境及不同遗传背景的应用则显得困难。QTL定位的连锁分析主要基于双亲群体,与性状关联的标记效应较低(染色体重组率低)。

  • 研究者又开始专注于非双亲群体和染色体片段的精细定位(高重组率),但针对的是一些重要的经济性状。微效的QTL受环境影响大,但高密度SNP芯片给了标记性状关联准确性的希望。

  • 基因组选择(Genomic selection,GS)或基因组预测(Genomic-enabledprediction,GP)利用了所有的分子标记来进行表型的选择。

  • GS/GP有两个方面应用:一是育种程式中早期世代的加性效应预测(比如双亲杂交的F2代选择),这种方法育种家更关注加性值(Additive values,BVs),而非整个遗传值,因此利用加性线性模型来评估标记效应就够了;另一个应用是预测个体的全部遗传值,同时考虑加性效应和非加性效应(显性和上位性效应)来评价品种的表现。使用多个环境的试验来预测品系的遗传值。

  • G矩阵特点是分子标记远大于群体数目(在机器学习中就是特征大于案例),预测的难度和训练群体大小、性状遗传力、分子标记数目有关。

  • GS流程:TRN训练群体(又称参考群体)需要表型和基因型,TST测试群体(又称候选群体)只需基因型。

  • GS和玉米常规DH育种比较:一年两季

2. GP模型应用

GP准确性受几个遗传因素影响:

  • 训练群的大小和遗传多样性,以及与测试群的亲缘关系;
  • 性状的遗传力。低遗传力和低标记效应的复杂性状对GS是适用的,但高遗传力的复杂性状很少能用高效应的少量标记来预测。
  • 针对不具有LD的大量分子标记控制的复杂性状,GP准确性较低,当遗传力和训练群体大小增加时,准确性上升。

将环境因素考虑进模型,构建多性状、多环境的方差-协方差矩阵与环境、性状及其互作之间的遗传相关性。

GP模型中p>>n(标记远远大于群体)的特点使得鉴定困难,易出现过拟合,可通过惩罚回归、变量选择、降维以及赋予GP模型权重等方法来优化。(作者在文章附件中提供了GS模型复杂度及解决办法,但我没找到

从GBLUP到神经网络,一堆废话描述。

3. GP模型的准确性

RR-BLUP,KinshipGAUSS,BayesCp,BayesB,BaysianLASSO,random forest,regression,RFR等各种模型对于目标性状的预测准确性还算好,也没有太大差异,但把群体结构等因素考虑进去,准确性并没有提升多少。

动物育种中GP的模型一般是基于单一环境,但在植物育种中GxE互作是影响非常大的。

GxE 互作:基因型与环境互作



MxE 互作:分子标记与环境互作

分解标记效应到每一个环境中,环境视为固定效应(不知道理解的是否正确,详细信息只有在附件中查看

机器学习:

一些研究应用机器学习中的分类器,如多层感知机MLP、概率神经网络PNN等来预测个体表现(如分类上、中、下三等),AUC评价指标。

CIMMYT的实践

与传统育种相比,GS目的就是以更低的成本和更少的时间来实现更大的遗传增益,CIMMYT已经在玉米的双亲和多亲群体中进行了GS实施,来快速提升遗传增益。(*具体如何实施需要找更详细的资料**)

4. 植物育种的GS展望

将多性状多环境的GS与高通量表型相结合:

高通量表型平台(High-ThroughputPhenotyping,HTP)减少表型调查的成本,同时与系谱结合起来提升准确性。

种质资源的GS应用:

种质资源骨干材料选择,结合多性状、多环境选择,提高种质资源基因库,以便后续直接使用。

5. 小结

  • 线性模型(如GBLUP)和机器学习算法已经能识别复杂模式,做出正确决策;基于核的方法(如RKHS)已广泛应用于植物基因组预测;在GBLUP基础上结合基因组和系谱的GxE,优化的几种统计模型在预测个体的准确性方面有了提升。
  • 使用HTP如高强度高光谱图像技术,结合早期测试中的基因组和系谱信息,共同用于统计模型,通过增加选择强度来加速遗传增益。
  • 深度学习,如神经网络的方法似乎有望提高基因组预测。基因组选择超过了家系繁育和MAS增强复杂性状的遗传增益,具有明显的优势。
  • 开发基因库登录的GP模型对于未开发的访问以及繁殖计划的多样性将很重要,以加快发展并释放新基因型。

这篇综述有点长,有点啰嗦,本身没提供太多信息,最有价值的部分可能是它的附件。当有需要时,可查看其中引用的相应文献。

最新文章

  1. 用GitHub Pages搭了个静态博客
  2. jQuery File Upload 单页面多实例的实现
  3. js对象、数组转换字符串
  4. 我的Android第三章:Android的组件介绍
  5. 使用js实现移动设备访问跳转到指定目录
  6. 常用按键ASCII码
  7. iOS 除去图片的白色背景(接近白色),或者其它颜色的替换,获取像素点的ARGB值
  8. PHP导出MySQL数据到Excel
  9. [BZOJ 3585] mex 【莫队+分块】
  10. 转 @RenderBody()和@RenderSection()
  11. TextView使用Spannable设置复合文本
  12. crm高速开发之QueryExpression
  13. 【Linux驱动】TQ2440 LED驱动程序
  14. RTB撕开黑盒子 Part 1: Datacratic's RTB Algorithms
  15. python-ansible api2.0 多进程执行不同的playbook
  16. springboot-01 helloworld
  17. input date
  18. Collision (hdu-5114
  19. Curry化函数
  20. 在dos下查看memcache运行状态

热门文章

  1. 实用小工具:screen
  2. AIApe问答机器人Scrum Meeting 4.25
  3. “介绍一下自己吧”——记2020BUAA软工团队介绍和采访
  4. 技术博客——微信小程序的架构与原理
  5. 野指针和free总结超有用的资料
  6. 嵌入式单片机之stm32串口你懂了多少!!
  7. Linux基础入门级命令文档
  8. js 组合继承详解
  9. C# StringBuilder和string
  10. Linux 系统分区方案 详细教程