当前位置:首页 » 网络资讯 » 大数据平台怎样选种育种

大数据平台怎样选种育种

发布时间: 2024-12-27 09:55:58

A. 国家水稻全产业链大数据平台网站与国家水稻数据中心是一个网站吗

国家水稻全产业链大数据平台网站和国家水稻数据中心虽然都与水稻相关,但它们是两个不同的网站。1、国家水稻全产业链大数据平台网站是由中国水稻研究所牵头建设的,它是国内首个专注于水稻全产业链的大数据应用服务平台。2、国家水稻数据中心则是中国水稻研究所主办的一个数据库平台,主要以水稻为主题,旨在连接育种需求和生物数据。这两个平台在本质上是不同的。

B. 商业化育种有哪些大数据

互联网加数据平台。为了提升种子研发效率,北大荒垦丰种业构建了智慧育种解决方案,建造了商业化育种,商业化育种有互联网加大数据平台。育种指的是通过创造遗传变异、改良遗传特性,以培育优良动植物新品种的技术。

C. 植物全基因组选择(GS)研究进展

全基因组选择(GS)技术在植物育种领域展现出革命性的潜力,徐扬老师的综述为读者提供了深入理解GS技术的窗口。GS技术通过构建基于训练群体全基因组上的分子标记基因型与表型之间的关联统计模型,对表型未知的育种群体进行预测和选择,从而实现高效育种。

与分子标记辅助选择育种相比,GS技术无需确定与目标性状显着相关的特定位点,能够捕获全部遗传效应,包括由微效多基因控制的数量性状,大大缩短了育种周期,提高了育种效率。GS技术已在动物育种,尤其是奶牛育种中取得显着成功。随着高通量测序技术的发展和成本的降低,GS技术在植物育种中的应用变得可能,尤其是在杂种育种中,通过推断亲本基因型来预测杂交种的基因型。

国际国内已开展多种植物的全基因组选择方法与应用研究。跨国企业如科迪华和拜耳等在玉米育种中应用GS技术,提高了选育效率,并配套了高通量和无损伤的单粒种子基因型鉴定技术设备。CIMMYT在全球玉米育种计划中实施全基因组选择技术,并设计了多亲本群体快速轮回基因组选择策略,以保持遗传多样性并在短时间内获得高遗传增益。此外,科研人员还提出了整合全基因组选择与双单倍体育种技术的方法,以及利用已知表型的杂交种作为训练群体跨群预测未知杂交种表型的水稻育种策略。

然而,全基因组选择的成功在很大程度上依赖于预测准确性的提高,这受到多种因素的影响,如群体大小、标记密度、亲缘关系、目标性状遗传力以及标记和QTL间连锁不平衡。研究显示,随着训练群体和标记密度的增加,预测准确性提升,但达到一定水平后提升难度增大。通过统计方法筛选训练群体和分子标记,可以提高预测准确性并降低成本。训练群体与测试群体的亲缘关系也对预测准确性有重要影响,遗传上相似的群体通常能获得更高的预测准确性。

在玉米双亲杂交群体中,增加来自双亲的半同胞家系材料可以提高预测准确性。然而,过度利用亲缘关系可能导致遗传变异受限,从而影响遗传增益。此外,标记和QTL之间的连锁不平衡程度也影响预测准确性,随着世代的增加,连锁不平衡逐渐降低,导致在基因型测定后的前两个世代预测准确性下降较快,但其他世代下降速度相对减慢。遗传力较高的性状预测准确性下降较慢。

统计模型是影响预测准确性的关键因素之一。为了解决“大P, 小n”问题,即标记数目远大于样本量导致的多重共线性和过度参数化问题,已发展出多种基因组预测模型,如基因组最佳线性无偏估计(GBLUP)、贝叶斯方法、支持向量机、再生核希尔伯特空间(RKHS)、随机森林、深度学习等。GBLUP从整体上分析样本间的遗传关系,将所有位点赋予相同的遗传方差,具有较强的稳健性和对微效多基因控制的数量性状分析优势。贝叶斯方法,如BayesA、BayesB和Bayesian LASSO等,对大部分位点的效应进行压缩,擅长捕获基因组上的显着效应。各种贝叶斯方法通过选择不同的先验分布,产生不同的压缩程度。

随机森林和RKHS方法更擅长捕获非加性效应,RKHS通过高斯核函数拟合模型,模型可通过贝叶斯框架下的抽样方法求解,也可根据混合线性模型求解。支持向量机是一种典型的非参数方法,关键在于核函数的选择,需要反映训练样本的分布特性。深度学习则包含多个隐藏层的多层感知器,能够捕捉数据中蕴含的复杂非线性关系,近年来在作物多环境、多组学预测研究中取得了一定成效。

提升全基因组预测准确性的主要策略包括将功能标记纳入GS模型,构建基因型与环境互作GS模型,开展多性状联合预测,以及整合多组学信息。通过这些策略,研究人员可以提高对复杂性状的预测力,更好地适应作物育种的挑战。

然而,我国在GS育种发展方面仍面临基因分型成本高、前沿模型原创性不足、表型精准鉴定技术不完善、种业资源分散和数据管理规范不足等挑战。未来,开发全基因选择育种专用芯片、强化信息技术交叉集成、制定多维度数据采集和管理标准、建立通用育种大数据平台,将为作物育种的精准化、高效化和规模化发展提供强大支持。