A. 國家水稻全產業鏈大數據平台網站與國家水稻數據中心是一個網站嗎
國家水稻全產業鏈大數據平台網站和國家水稻數據中心雖然都與水稻相關,但它們是兩個不同的網站。1、國家水稻全產業鏈大數據平台網站是由中國水稻研究所牽頭建設的,它是國內首個專注於水稻全產業鏈的大數據應用服務平台。2、國家水稻數據中心則是中國水稻研究所主辦的一個資料庫平台,主要以水稻為主題,旨在連接育種需求和生物數據。這兩個平台在本質上是不同的。
B. 商業化育種有哪些大數據
互聯網加數據平台。為了提升種子研發效率,北大荒墾豐種業構建了智慧育種解決方案,建造了商業化育種,商業化育種有互聯網加大數據平台。育種指的是通過創造遺傳變異、改良遺傳特性,以培育優良動植物新品種的技術。
C. 植物全基因組選擇(GS)研究進展
全基因組選擇(GS)技術在植物育種領域展現出革命性的潛力,徐揚老師的綜述為讀者提供了深入理解GS技術的窗口。GS技術通過構建基於訓練群體全基因組上的分子標記基因型與表型之間的關聯統計模型,對表型未知的育種群體進行預測和選擇,從而實現高效育種。
與分子標記輔助選擇育種相比,GS技術無需確定與目標性狀顯著相關的特定位點,能夠捕獲全部遺傳效應,包括由微效多基因控制的數量性狀,大大縮短了育種周期,提高了育種效率。GS技術已在動物育種,尤其是奶牛育種中取得顯著成功。隨著高通量測序技術的發展和成本的降低,GS技術在植物育種中的應用變得可能,尤其是在雜種育種中,通過推斷親本基因型來預測雜交種的基因型。
國際國內已開展多種植物的全基因組選擇方法與應用研究。跨國企業如科迪華和拜耳等在玉米育種中應用GS技術,提高了選育效率,並配套了高通量和無損傷的單粒種子基因型鑒定技術設備。CIMMYT在全球玉米育種計劃中實施全基因組選擇技術,並設計了多親本群體快速輪回基因組選擇策略,以保持遺傳多樣性並在短時間內獲得高遺傳增益。此外,科研人員還提出了整合全基因組選擇與雙單倍體育種技術的方法,以及利用已知表型的雜交種作為訓練群體跨群預測未知雜交種表型的水稻育種策略。
然而,全基因組選擇的成功在很大程度上依賴於預測准確性的提高,這受到多種因素的影響,如群體大小、標記密度、親緣關系、目標性狀遺傳力以及標記和QTL間連鎖不平衡。研究顯示,隨著訓練群體和標記密度的增加,預測准確性提升,但達到一定水平後提升難度增大。通過統計方法篩選訓練群體和分子標記,可以提高預測准確性並降低成本。訓練群體與測試群體的親緣關系也對預測准確性有重要影響,遺傳上相似的群體通常能獲得更高的預測准確性。
在玉米雙親雜交群體中,增加來自雙親的半同胞家系材料可以提高預測准確性。然而,過度利用親緣關系可能導致遺傳變異受限,從而影響遺傳增益。此外,標記和QTL之間的連鎖不平衡程度也影響預測准確性,隨著世代的增加,連鎖不平衡逐漸降低,導致在基因型測定後的前兩個世代預測准確性下降較快,但其他世代下降速度相對減慢。遺傳力較高的性狀預測准確性下降較慢。
統計模型是影響預測准確性的關鍵因素之一。為了解決「大P, 小n」問題,即標記數目遠大於樣本量導致的多重共線性和過度參數化問題,已發展出多種基因組預測模型,如基因組最佳線性無偏估計(GBLUP)、貝葉斯方法、支持向量機、再生核希爾伯特空間(RKHS)、隨機森林、深度學習等。GBLUP從整體上分析樣本間的遺傳關系,將所有位點賦予相同的遺傳方差,具有較強的穩健性和對微效多基因控制的數量性狀分析優勢。貝葉斯方法,如BayesA、BayesB和Bayesian LASSO等,對大部分位點的效應進行壓縮,擅長捕獲基因組上的顯著效應。各種貝葉斯方法通過選擇不同的先驗分布,產生不同的壓縮程度。
隨機森林和RKHS方法更擅長捕獲非加性效應,RKHS通過高斯核函數擬合模型,模型可通過貝葉斯框架下的抽樣方法求解,也可根據混合線性模型求解。支持向量機是一種典型的非參數方法,關鍵在於核函數的選擇,需要反映訓練樣本的分布特性。深度學習則包含多個隱藏層的多層感知器,能夠捕捉數據中蘊含的復雜非線性關系,近年來在作物多環境、多組學預測研究中取得了一定成效。
提升全基因組預測准確性的主要策略包括將功能標記納入GS模型,構建基因型與環境互作GS模型,開展多性狀聯合預測,以及整合多組學信息。通過這些策略,研究人員可以提高對復雜性狀的預測力,更好地適應作物育種的挑戰。
然而,我國在GS育種發展方面仍面臨基因分型成本高、前沿模型原創性不足、表型精準鑒定技術不完善、種業資源分散和數據管理規范不足等挑戰。未來,開發全基因選擇育種專用晶元、強化信息技術交叉集成、制定多維度數據採集和管理標准、建立通用育種大數據平台,將為作物育種的精準化、高效化和規模化發展提供強大支持。