近日,浙江大学与阿里巴巴达摩院(湖畔实验室)合作,成功构建了 207 种棉花基因组图谱。这一研究成果已在国际学术期刊《Cell Research》上发表,标志着全球作物基因组研究的重大突破。
本次研究由浙江大学棉花精准育种团队的方磊教授和张天真教授领衔,与中国农科院生物技术所的谷晓峰研究员及阿里巴巴达摩院的顾斐博士团队共同完成。研究利用遗传学、生物大数据和人工智能技术,构建了迄今为止作物中最大的全基因组 DNA 甲基化图谱。
- 规模空前- :研究团队通过全基因组亚硫酸盐测序技术,对 207 个棉花品种进行了深度测序,鉴定出 2.87 亿个单甲基化多态性(SMP)位点,其数量是单核苷酸多态性(SNP)位点的 100 倍。
- 多组学联合分析- :通过多组学数据的联合分析,研究识别出 5,426,782 个顺式甲基化数量性状基因座(cis-meQTL)、5,078 个顺式表达数量性状甲基化(cis-eQTM)以及 9,157 个表达数量性状基因座(eQTL),揭示了表观基因组对复杂性状的贡献。
- AI 加持- :研究团队开发了深度学习模型 DeepFDML,基于 DNA 甲基化位点附近的序列,智能预测影响基因表达的甲基化位点。这一模型显著提升了基因组数据的分析效率和准确性。
棉花是全球最大的天然纺织纤维来源,同时也是研究细胞分化、伸长、细胞壁发育调控和作物多倍体化的重要模式植物。解析棉花复杂农艺性状的遗传和生物过程的分子机制,对棉花的分子育种具有重要意义。
浙江大学方磊教授表示:“这项研究成果证明了 DNA 甲基化数据可作为育种资源,为棉花品种改良提供新的思路。依托生命科学和 AI 技术,育种家们将持续挖掘关键基因、预测农艺性状,加速培育‘超级’作物”