农业科学学报 JIA分享 http://blog.sciencenet.cn/u/wangning01 Journal of Integrative Agriculture (JIA)

博文

JIA | 中国农科院基因组所唐中林团队利用扩展的one-hot编码提高CNN模型对猪重要经济性状的基因组预测准确性

已有 338 次阅读 2025-9-29 15:49 |个人分类:论文|系统分类:论文交流

近年来,深度学习已成为动植物全基因组选择育种领域的研究热点。其中多层感知机(MLPs)和卷积神经网络(CNNs)被广泛应用于预测农业性状。与传统的基因组选择方法不同,深度学习模型(如CNN)能够揭示位点之间的复杂相互作用,包括上位效应和加性效应等。然而,虽然深度学习模型具有这方面的优势,但在许多情况下,其对于性状的预测准确性还存在诸多不足。

近期,中国农业科学院农业基因组研究所、佛山鲲鹏现代农业研究院唐中林研究员团队完成的题为“Enhancing the genomic prediction accuracy of swine agricultural economic traits using an expanded one-hot encoding in CNN models”的研究在Journal of Integrative Agriculture (JIA) 2025年9期正式发表。

640.png

该研究团队收集并整理公开发表的2797头杜洛克猪的全基因组基因型和6个经济性状的表型,通过全基因组关联分析,获得每个单核苷酸多态性(SNP)与表型之间的相关性,并据此划分不同数量的SNP数据集(SNP数量分别为0.5k、1k、5k、10k、20k和30k),以评估CNN模型在不同数量的SNP数据集下的预测性能。在以均方误差(Mean Square Error,MSE)作为衡量标准的情况下,研究发现,在包含1,000个SNPs的数据集下,CNN模型达到最佳预测效果(MSE最小)。

1.png

在此基础上,本研究又进一步开发了一种新的基因型编码方式。与传统的基因型one-hot编码方法不同,新方法将16种不同的基因型编码成八位的二进制变量作为CNN模型的输入。研究结果显示,相较于传统的one-hot编码方法,这种新的编码方式显著提高了CNN模型对猪重要经济性状的预测准确性。

2.png

该研究发现不同数量的SNP输入对CNN模型在猪重要经济性状预测准确性方面具有显著影响,明确了在采用CNN模型进行基因组预测时研究人员应仔细筛选适当的输入集合。与此同时,通过研发一种可显著提升CNN模型预测准确性的one-hot编码方法,为深度学习模型在猪全基因组选择育种中的应用提供了新的思路。未来的研究方向可以考虑引入先进的数据预处理技术,进一步提升深度学习方法在这一领域的性能,以实现更全面、精准地利用基因组信息,促进育种方法的创新。

唐中林研究员为该文章的通讯作者,已出站博士后王子帅和已毕业硕士研究生黎旺长为该文章的共同第一作者。该研究得到国家自然科学基金(32102513),国家重点科研发计划(2023YFF1001100),深圳市创新创业计划—科技重大专项(KJZD20230923115003006)和中国农业科学院创新工程的资助。

Journal of Integrative Agriculture (《农业科学学报》(英文), JIA) 由中华人民共和国农业农村部主管,中国农业科学院与中国农学会主办,中国农业科学院农业信息研究所承办。综合性英文学术期刊,月刊。创刊于2002年,现任主编为中国科学院院士陈化兰。JIA主要栏目有作物科学、园艺、植物保护、动物科学、动物医学、农业生态环境、食品科学、农业经济与管理等。刊稿类型有综述、研究论文、简报以及评述等。全部论文在Elsevier-ScienceDirect (SD) 平台OA出版。最新SCI影响因子4.4,位于SCI-JCR农业综合学科Q1区。中国科学院分区农林科学1区。2016年以来先后获得中国科协等部委 “提升计划”“登峰计划”“卓越计划”项目支持



https://wap.sciencenet.cn/blog-3618084-1504059.html

上一篇:JIA | 甘肃农业大学绿洲农作制研究团队:干旱绿洲灌区麦后复种绿肥覆盖免耕显著提高玉米产量和氮素吸收
下一篇:JIA | 吉林农业大学张浩教授课题组探析菌群YM2的富集、驯化、降解、适应机制以及烟嘧磺隆的生物修复
收藏 IP: 124.17.34.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-9-30 06:50

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部