||
aBIOTECH | 南京农业大学窦道龙团队开发高精度的植物NLR注释工具

Nucleotide-binding leucine-rich repeat(NLR)是植物免疫中的重要受体蛋白,可以识别病原菌效应子并激活Effector-triggered immunity (ETI),可诱导包括过敏性坏死反应在内的一系列强抗性反应,并抑制病原菌的增殖。因此,鉴定作物基因组中的NLR可为创制抗病作物提供关键基因资源。然而,NLR常具有复杂的基因组结构且表达水平较低,在自动化的基因组注释过程中,NLR经常被错误注释或遗漏。而利用基因组注释信息进行NLR鉴定的工具难以纠正注释错误,最终导致NLR注释不准确。
近日,南京农业大学窦道龙团队在aBIOTECH 发表了题为“NLRSeek: A reannotation–based pipeline for mining missing NLR genes in sequenced genomes”的研究论文。该工作开发了基于基因组重注释的高精度NLR注释工具NLRSeek (https://github.com/Wang-Mengda/NLRSeek)。
NLRSeek是一个基于基因组重注释的NLR鉴定工具。该流程首先对基因组中的NLR locus进行从头搜索。然后利用经实验验证的植物NLR序列集对注释模型进行训练,用该模型对候选NLR locus进行重新注释,从而能够将被错误注释或遗漏的NLR进行纠正。最后将候选NLR序列进一步确认并分类(图1A)。该工具集成了多种已报道的软件,结合了基因组学和蛋白质组学证据,能够高精度注释基因组NLR。
图1. NLRSeek工具的注释流程与拟南芥Ara000266基因的表达、转录和三级结构
为了评估NLRSeek的性能,作者使用它来预测拟南芥,水稻,小麦和香蕉基因组中的NLR基因,并将结果与NLRtracker、NLR-Annotator、Resistify和RRGPredictor等现有软件的结果进行了比较。NLRSeek不仅在模式植物拟南芥中识别出更多的NLR基因(173个),更重要的是,它成功纠正了一个被原始基因组注释(Araport11/TAIR10)遗漏的NLR(Ara000266)。通过RNA-seq、Ribo-seq数据以及三维结构建模的实验证据,证实Ara000266能够表达和翻译且具有完整TNL结构域,更可能是功能基因而不是假基因(图1B和图1C)。同时,NLRSeek也在水稻,小麦和香蕉基因组较其他软件多识别出了27-165个NLR(图2),证明了其注释的高精度。
图2. NLRSeek工具的注释结果与NLRtracker、NLR-Annotator、Resistify和RRGPredictor的比较
作者随后将NLRSeek应用于薯蓣属(Dioscorea spp.)的非模式植物基因组。在Dioscorea zingiberensis、D. tokoro和D. dumetorum中分别鉴定了182、206和95个NLR基因(图3A,B),与其他软件相比多注释了33.8%-127.5%的NLR。研究进一步利用盾叶薯蓣(D. zingiberensis)作为模型,通过转录组数据验证了NLRSeek预测结果的可靠性。NLRSeek新注释的102个NLR基因中,46个(45.1%)的表达能够被检测到(FPKM > 1)。表明NLRSeek新注释的NLR是功能性基因,而非假阳性。
图3. NLRSeek与现有工具在三种薯蓣属植物中NLR注释结果的比较
综上所述,该研究开发了一个使用简单且高精度的NLR注释工具,可以帮助研究人员预测和利用其目标物种中的NLR基因,为作物抗性育种提供新的资源。在软件界面(https://github.com/Wang-Mengda/NLRSeek)上提供了第一作者邮箱,有任何使用问题都欢迎咨询。
该研究得到了国家重点研发计划、国家自然科学基金以及中国农业产业技术体系的资助。南京农业大学硕士生王孟达和博士生傅小伟为本研究共同第一作者,南京农业大学窦道龙团队艾干副研究员和刘金定副教授为共同通讯作者。
引用本文:Wang M, Fu X, Yin L, Zhao Y, Yang Q, Ye X, et al. NLRSeek: A reannotation–based pipeline for mining missing NLR genes in sequenced genomes. aBIOTECH 2025. https://doi.org/10.1016/j.abiote.2025.100001
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-1 13:35
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社