||
FlowerBase:花卉集成多组学数据库
开花植物是全球园艺和花卉产业的基石,而“花卉组学”这一新兴领域对于推动基础植物科学和工业育种都变得不可或缺。这些植物具有巨大的经济意义。2019 年,仅美国花卉产业销售额就达到了约 138 亿美元。然而,观赏花卉的基因组和多组学资源仍然严重碎片化或仅限于个别物种。这种数据孤立状态严重阻碍了对关键农业性状(如花色、香气和开花时间)的比较研究和系统调查。例如,梅花等观赏植物已被培育了数千年,并拥有丰富的表型多样性。一个统一的平台来探索这些性状的遗传基础却一直缺失。尽管综合的公共档案为原始基因组和转录组数据提供了宝贵的存储库,但在为花卉生物学量身定制的分析工作流程中,将这些信息的功能整合仍然是一个主要瓶颈。研究人员常常面临在庞大、通用的数据库中手动整合不同观赏植物类群信息的挑战。关键在于,这些档案通常缺乏能够直接在精选数据集上执行高级分析(如比较基因组学和基因共表达网络研究)的集成分析工具。这种碎片化的环境需要大量的生物信息学专业知识和手动数据处理,阻碍了高效发现。为了克服这一长期挑战,Wang 等人开发了 FlowerBase(https://bioinformatics.hainanu.edu.cn/flowerbase),这是首个专门设计的数据库平台,旨在统一观赏花卉基因组学并赋能现代育种。FlowerBase 提供了一个集中、用户友好的门户,无缝集成不同的多组学数据集,并提供一套强大的分析工具,这些工具此前花卉研究界尚未获得。
FlowerBase 为花卉研究建立了前所未有的基础。目前,它收录了来自 58 种观赏植物的 62 个高质量基因组组装,44 个经过整理的转录组数据集,2,581,336 个注释基因模型,以及 8754 种已识别的代谢物。该平台涵盖了广泛的分类学范围,包括全球重要的观赏植物,如百合、兰花科、牡丹、李子、杜鹃、玫瑰、三角梅、菊花、大丽花、茉莉、莲、睡莲和桂花。值得注意的是,在关键属如李属中包含多个基因组,为解析种内变异和品种特异性性状提供了宝贵的资源。通过同时整合模式植物拟南芥和水稻的参考基因组,FlowerBase 构建了一个强大的框架,用于比较和进化研究保守的花卉特征,这是单一物种数据库所不具备的特点。该平台的架构设计用于无缝连接这些广泛的数据层,从表型组学到基因组学、转录组学和代谢组学,并配备了一套复杂的分析工具,用于生物发现和加速育种(图 1)。

图1 FlowerBase 平台的架构和主要功能。(A) 该平台专注于花卉生物学的四个关键领域:花结构、花色、开花时间和花香。(B) 一套育种工具支持育种相关基因的识别和应用,包括基因组选择(GS)育种、简单序列重复(SSR)鉴定和引物设计。(C) FlowerBase 的核心是一个多组学整合引擎,它连接了多种数据类型,包括基因组学、转录组学、表型组学、变异组学和代谢组学
高级分析工作流程直接集成在 FlowerBase 门户中,使研究人员能够将复杂数据转化为生物学见解。该平台的职能围绕花卉生物学的四个关键领域组织(图 1A):花卉结构、颜色、香气和开花时间。为促进这些性状的遗传改良,FlowerBase 提供了一个专门的育种工具箱(图 1B),其中包括简单序列重复识别、引物设计以及用于简化基因编辑的“GuideRNA”工具。这些应用程序背后的力量在于平台的核心理念:一个多组学集成引擎(图 1C),该引擎连接了不同的数据层。该引擎支持使用 MICE、KNN 和 iCluster 等算法进行整体数据挖掘,并通过其“FlowerCV”和“FlowerAI”工具整合表型研究,用于花卉识别和定量图像分析。
这个中央引擎通过多个专业模块提供对多层组学数据的访问。基因组学模块(图 1D)允许用户通过基于 JBrowse 的基因组浏览器探索基因组景观,并辅以序列分析工具(BLAST)、功能注释工具(GO/KEGG 富集)和生物合成基因簇识别工具。转录组学模块(图 1E)通过交互式统一流形近似和投影(UMAP)以及来自批量 RNA 测序和单细胞 RNA 测序数据的热图,提供基因表达模式在组织和条件间的动态可视化。对于群体水平的研究,变异组学模块(图 1F)提供稳健的分析方法,包括主成分分析,以阐明种质资源的遗传结构和相互关系。在转化研究的前沿,一个高级基因组选择育种模块(图 1G)集成了多种统计模型(例如 BMTME、贝叶斯、 LASSO 和 GBLUP),以预测育种值并显著加速育种周期。这些按顺序组织的功能共同确立了 FlowerBase 作为一个为全球花卉组学社区提供一站式高性能平台的地位。
参考文献
[1] Wang C, Li Z, Zhang J, Zhang J, Liang Y, Zhang H, Wang S, Feng X, Zhang X, Zhang Z, Luo Y, Dai W, Lin Z, Wang W, Bai G, Luo M, Chen F. FlowerBase: An integrated multi-omics database for ornamental flowering plants. Plant Commun. 2026 Jan 12;7(1):101565. https://doi.org/10.1016/j.xplc.2025.101565
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库
42. CircTarget:多种细胞类型circRNA调控综合数据库
43. GreenCells:植物lncRNA单细胞分析资源
44. RM2Target 2.0:RNA修饰的写入者、擦除者和读取者靶基因数据库

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-5 01:46
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社