
本研究探索了一种基于多模态感知模型的弱监测鸟类计数方法,该方法融合了光学图像特征和视觉线索,无需依赖详细的位置标注,即可解决光学遥感图像生态监测中面临的小目标检测、复杂背景和尺度变化等挑战。
湿地鸟类作为生态系统健康评估的重要生物指标,对其种群的监测是湿地管理和保护工作的关键组成部分。然而,传统的鸟类计数方法,如样点计数法和样线法,不仅耗时费力,还容易产生人为误差。基于光学图像的鸟类计数方法可以实现大规模鸟类计数任务。当然,该方法仍然面临着目标检测和准确计数的挑战,特别是在复杂环境下进行监测。
为了应对这些挑战,一组研究人员提出了一种无需标注的鸟类种群估计方法,该方法将光学特征与视觉语义相结合,利用定量标注实现弱监督计数,同时显著降低了标注成本。
“在增强光学图像特征的基础上,我们构建了一个包含自新功能的多模态感知模型”,本文通讯作者介绍道,“该模型采用视觉提示来收集与计数相关的特征,并利用残差连接来解决因姿态变化和复杂背景引发的误差信息。”
研究人员通过将有序数字序列(如“0只鸟”、“5只鸟”、……“100+只鸟”)嵌入为语义类别标签,将计数回归问题转化为分类任务。文本模板“图片中有[类别]只鸟”引导模型将文本中的数字语义与图像特征对齐,从而无需显示对象定位即可实现准确计数。此外,为了处理鸟群的多尺度变化,研究人员设计了一个跨尺度信息交互模块,该模块可以在不同特征尺度上传播视觉提示,生成语义丰富的融合表示。
“我们编制并发布了Wetland-Bird-Count数据集,这是一个专门为黄河三角洲沿海湿地鸟类种群评估设计的新型光学图像数据集,该数据集填补了生态监测资源的一个重要空白”,作者补充道,“在包含黄河三角洲沿海湿地光学图像的Wetland-Bird-Count数据集上的实验结果表明,所提出的方法实现了45.2的平均绝对误差(MAE)和54.2的均方误差(MSE),优于现有的弱监督和无监督方法,并取得了与全监督方法相当的结果。”
该研究验证了利用光学图像视觉线索进行弱监督集群计数可以在轻量级标注下提高鸟群计数的准确性,为光学图像生态监测提供了可靠的定量分析工具。
该研究现已发表在期刊 Watershed Ecology and the Environment上,欢迎领域内的学者同仁阅读、下载:
期刊介绍
Watershed Ecology and the Environment 是目前国际上唯一专门报道和聚焦流域生态与环境领域新理论、新发现、新方法、新技术的交叉性综合英文学术期刊,搭建了世界性学术交流平台,填补了流域生态与环境领域高水平学术期刊的国际空白。
期刊聚焦全球变化下流域生态环境面临的新问题和新挑战,收录范围涵盖了流域水文、生物地球化学、环境污染、生态过程以及监测技术、风险评估、环境/生态模型、环境/生态修复、政策管理等方面,发文题材广泛多样,包括:Research article、Review、Perspectives and Trends、Policy Forums、Natural Discovery等。旨在搭建高水平的国际学术交流平台,促进学术发展,致力全面服务科技工作者并提升我国在流域生态环境领域的影响力和话语权。
现期刊电子版本发表在月活用户超过2000万的ScienceDirect平台,供领域内的学者、及全球读者免费阅读、下载及引用。
目前,期刊已被DOAJ,Scopus和GEOBASE等重要数据库收录。
投稿链接:https://www.editorialmanager.com/wsee
转载本文请联系原作者获取授权,同时请注明本文来自科爱KeAi科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3496796-1490180.html?mobile=1
收藏