||
在这个追求健康饮食的时代,智能技术正逐步融入我们的日常生活。想象一下,一款应用能够自动识别你餐盘中的食物,精准估算卡路里,为你量身定制营养计划——这一切,如今变得更加触手可及!
研究背景
在饮食管理中,图像食物识别技术扮演着至关重要的角色。它不仅能够助力自动化餐食追踪,还能实现个性化营养规划。然而,背景噪音干扰、同类食物间的高相似性和不同拍摄角度、光线、分辨率带来的领域偏移问题,一直是困扰这一领域的难题。
为攻克这些难题,梁爽与谷宇院士团队发表在Foods 期刊的《A Coarse-to-Fine Feature Aggregation Neural Network with a Boundary-Aware Module for Accurate Food Recognition》提出了一种基于多级卷积神经网络的框架——CBDTN,通过引入边界感知模块 (BAM) 和变形ROI池化 (DRP) 等技术,显著提升了食物识别的准确性和鲁棒性。
研究主要内容
该研究提出了一种名为CBDTN的多阶段深度学习框架,用于解决食物识别中的复杂问题。该框架由三个主要模块组成:
ConvNeXt骨干网络:用于高质量特征提取。
BAM和DRP:增强边缘感知能力,并通过空间注意力机制优化全局特征。
Transformer编码器和NetRVLAD模块:捕捉全局上下文关系并聚合特征,减少同类食物间差异和因拍摄条件变化导致的识别偏差,提升食物识别的一致性和可靠性。
研究过程与结果
1.数据集与实验设置
研究团队在三个公开的食物识别数据集上进行了实验:
Food-5k:包含5000张图像,分为食物和非食物两类。
Food-101:包含101类食物,共101,000张图像。
Food-2k:包含2000类食物,共1,036,564张图像,是当前最大的食物识别数据集。
2.实验结果
Food-5k数据集:Top-1准确率达到99.80%。
Food-101数据集:Top-1准确率达到99.17%。
Food-2k数据集:Top-1准确率达到85.87%,Top-5准确率达到98.28%。
这些结果表明,CBDTN框架在多个数据集上均显著优于现有方法,展现了其卓越的跨领域性能和鲁棒性。
3.消融实验通过消融实验验证了各模块的有效性,证明了边界感知模块、变形ROI池化和NetRVLAD模块在提升模型性能中的重要作用。
图文赏析
图1.提议的框架。该框架由三个模块组成,包括基于ConvNeXt的骨干,BAM和DRP,以及用于食品识别的带有NetRVLAD模块的transformer编码器。
图2.基于ConvNeXt网络的详细结构。
图3.可变形ROI池化模块的结构。
图4.全局及局部特征编码模块结构。
研究总结
该研究提出的CBDTN框架通过多阶段特征提取和聚合,有效解决了食物识别中的类内差异和类间相似性问题。其在多个数据集上的优异表现,为智能饮食管理系统奠定了坚实基础,有望广泛应用于自动餐食追踪、卡路里估算、个性化营养规划等实际场景,为人们的健康饮食管理提供更智能、高效的解决方案。
原文出自 Foods 期刊:https://www.mdpi.com/3152372
期刊主页:https://www.mdpi.com/journal/foods
作者团队介绍
梁爽 副教授
首都医科大学
首都医科大学生物医学工程学院副教授。在计算机视觉领域深入开展图像多元特征提取、少样本特征表达、多层级特征融合等方面的研究,主持国家自然科学基金青年项目、市教委课题等纵向及横向项目4项;参与国家863计划项目、国家重大/重点研发项目、国家自然基金面上项目等3项;发表SCI及EI收录论文17篇;获国际计算机奥林匹克竞赛金牌2枚,银牌1枚,铜牌1枚。兼任中国生物医学工程学会康复工程分会青年委员,担任《IEEE Journal of Biomedical and Health Informatics》、《The AAAI Conference on Artificial Intelligence》等本领域期刊及会议审稿人。
谷宇 教授
首都医科大学
俄罗斯工程院外籍院士;首都医科大学生物医学工程学院教授、博士研究生导师,现任生物医学工程学院院长,国家级人才项目获得者。长期从事检测技术与自动化装置、人工智能技术及应用等方面的研究,主持完成国家863计划项目、国家重大/重点研发项目、国际合作重点专项、国家自然基金重点/面上项目、省部级重点专项、德国科学基金会面上项目等纵向项目20余项;发表SCI收录论文260余篇;授权发明专利23项,俄罗斯专利4项,德国专利2项;两项成果分别达到国际领先与国际先进水平;为相关企业创造效益8亿余元。获得中国国家教育部自然科学奖一等奖。兼任中国医疗保健国际交流促进会副秘书长、中国生物医学工程学会康复工程分会常务理事,担任《Biosensors & Bioelectronics》、《IEEE Transactions on Neural Networks and Learning Systems》等20余种本领域期刊编委及审稿人。
Foods 期刊介绍
主编:Arun K. Bhunia, Purdue University, USA
期刊主题涵盖食品研究相关各方面。目前已被 Scopus、SCIE (Web of Science)、PubMed 等数据库收录。
2023 Impact Factor:4.7
2023 CiteScore:7.4
Time to First Decision:14.5 Days
Acceptance to Publication:2.5 Days
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-4-27 14:01
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社