MDPI开放科学分享 http://blog.sciencenet.cn/u/mdpi https://www.mdpi.com/

博文

Foods 前沿突破!AI如何“看懂”美食?——深度学习助力精准食物识别

已有 768 次阅读 2025-4-18 16:25 |个人分类:学术软文|系统分类:论文交流

在这个追求健康饮食的时代,智能技术正逐步融入我们的日常生活。想象一下,一款应用能够自动识别你餐盘中的食物,精准估算卡路里,为你量身定制营养计划——这一切,如今变得更加触手可及!

          

研究背景

在饮食管理中,图像食物识别技术扮演着至关重要的角色。它不仅能够助力自动化餐食追踪,还能实现个性化营养规划。然而,背景噪音干扰、同类食物间的高相似性和不同拍摄角度、光线、分辨率带来的领域偏移问题,一直是困扰这一领域的难题。

为攻克这些难题,梁爽与谷宇院士团队发表在Foods 期刊的《A Coarse-to-Fine Feature Aggregation Neural Network with a Boundary-Aware Module for Accurate Food Recognition》提出了一种基于多级卷积神经网络的框架——CBDTN,通过引入边界感知模块 (BAM) 和变形ROI池化 (DRP) 等技术,显著提升了食物识别的准确性和鲁棒性。

          

研究主要内容

该研究提出了一种名为CBDTN的多阶段深度学习框架,用于解决食物识别中的复杂问题。该框架由三个主要模块组成:

  • ConvNeXt骨干网络:用于高质量特征提取。

  • BAM和DRP:增强边缘感知能力,并通过空间注意力机制优化全局特征。

  • Transformer编码器和NetRVLAD模块:捕捉全局上下文关系并聚合特征,减少同类食物间差异和因拍摄条件变化导致的识别偏差,提升食物识别的一致性和可靠性。

            

研究过程与结果

1.数据集与实验设置

研究团队在三个公开的食物识别数据集上进行了实验:

  • Food-5k:包含5000张图像,分为食物和非食物两类。

  • Food-101:包含101类食物,共101,000张图像。

  • Food-2k:包含2000类食物,共1,036,564张图像,是当前最大的食物识别数据集。

         

2.实验结果

  • Food-5k数据集:Top-1准确率达到99.80%。

  • Food-101数据集:Top-1准确率达到99.17%。

  • Food-2k数据集:Top-1准确率达到85.87%,Top-5准确率达到98.28%。

这些结果表明,CBDTN框架在多个数据集上均显著优于现有方法,展现了其卓越的跨领域性能和鲁棒性。

           

3.消融实验通过消融实验验证了各模块的有效性,证明了边界感知模块、变形ROI池化和NetRVLAD模块在提升模型性能中的重要作用。

           

图文赏析

22.png

图1.提议的框架。该框架由三个模块组成,包括基于ConvNeXt的骨干,BAM和DRP,以及用于食品识别的带有NetRVLAD模块的transformer编码器。

33.png

图2.基于ConvNeXt网络的详细结构。

44.png

图3.可变形ROI池化模块的结构。

55.png

图4.全局及局部特征编码模块结构。

            

研究总结

该研究提出的CBDTN框架通过多阶段特征提取和聚合,有效解决了食物识别中的类内差异和类间相似性问题。其在多个数据集上的优异表现,为智能饮食管理系统奠定了坚实基础,有望广泛应用于自动餐食追踪、卡路里估算、个性化营养规划等实际场景,为人们的健康饮食管理提供更智能、高效的解决方案。

           

原文出自 Foods 期刊:https://www.mdpi.com/3152372

期刊主页:https://www.mdpi.com/journal/foods

             

作者团队介绍

梁爽 副教授

首都医科大学

首都医科大学生物医学工程学院副教授。在计算机视觉领域深入开展图像多元特征提取、少样本特征表达、多层级特征融合等方面的研究,主持国家自然科学基金青年项目、市教委课题等纵向及横向项目4项;参与国家863计划项目、国家重大/重点研发项目、国家自然基金面上项目等3项;发表SCI及EI收录论文17篇;获国际计算机奥林匹克竞赛金牌2枚,银牌1枚,铜牌1枚。兼任中国生物医学工程学会康复工程分会青年委员,担任《IEEE Journal of Biomedical and Health Informatics》、《The AAAI Conference on Artificial Intelligence》等本领域期刊及会议审稿人。

        

谷宇 教授

首都医科大学

俄罗斯工程院外籍院士;首都医科大学生物医学工程学院教授、博士研究生导师,现任生物医学工程学院院长,国家级人才项目获得者。长期从事检测技术与自动化装置、人工智能技术及应用等方面的研究,主持完成国家863计划项目、国家重大/重点研发项目、国际合作重点专项、国家自然基金重点/面上项目、省部级重点专项、德国科学基金会面上项目等纵向项目20余项;发表SCI收录论文260余篇;授权发明专利23项,俄罗斯专利4项,德国专利2项;两项成果分别达到国际领先与国际先进水平;为相关企业创造效益8亿余元。获得中国国家教育部自然科学奖一等奖。兼任中国医疗保健国际交流促进会副秘书长、中国生物医学工程学会康复工程分会常务理事,担任《Biosensors & Bioelectronics》、《IEEE Transactions on Neural Networks and Learning Systems》等20余种本领域期刊编委及审稿人。

            

Foods 期刊介绍

主编:Arun K. Bhunia, Purdue University, USA

期刊主题涵盖食品研究相关各方面。目前已被 Scopus、SCIE (Web of Science)、PubMed 等数据库收录。

2023 Impact Factor:4.7

2023 CiteScore:7.4

Time to First Decision:14.5 Days

Acceptance to Publication:2.5 Days

尾图1.jpg

尾图2.jpg



https://wap.sciencenet.cn/blog-3516770-1482508.html

上一篇:Topics:环境水力学研究进展
下一篇:Nutrients 中国农业大学沈群教授团队:肠道菌群Muribaculaceae科的探索——多样性、代谢与功能
收藏 IP: 61.242.144.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-4-27 14:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部