IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

中医舌象分割技术研究进展: 方法、性能与展望

已有 210 次阅读 2021-6-8 17:20 |系统分类:博客资讯

中医舌诊的数字化、客观化、定量化研究是中医现代化发展中的重要课题。北京工业大学信号与信息处理研究室围绕中医舌象分析仪开展了20余年的研究工作,在国内外率先将光机电、图像处理和人工智能等领域的先进技术手段应用于中医舌象信息的采集与分析中,结合中医专家的临床经验,深入研究了中医舌象信息的采集与智能分析关键技术。在此基础上,研制了智能化的采集与分析系统,取得了原创性的研究成果,为解决中医现代化中望诊信息的数字化、客观化、定量化分析这一重大基础科学问题提供了有效的技术手段。


卢运西, 李晓光, 张辉, 张菁, 卓力. 中医舌象分割技术研究进展: 方法、性能与展望. 自动化学报, 2021, 47(5): 1005-1016

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180807?viewType=HTML


精准的舌象自动分割是舌图像特征分析的前提,是中医舌象分析仪中重要的处理步骤。在舌体分割中,舌体大小和形状的差异以及舌体颜色与嘴唇颜色相近等客观因素大大增加了舌体分割的难度,使得传统的舌图像舌体分割方法在分割自动化程度和分割精度上有待进一步提升。此外,封闭环境具有稳定的光照环境,对舌体分割算法更有利,现有的舌图像自动分割方法主要研究应用于封闭式采集环境; 开放式采集环境的舌图像分割问题受到光照和图像质量的影响,则更加难以解决。因此,利用图像处理、机器学习等领域的最新研究算法提升舌图像的分割精度具有重要意义。


图0-1.png
图0-2.png
图0-3.png
图0-4.jpg


本文首先从传统分割方法和基于深度学习的分割方法两方面对中医舌象分割技术发展中的主要方法进行综述;其次,采用我们收集的舌象数据库对典型的方法进行性能评估, 并对不同舌象分割方法的特点进行分析与讨论。最后,对中医舌图像分割方法潜在的发展方向进行了展望。


文中主要讨论了典型的基于深入学习的图像分割方法,主要包括:基于编解码网络框架的分割方法(图1,图2)、基于Atrous卷积的图像分割方法、空间金字塔池化网络框架以及面向分割的迁移学习。


我们根据不同环境下中医舌象仪研究的实际需求, 在开放式采集环境下构建了舌图像数据集Tongue dataset1。该数据集由3000幅舌图像构成,由互联网图像和利用手机、相机等不同图像采集设备在不同的环境和时间段拍摄得到照片组成。因此,Tongue dataset中的舌图像具有尺寸大小不一,光照环境复杂多变,舌体的大小、形状各异和位置不固定等特点。舌图像数据集Tongue dataset部分图像样例如图3所示。我们对主要算法在中医舌象分割任务中进行了应用和比较,客观结果如表1所示。


经过综述,我们得出的结论:目前基于深度学习的舌象分割方法克服了舌形态、光照、颜色多种因素的舌象分割挑战,能够实现开放环境静态舌象的精准快速分割,基本解决了困扰舌象分割多年的全自动鲁棒舌象分割的瓶颈问题。这对中医舌象仪的自动化分析提供了传统方法难以达到的进展。本论文以综述的形式汇报该领域的最新进展,为相关研究人员提供参考。在此基础上,我们对中医舌象分割技术的发展提出了新的展望。


图1.png

图1  全卷积分割网络结构图


图2.png

图2  SegNet网络结构图


图3.png

图3  Tongue dataset中的部分舌图像


表1 不同舌象分割方法性能比较

表1.png


作者简介



李晓光

北京工业大学副教授。2003年于北京工业大学电子与信息工程专业获得学士学位,2008年获得北京工业大学博士学位。主要研究方向为计算机视觉/图像增强,图像复原。本文通信作者。 

E-mail: lxg@bjut.edu.cn


卢运西

北京工业大学计算机技术专业硕士研究生。2015年获得北京工商大学信息工程系学士学位。主要研究方向为图像处理和模式别。 

E-mail: yunxilu@emails.bjut.edu.cn


张  辉

北京工业大学信息学部讲师。2010年获得北京理工大学信号与信息处理专业博士学位。主要研究方向为计算机视觉,机器学习在多媒体内容分析、视觉追踪、目标检测中的应用。 

E-mail: huizhang@bjut.edu.cn


张  菁

北京工业大学教授。2008年获得北京工业大学博士学位。美国德州大学圣安东尼奥分校计算机科学系访问学者。主要研究方向为图像处理,图像识别,图像检索。 

E-mail: zhj@bjut.edu.cn


卓  力

北京工业大学教授。1992年获得电子科技大学无线电技术系工学学士学位, 1998年和2004年分别获得东南大学信号与信息处理专业硕士学位和北京工业大学模式识别与智能系统专业博士学位。主要研究方向为图像/视频编码和传输, 多媒体内容分析,多媒体信息安全。

E-mail: zhuoli@bjut.edu.cn




http://wap.sciencenet.cn/blog-3291369-1290309.html

上一篇:传感器饱和的非线性网络化系统模糊H∞滤波
下一篇:基于平均距离聚类的NSGA-Ⅱ

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-7-25 12:19

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部