基于深度学习的消化道疾病智能检测与自动追踪文献综述

 2022-11-28 06:11

  1. 文献综述部分(要求不少于2000字)
  2. 课题的背景和意义

随着人类社会的发展,人们对身体健康的关注越来越多,医疗影像在医疗诊断中也起着很重要的作用。在这种情况下,医疗机构需要处理越来越多的医学图像,一般临床中,都是由经验丰富的医生对影像进行诊断,比较费时费力并且结果不够稳定。

数字化的社会中,深度学习发挥了巨大的数据规模量的优点并达到了一个很高的性能水平。深度学习作为一个极为先进的学科技术,它最典型且最广泛的使用途径是图像识别,凭借着深度学习,我们可以对图像和视频进行分析。结合基于深度学习的方法进行疾病位置的检测与跟踪,使用低成本、高效率和高准确率的方案,帮助医疗机构检测和追踪疾病区域,尽量减少人工操作。

在近期的统计报告中,我国发病率前五的癌症里,有三个是消化道癌,死亡率前五的也有四个属于消化道疾病。MediRadar(麦迪雷达)就是以消化道为主要方向,使用人工智能辅助疾病诊断和早期筛查的医疗影像公司。所以,我们应当提高对消化道检查的临床诊断重视程度。该课题就是解决消化道影像定位困难、容易漏检等缺点,实现一个基于深度学习的消化道疾病检测与追踪的智能系统,高效率、高准确率的诊断病人病情,缩短确诊时间,在疾病的早期尽快进行治疗,获得较好的治愈时期。

  1. 国内外研究现状

由于消化道中病变位置可能出现在医疗影像中的任何位置,并有不同的形状大小,所以可以使用目标检测算法。用于识别图像中目标位置的技术叫做目标检测。目标检测在医疗影像中被广泛应用。传统的目标检测算法为基于滑动窗口检测,但这种基于滑动窗口检测的暴力算法由于目标的具体长宽比/尺寸不同,使得检测成本很高,并且定位边界框的位置不够准确。

如今比较普遍使用的模型分类是Two-stage目标检测算法和One-Stage目标检测算法。顾名思义,Two-stage算法需两个步骤,首先进行区域生成(region proposal),再对生成区域进行物体检测,比较典型的模型有R-CNN[1]、Fast R-CNN[2]、Faster R-CNN[3]、SPPnet[4]等;而One-stage算法则是不用区域生成,而是直接特征提取后进行分类/定位回归,广泛使用的网络模型为OverFeat[15]、Yolo等。

R-CNN作为R-CNN系列的第一代算法,将region proposal与卷积神经网络结合在一起。从R-CNN的论文中可看出,他的工作流程主要为:首先输入一张图片,使用selective search(SS)[5][11]方法生成候选区域,每张图片大致会产生2000个候选区域,该候选区域是基于图像分割任务完成的。由于每个候选区域的尺寸/长宽比各不相同,所以需要将每个候选区域缩放成227*227的尺寸,并添加16层的padding后输入卷积神经网络,CNN提取的特征图像输出传递给SVM和softmax进行分类。

R-CNN使用卷积神经网络对生成区域计算特征向量;使用微调方式来改进缺少大样本的缺点。它在PASCAL VOC 2007数据集上的mAP达到58.5%,比当时最好的目标检测算法高了30%。但是该算法训练阶段需要多级流水线方式且时间与空间的开销昂贵,检测物体的速率也较慢。

为了解决多级流水线训练和检测的效率问题,Ross Girshick基于R-CNN和SPPnet进行改进,提出了Fast R-CNN。Fast R-CNN提出的单阶段训练算法,联合学习分类和定位候选框的方法训练检测网络,训练速度比R-CNN快了9倍,与SPPnet相比快了3倍。Fast R-CNN使用一组候选框与输入图像作为输入,首先整张图像经过卷积层与池化层之后输出特征图。然后, RoI(region of interest)池化层针对特征图中的候选区域提取出固定长度的特征向量作为全连接层的输入。全连接层最后分为两个分支,一个为softmax,对K个物体类别和背景进行分类,另一个为每个类别输出四个值,表示每个类别的边界框[6]的位置。

Fast R-CNN实现了更高的目标检测精度,其中在PASCAL VOC 2012数据集中的mAP为66%。它使用了多任务损失进行单阶段训练,不需要磁盘来缓存特征图像,但候选区域的提取还是使用SS算法,消耗过多时间,无法满足实时要求。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。