本文是一篇软件工程论文,本文提出一种基于改进的圆周卷积的宫颈癌细胞分割算法。首先对细胞图像中的细胞进行定位,然后通过 ExtremeNet 获得细胞的极值点,再使用圆周卷积和一维卷积的特征融合得到细胞的八边形轮廓,作为分割算法的输入,使用圆周卷积对初始轮廓提取特征,为了提升网络分割的效率,减少网络层数至四层,在提升效率的同时不影响分割的精度,引入混合注意力机制,即空间注意力机制和通道注意力机制。
第 1 章 绪论
1.1 研究背景及意义
癌症作为全球第二大死亡原因,其种类繁多。世界卫生组织在 2020 年发布了最新的全球癌症报告[1],报告显示超过半数以上的癌症是新发癌症类型,在众多和女性相关的新发癌症类型中,患宫颈癌的人数排在第四位。女性中约有 443万人因癌症死亡,其中因宫颈癌而死亡的人数排在第四位,死亡比例值为 7.7,如图 1.1 所示。宫颈癌是最常见的妇科恶性肿瘤,以 25 岁到 55 岁的女性最为常见,研究表明,宫颈癌的发病人数和死亡人数随着时间的变化相继增加,因此宫颈癌严重威胁女性的生命健康。在全球范围内,平均每分钟即检查出一例新发病例,每两分钟就有一名女性死于宫颈癌。对不同的国家来说,宫颈癌的发病率与死亡率和社会的经济发展水平有关,而发展中国家的死亡病例数较多。在我国,农村和城市癌症的发病率和死亡率也不同,农村地区的癌症发病率低于城市,但是死亡率更高。而对于宫颈癌而言,则是农村地区的发病率和死亡率都高于城市地区。
软件工程论文参考
软件工程论文参考
...........................
1.2 宫颈癌细胞识别的难点
近年来,有大量的学者对宫颈癌细胞的识别进行研究,并且提出了各种表现优异的算法,但是研究的过程还是会有瓶颈,分析近年来宫颈癌细胞识别的研究现状,发现宫颈癌细胞识别研究面临以下挑战:
(1)数据集。宫颈癌识别研究的数据是通过制片和光学显微镜扫描获得的,用于识别研究的数据集需要经过专业的医师进行标注,但是标注的工作量大,需要多名医生共同标注然后得到一致细胞图像标签。目前大多数研究使用的是当地医院的脱敏数据集,而这个数据集是不公开的,不利于该领域的研究发展。
(2)细胞图像的重叠。细胞的形态是立体的,但是经过光学显微镜的扫描,将细胞变成二维,而且细胞与细胞之间会重叠,为细胞的识别增加了难度。
(3)宫颈癌细胞的多样。宫颈癌细胞图像的研究与自然场景下图像的研究相比较为复杂,自然场景下的图像种类多,特征明显,较易识别。而宫颈癌细胞图像依据细胞外观特点较难分辨,不同细胞之间的外观差别较小,容易误判,比如良性细胞与恶性细胞。这也是宫颈癌细胞识别的难点所在。
(4)宫颈癌细胞图像质量。宫颈癌细胞的识别研究是为了对不同细胞进行分类,但是宫颈癌细胞图像存在大量与细胞无关的杂质,比如血液或者与宫颈细胞无关的其他细胞,分类的时候存在背景的干扰。经光学显微镜扫描成像时,可能会受光照、角度等因素而造成图像质量不佳。
............................
第 2 章 相关理论研究
2.1 卷积神经网络
随着深度学习的不断发展,神经网络的类型不断增多。神经网络由大量的神经元组成,神经元通过函数映射进行计算后输出结果。将多个神经元组织在一起就形成了神经网络,经典的神经网络由输入层、隐藏层和输出层组成。输入层和输出层之间的层成为隐藏层。了解卷积神经网络的结构以及每个部分的作用是实现深度学习算法的基础。卷积神经网络(Convolutional Neural Network,CNN)主要包括卷积层、激活函数、池化层和全连接层。
2.1.1 卷积层
卷积层在计算机视觉领域中,主要用于提取图像的特征。与卷积神经网络相关的一个概念是感受野。卷积层的神经元与输入的某个区域进行连接,连接的空间大小就是神经元的感受野。卷积神经网络的每层会输出一定大小的特征图,特征图上的像素点对应输入图像上的区域。卷积层是卷积核与图像的对应位置进行卷积运算,特征图是把卷积层的运算结果通过激活函数获得的,卷积层经过运算后的结果定义如公式(2.1)所示。卷积层的运算是通过卷积核在输入图像上进行滑动,滑动的步长默认为 1,然后与图像的对应位置做乘积和求和运算,最后得到每一层的特征图,卷积层的运算过程如图 2.1 所示。
软件工程论文怎么写
软件工程论文怎么写
...........................
2.2 U-Net U-Net
常用于医学图像分割任务中,目前,有大量算法是基于 U-Net 的改进,且被引用多次。U-Net 方法在 2015 年首次提出并应用于生物医学图像分割,U-Net 是一个基于 CNN 的神经网络。U-Net 的网络结构如图 2.3 所示。
软件工程论文怎么写
软件工程论文怎么写
U-Net 是基于全卷积神经网络[26](Fully Convolution Networks,FCN)设计的,但是它不含全连接层,它的网络结构呈 U 型,是一种编码器-解码器结构,左侧的编码由四个子模块组成,每个子模块包含两个卷积层,然后通过一个最大池化操作实现下采样,每经过一次最大池化操作,特征通道都会变为原来的两倍。下采样可以降低过拟合的风险,以此类推,直到进行第四次下采样,在经过两次卷积操作,产生最大的特征通道 1024。右侧的解码器也包含四个子模块,每个模块有两个卷积层,然后经过一个 2×2 的反卷积操作,特征通道变为原来的一半,图像的尺寸变为原来的 4 倍,连续上采样四次。每一次上采样的结果都与下采样的特征通道拼接在一起,作为下一个上采样的输入。最后经过一个 1×1 的卷积操作用于分类,将 64 个特征向量分成目标物体和背景两类。
..............................
第 3 章 基于改进的圆卷积的宫颈癌细胞分割算法 ................... 17
3.1 引言 ........................................ 17
3.2 数据集 .......................................... 17
第 4 章 基于改进的胶囊神经网络的宫颈癌细胞分类算法 ......................... 36
4.1 引言 .................................... 36
4.2 基于改进的胶囊神经网络的宫颈癌细胞分类算法 ................................... 37
第 5 章 总结与展望 ............................ 48
5.1 总结 .................................... 48
5.2 进一步工作的方向 .................................. 49
第 4 章 基于改进的胶囊神经网络的宫颈癌细胞分类算法
4.1 引言
上一章介绍了改进圆周卷积的宫颈癌细胞分割算法,本章的内容是在上一章宫颈癌细胞分割的基础上,对五种单细胞进行分类。使用卷积神经网络对宫颈癌细胞进行分类时,卷积神经网络主要是对细胞的特征进行分析,所以先利用宫颈癌细胞分割算法将宫颈癌细胞簇图像分割为单个的宫颈癌细胞,减少了图像的不同背景对分类结果的影响。
常用的深度学习算法对宫颈癌细胞进行分类时,细胞图像中不仅包含目标细胞,还有除细胞外的杂质或者含有染色液的背景。传统的宫颈癌细胞分类算法,对手动提取的特征需要有先验知识,这样降低了它们的泛化能力。随着卷积神经网络的引入,大量研究采用卷积神经网络或者改进的神经网络对宫颈癌细胞进行分类,卷积神经网络通过不同深度的卷积层学习宫颈癌细胞的特征,减少了手动提取特征,保留了原图的特征,进而对图像进行分类。虽然卷积神经网络用于各个领域的分类效果都很好,但是它仍然存在不足。深度学习在医学领域的应用,需要大量的样本进行训练,但是获取医学数据较难。一般,研究人员会通过数据增强的方式对样本进行扩增,比如旋转,剪切等。卷积神经网络通过数据集的多样性训练神经网络,学习同一物体不同方向的特征。卷积神经网络通过卷积层提取图像的特征,得到尺寸放大的特征图,通过池化操作来降维,从而减少参数的计算量,但是池化会丢失图像信息,使得图像模糊化,比如位置信息。文献[42]首次提出了一种胶囊神经网络,可以解决仿射变换的问题,从而提高分类的准确率。为了学习到宫颈癌细胞图像的丰富的特征,进而提升卷积神经网络的分类性能,本文提出一种改进的胶囊神经网络的宫颈癌细胞分类算法。
.............................
第 5 章 总结与展望
5.1 总结
宫颈癌是最常见的妇科恶性肿瘤,目前患者的群体日渐趋于年轻化,极大地威胁着女性的生命安全。宫颈癌可以通过早期筛查来预防和尽早治疗。由于巴氏涂片便利和造价低,巴氏涂片检查得到广泛的推广。巴氏涂片检查需要医生在显微镜下阅片,长时间阅片会导致误诊的概率偏高,不同医生的阅片结果不一样,最终导致巴氏涂片检查的效率低。为了辅助医生阅片,很多研究员借助人工智能技术进行宫颈癌细胞图像的识别研究。
宫颈癌细胞图像存在大量与目标细胞无关的杂质或者细胞等,而且细胞与细胞之间存在重叠的区域。为了提高宫颈癌细胞图像分类的准确率,本文基于深度学习技术从细胞分割和细胞分类两方面实现宫颈癌细胞的识别。本文的主要研究内容如下:
(1)对宫颈癌细胞识别、分割和分类的研究现状进行总结,从四个方面指出目前宫颈癌细胞识别所面临的挑战。
(2)介绍了深度学习中的基础卷积神经网络的结构,以及用于分割的卷积神经网络 U-Net 和 Mask R-CNN,用于分类的卷积神经网络 DenseNet。
(3)提出一种基于改进的圆周卷积的宫颈癌细胞分割算法。首先对细胞图像中的细胞进行定位,然后通过 ExtremeNet 获得细胞的极值点,再使用圆周卷积和一维卷积的特征融合得到细胞的八边形轮廓,作为分割算法的输入,使用圆周卷积对初始轮廓提取特征,为了提升网络分割的效率,减少网络层数至四层,在提升效率的同时不影响分割的精度,引入混合注意力机制,即空间注意力机制和通道注意力机制。混合注意力机制让网络更加关注细胞与细胞之间有交集的地方以及远离目标细胞轮廓的点上的特征,提高分割的精度。
(4)提出一种改进的胶囊神经网络的宫颈癌细胞分类算法。将分割算法的结果作为分类算法的数据集。使用 VGG-16 作为胶囊网络的卷积层进行特征提取,提取图像深层特征,为了胶囊更好地学习对分类有用的特征,在主胶囊层和数据胶囊层之间添加自注意力,可以减少卷积层和主胶囊的冗余特征,进而提高宫颈癌细胞的分类效率和精度。