1 课题背景及研究意义
1.1 课题背景
图像分割是将图像划分为若干互不相交的小区域的过程。小区域是某种意义下具有共同属性的像素连通集合,如物体所占的图像区域、天空区域、草地等。连通是指集合中任意两个点之间都存在着完全属于该集合的连通路径。对于离散图像而言,连通有4连通和8连通之分。
图像分割是图像处理中的一项关键技术,自20世纪70年代起一直受到人们的高度重视,并在医学、工业、军事等领域得到了广泛应用。近年来具有代表性的图像分割方法有:基于区域的分割、基于边缘的分割和基于特定理论的分割方法等。本文主要对基于自动阈值选择思想的迭代法、Otsu法、一维最大熵法、二维最大熵法、简单统计法进行研究,选取一系列运算出的阈值数据和对应的图像效果做一个分析性实验。
图像分割有3种不同的方法,其一是将各像素划归到相应物体或区域的像素聚类方法,即区域法,其二是通过直接确定区域间的边界来实现分割的边界方法,其三是首先检测边缘像素,然后再将边缘像素连接起来构成边界的方法[1]。
图像分割是图像理解的基础,而在理论上图像分割又依赖图像理解,两者是紧密关联的。图像分割在一般意义下十分困难的,目前的图像分割处于图像的前期处理阶段,主要针对分割对象的技术,是与问题相关的,如最常用到的利用阈值化处理进行的图像分割[2]。
1.2 研究意义
阈值分割方法的历史可追溯到近40前,现已提出了大量算法。阈值分割法就是简单的用一个或几个阈值将图像的直方图分成几类,图象中灰度值在同一个灰度类内的像素属于同一个类。它是一种PR法。其过程是决定一个灰度值,用以区分不同的类,这个灰度值就叫阈值。它可以分为全局阈值分割和局部阈值分割。所谓全局阈值分割是利用整幅图像的信息来得到分割用的阈值,并根据该阈值对整幅图像进行分割;而局部阈值分割是根据图像中的不同区域获得对应的不同区域的阈值,利用这些阈值对各个区域进行分割,即一个阈值对应一个相应的子区域,这种方法也叫称为适应阈值分割。可以看出,确定一个最优阈值是分割的关键。现有的大部分算法都是集中在阈值确定的研究上。图像分割是图像处理中的一项关键技术,也是一经典难题,发展至今仍没有找到一个通用的方法,也没有制定出判断分割算法好坏的标准,对近几年来出现的图像分割方法作了较为全面的综述,探讨了图像分割技术的发展方向,对从事图像处理研究的科研人员具有一定的启发作用。
图像分割是图像分析的第一步,图像分割接下来的任务,如特征提取、目标识别等的好坏,都取决于图像分割的质量如何。由于该课题的难度和深度,进展比较缓慢。图像分割技术自20世纪70年代起一直受到人们的高度重视,虽然研究人员针对各种问题提出了许多方法,但迄今为止仍然不存在一个普遍适用的理论和方法。阈值法是一种简单但是非常有效的方法,特别是不同物体或结构之间有很大的强度对比时,能够得到很好的效果。它一般可以作为一系列图像处理过程的第一步。它一般要求在直方图上能得到明显的峰或谷,并在谷底选择阈值。另外,还没有制定出选择适用分割算法的标准,这给图像分割技术的应用带来许多实际问题。
特殊图像分割的研究越来越得到重视。目前有很多针对立体图像、彩色图像、多光谱图像以及多视场图像分割的研究,也有对运动图像及视频图像中目标分割的研究,还有对深度图像、纹理图像、计算机断层扫描、磁共振图像、共聚焦激光扫描显微镜图像、合成孔雷达图像等特殊图像的分割技术研究。因而,当从原理和应用效果等方面来深入研究图像分割技术时,对于提高图像分析,图像理解系统的性能,以及提高图像处理技术的应用水平都具有十分关键的意义[7-9]。
2 文献综述
人们对图像分割研究近100多年的历史,通过借助各种科技手段、理论,至今已提出近千种分割方法,例如:模糊精神网络。模糊推理系统、模糊度量目标轮廓技术、图像区分技术、目标跟踪技术等许多关于模糊理论数字图像分割技术,但这些算法一般针对研究某一具体问题提出,没有一种通用的算法适合各种图像的处理,当然,在今后的很长时期内,图像分割依然是研究的热点[10]。
最早的图像分割技术起源19世纪50年代,在100多年的研究发展历程中,随人类科学技术的不断发展,它基本研究分析停留在光学和数字两大阶段,到了20世纪80年代,随着数字技术的应用和发展,光学分割技术在很大程度上被数字图像分割替代[11]。
2.1 国内研究现状
国内当前提出了许多新方法,任明武[12]等人提出的一种基于边缘模式的直方图构造新方法,针对图像分割受噪声和边缘的影响减少到最小。程杰提出一种基于直方图的图像分割方法,这种方法对OSTU准则的内在缺陷进行了改进,并运用对直方图的预处理及轮廓追踪,找出最佳分割值。此方法对红外图像有重要的研究性。付忠良提出的基于图像差距度量值的选取方法,多次导出OSTU方法,得到了几种与OSTU相近的简单计算公式,使该方法特别适合需自动产生的实时图像分析系统。乐宁[13]等人,根据过渡区内像素点具有的邻域方向性特点,引入了基于一元线性回归处理的局部区域随机波动消除方法,将图像过渡“7”区算法进行了改进。模糊技术及其日趋成熟的应用也正适应了大部分图像边缘模糊而难以分析的现状。
阀值分割,是图像分割的基本方法之一,其历史可追溯到近40年前,现己提出了大量分割算法。基于灰度图像阀值分割方法就是先确定一个处于图像灰度取值范围之中的灰度阀值,然后将图像中各个像素的灰度值都与这个阀值相比较,并根据比较结果对应的像素分为两类[14]。这两类像素一般分别属于图像的两类区域,进而达到图像分割的目的。从该方法中可以得出结论,确定一个最优阀值是分割的关键。现有的大部分算法都是集中在阀值确定的研究上。阀值分割方法根据图像本身的特点,可分为单阀值分割方法和多阀值分割方法;也可分为基于像素值的阀值分割方法、基于区域性质的阀值分割方法和基于坐标位置的阀值分割方法[15]。若根据分割算法所有的特征或准则,还可以分为直方图与直方图变换法、最大类间方差法、最小误差法与均匀化误差法、共生矩阵法、最大嫡法、简单统计法与局部特性法,概率松驰法、模糊集法、特征空间聚类法、基于过渡区的阀值选取法等[16]。
王培珍、杜培明[17]等人结合模糊一均值算法和遗传算法的两大显著特点提出了一种用于多阀值图像自动分割的混合遗传算法,这种方法研究Ppaa- markes等提出爬山法的多阀值分割和Olive提出子波变换的方法存在的缺陷(即只对明显峰值有效而对不明显的峰值无效)进行的改进,能够迅速正确地实现分割,并且不需预先认定分割类数。
Zikuan Chen等人提出的基于小波的自适应阀值分割方法把小波引入图像分割,利用小波分析获得阀值,得到了较好的分割效果。Mandeblort创立了几何学理论,提出用分形维数这一度量概念来描述自然现象规则程度。这种方法用于图像分割时的特点在于分形维数直观上与物体表面的粗糙程度相吻合,而自然界中不同纹理的粗糙度有很大差别,因此可以用它作为一个合理的特征参数来区别不同类别的纹理。杨波、徐光等人提出了基于分形特征的自然景物图像分割方法,通过构造一组分形纹理特征、分析图像不同部分的粗糙度及纹理基元大小和方向等特性进行图像分割[18]。
虽然,近年来研究成果越来越多,但是由于图像分割本身所具有的难度,使研究没有大的突破性的进展。依然存在的问题主要有两个:其一是没有一种广泛使用的分割算法;其二是没有一个好的通用的分割评价标准。
从图像分割研究的历史来看,可以看到对图像分割的研究有几个明显的趋势:
(1)是对原有算法的不断改进;
(2)是新方法、新概念的引入和多种方法的合理综合运用。人们逐渐认识到现有的任何一种单独的图像分割算法都难以对一般图像获得令人满意的分割效果,因而,好多人在把新方法和新概念不断的引入图像分割领域的同时,也更加重视把各种方法综合起来运用;
(3)是对特殊图像分割的研究越来越得到重视,当前,有很多研究立体图像、彩色图像、多光谱图像以及多视场图像分割的研究,也有对运动图像及视频图像中目标分割的研究,还有对深度图像、纹理图像、计算机断层扫描(CT)、核磁共振图像、共聚焦激光扫描显微镜图像、合成孔雷达图像等特殊图像的分割技术的研究等等。
2.2 国外研究现状
在对图像分割算法的研究中,基于阀值的分割方法是一类出现比较早并且十分重要的方法。阀值分割法的重点在于如何选取图像的最佳阀值,它因简单、有效、快速、实用而得到广泛应用。到目前,己有众多的阀值方法被提出,其中OtSU提出的最大类间方差法和Kapur提出的最大嫡法是最常用的阀值算法[19]。
最早的阀值化方法可以追溯至1962年。oyle提出的p-tile法[20],他先假设己知图像中目标和背景两类所占的面积比例,再选取阀值使两类像素符合该比例。但这种方法要预先假设目标所占整幅图像的比例,当这个比例未知或者随不同图像变化时就比较难以适用。
1979年Otsu发明基于最大类间方差的方法[21],通过求取类间方差的最大值来获得最佳分割阀值,其也被称为Otsu分割法。该方法解决了阀值选取中难以确定阀值分割门限的问题。
Xu通过详细分析Otsu阀值准则的性质之后证明了Otsu法的最佳阀值就是利用该阀值分割出的背景与目标的均值平均值[22]。
Xue提出了一种基于中值的Otsu改进算法用于解决直方图呈偏斜分布或重尾分布的图像进行分割会出现阀值偏移的问题[23]。
1985年Kapur基于图像信号的随机性并利用信息嫡的概念,提出了最大嫡图像分割方法。他是在等人所做工作的启发下,经过一些修正而得出的。该算法将目标和背景看成两个子系统并具有各自的概率分布,分割的最优准则是使两个子系统的独立嫡之和最大,这样使得目标和背景内部的灰度尽可能呈均匀分布,也就是强调灰度相似性[24]。
Kittler等人于1986年最先提出了基于最小误差准则的阀值选取方法。他们假设图像中的目标和背景的灰度分布都分别服从高斯分布,这样就将阀值的选取转化为最小误差的高斯模拟[25]。
Chen结合最大嫡理论和模糊理论提出了一种模糊嫡阀值分割方法。
1993年,Li等人将交叉嫡的概念引入到图像处理领域,提出了基于一维灰度级直方图的最小交叉嫡的阀值选取方法。该方法以分割后的图像与原图像的信息量差异最小为阀值选取准则[26]。
由于一维阀值分割算法是在灰度直方图基础上进行处理的,当图像受到噪声干扰时,其直方图波峰和波谷不明显,且没有考虑像素邻域空间信息,因此分割效果不理想且抗噪声能力较差,为此科研工作者们做了大量的研究并提出了众多阀值改进算法。
Abutaleb将一维最大嫡推广至二维,提出了二维最大嫡法。这种方法不需要先验知识,而且对于非理想双峰或多峰直方图的图像也可以进行较好的分割[27]。
1989年等引入图像的4阶局部嫡与条件嫡的概念,提出选取阀值的最大二阶局部嫡法和最大条件嫡法[28]。
1989年Wong等介绍了一种考虑了图像内部均匀性与形状的最大嫡阀值选择方法[29]。
由于这些算法既考虑了像素的灰度值信息,又考虑了像素邻域空间信息,因此抗噪声的鲁棒性较好。然而信息量的增加势必会增加计算复杂度,使算法应用于实时处理系统变得困难,因此加快算法计算的速度使算法的计算效率提高也是十分重要而又有实际意义的研究课题。
Sathya和康杰红分别将细菌觅食算法(Bacteria ForagingAlgorithm,BFA)和蛙跳算法(Shuffled Frog Leaping Algorithm,SFLA)用于图像多阀值分割,在分害效果和分割效率上都有优势。
虽然最新提出的智能优化算法在提高阀值搜索效率方面相较传统穷举法有非常大的优势,但其搜索不是很稳定的特点也使得其在实际应用时具有一定的局限性。
3 研究内容、预期目标和研究方法
3.1 研究内容
图像分割是图像处理中的一项关键技术,自20世纪70年代起一直受到人们的高度重视,并在医学、工业、军事等领域得到了广泛应用。近年来具有代表性的图像分割方法有:基于区域的分割、基于边缘的分割和基于特定理论的分割方法等。主要对基于自动阈值选择思想的迭代法、Otsu法、一维最大熵法、二维最大熵法进行研究,选取一系列运算出的阈值数据和对应的图像效果做一个分析性实验。
3.2 预期目标
对于一具体图像,每个算法都将会分别运算出其对应的阈值,通过程序将其记录并返回用户界面。实验将选取几张具有不同特征的典型图像作为实验样本。分别记录每种算法对每张图像运算出的阈值并且保存处理出的图像效果。得出每张图像用哪种算法的处理效果最佳,哪种最不理想,并且根据算法的原理以及得到的阈值数据对实验现象进行分析。根据实验的分析结果,可以试图讨论是否能有一种更加科学,适应性更强的自动阈值选择法。
3.3 研究方法
查找相关文献,对自动阀值图像分割的原理和相关知识进行学习。
嵌入载体:图像
工具:Visual Studio
自动阈值选择法的具体算法:迭代法、Otsu法、一维最大熵法、二维最大熵法
目的:图像分割算法的研究并实现
4 研究进度安排
2019年12月30日-2020年1月12日,确定毕业论文内容,学习图像分割的相关知识;
2020年1月13日-2020年2月23日,查阅国内外相关文献资料,对图像分割算法进行研究,根据要求撰写选题报告;
2020年2月24日-2020年4月19日,翻译一篇英文文献,撰写并提交中期检查表;
2020年4月20日-2020年5月10日,迭代法、Otsu法、一维最大熵法、二维最大熵法实现图像分割;
2020年5月11日-2020年6月5日,按照毕业论文撰写规范撰写毕业论文,准备答辩。
参考文献
[1]安强强,张峰,李赵兴,et al. 基于机器学习的图像分割研究[J]. 自动化与仪器仪表,2018(6).
[2]兰晓东,黄智勇,谭子明,et al. 一种基于图像分析的细胞微管定量分析方法[J]. 第三军医大学学报,2019,41(22):2190-2194.
[3]范迪,李晓雨,高尚,et al. 图像直方图均衡化多模实现的实验设计[J]. 信息技术与信息化,2019(5):118-122.
[4]李旗,魏楚. 基于分水岭算法的遥感图像分割方法研究[J]. 无线互联科技,2019(13).
[5]崔乐,李春,李英. Harris算法和Susan算法的实现及分析[J]. 计算机与数字工程,2019(10).
[6]谌华,郭伟,闫敬文. 综合边界和纹理信息的合成孔径雷达图像目标分割[J]. 中国图象图形学报,2019(6).
[7]石涛. 基于回溯法的罗密欧与朱丽叶的迷宫问题的Matlab实现[J]. 电脑编程技巧与维护,2019(9).
[8]张莉,陈建方,曹明娜,et al. 医学影像技术专业数字图像处理与MATLAB教学探索[J]. 基础医学教育,2018,20(4).
[9]杨保华,王菁,何小年. 基于Matlab的数字图像处理实践教学[J]. 课程教育研究,2016(22).
[10]汤朋文,陶华敏,肖山竹,et al. 几种常用图像分割算法自适应性的分析比较[J]. 数字技术与应用,2016(5):140-140.
[11]吴掬鸥[1],袁晓桂[1]. 基于阈值分割技术的图像分割法研究[J]. 现代电子技术,2016,39(16):105-107.
[12]孙峰丽. 改进的超像素和Graph cuts的图像分割方法研究[D]. 2016.
[13]杨超. 基于小波变换的高光谱图像分类算法应用研究[C]// 第十五届全国数学地质与地学信息学术研讨会. 0.
[14]汤丽娟,孙克争,TANGLi-juan,et al. 图像融合算法的分析与实现[J]. 现代计算机,2016(10):42-48.
[15]刘昭勇,代安定,李康,et al. 基于复合混沌系统的彩色图像加密算法及Matlab实现[J]. 湖南城市学院学报(自然科学版),2018,27(3).
[16]宋国磊,侯巍. Overview of SAR image segmentation algorithm%SAR图像分割算法综述[J]. 计算机时代,2017,000(005):1-5.
[17]朱卫华. 基于全局熵最小化的MRI图像分割算法[J]. 新余学院学报,2017,22(4):1-5.
[18]刘丛,李咨兴,唐坚刚. 融合多信息的噪声图像分割算法研究[J]. 小型微型计算机系统,2019,40(9).
[19]齐千慧,田益民,韩利利,et al. 关于图像分割算法的研究[J]. 北京印刷学院学报,2019(7):102-106.
[20]余廷忠,张起荣. 基于自适应特征加权的数字抠像图像分割算法[J]. 科技通报,2016(32):183.
[21]JOHN M.GAUCH.Image segmentation and analysis via multiscale gradient watershed hierarchies[J].IEEE transactions on Image Processing,2018,8(1):69-79
[22]ZI-KUAN CHEN,TAO YANG,XIN CHEN.et al.Wavele based adaptive thresholding method for image segmentation[J].Optical Engineering,2016,40(5):868-874
[23]Y J ZHANG.A.survey on evaluation methods for image segmentation[J].Pattern Recognition,2016,29(8):1335-1346
[24]Fu K S,Mui J K A survey in image segmentation. Pattern Recognition,2016,13:3-6
[25]Murthy C A,Pal S K,Histogram thresholding by minimizing grya-level fuzziness Information Sciences,2016,60:107-135
[26]Carson,C. Belonqie,S. Greenspan,H. and Malik,J. Blobworld:image segmentation using expectation-maximization and its application to image querying. IEEE Trans. Pattern Anal.Machine Intell.,vol.24,pp.1026-1038,2017
[27]L. A. Zadeh,Outline of a new approach to the analysis of complex systems and decision processes,IEEE Trans. Syst,Man and Cybernetics,2016,3 (1):28-44
[28]Canny,J. A Computational Approach for Edge Detection. IEEE Trans.Pattern Anal. Machine Intell,vol.8,no. 6,pp. 679-698,2015.
[29]Qian R. J.and Huang,T. S. Optimal Edge Detection in Two-DimensionalImages. IEEE Trans. Image Processing,vol.5,no.7,pp.1215-1220,2016.