您的当前位置:首页正文

图像分割技术研究与应用

2022-05-12 来源:客趣旅游网
Y1524763分类号UDC:密级:编号:图像分割技术研究与应用TheApplicationAndResearchofImageSegmentation学位授予单位及代码:丝壹堡王太堂学科专业名称及代码:盐篡扭廑旦筮盔研究方向:国堡丝堡皇攫塞迟型指导教师:吐置(!Q!竖2f塑12Q32申请学位级别:亟研宄±跑生:童论文起止时间:29凹。2_200吼4摘要图像分割技术是图像识别、分析的基础,其主要应用领域包括智能移动机器人的场景理解、智能视频监控中的运动目标提取、基于内容的图像检索、基于内容的图像压缩等,本文首先对图像分割的基本理论和基于边缘的图像分割进行了详细阐述,简单介绍了一些常见的边缘检测方法和算子,给出了不同算子对同一幅图像进行分割的结果,并对结果进行了分析。在此基础上分别针对灰度图像和彩色图像的分割给出具体处理方法和实现过程。结合数学形态学、正交变换技术、运用扩展的微分算子提高算法的抗噪性,设计基于子块的区域生长方法,利用颜色信息减少彩色图像的过度分割。关键词:图像分割,边缘检测,区域生长,形态学变换ABSTRACTandinterpreting.ImagesegmentationisthebasictaskforimagerecognitionItsapplicationsincludecomputervisionofmobilerobots,extractionofmovingob{ectsinintelligentvideomonitoringsystems,contentbasedimageretrieval,contentbasedimagecompression,andSOon.Inthispaper,thebasictheoryofimagesegmentationandimagesegmentationcommonbasedontheedgeintroducedfirstly,Abriefintroductionofedgedetectionmethodsandoperatorsiscompletedsecondly,Finally,Theresultofimagesegmentationwithdifferentoperatorsgrayscaleonthesameimageareforgiven,Inthepaperprocessingproceduresegmentationareimagesandcolorimagegiven.Combinationtechnology,andoftheandmathematicalexpansionofmorphology,orthogonaloperatorontransformationtothedifferentialenhancetheanti—’noisepowerdesignofgrowingmethodsbasedover—segmentationsub—‘blockandcolorinformationforreducingispresentedindetails.Keyword:ImageSegmentationMorphologyEdgeDetectionregiongrowingMathematicalIl长春理工大学硕士学位论文原创性声明本人郑重声明:所呈交的硕士学位论文,《图像分割技术研究与应用》是本人在指导教师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均己在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者签名:年-[月尘日长春理工大学学位论文版权使用授权书本学位论文作者及指导教师完全了解“长春理工大学硕士、博士学位论文版权使用规定’’,同意长春理工大学保留并向中国科学信息研究所、中国优秀博硕士学位论文全文数据库和CNKI系列数据库及其它国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权长春理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文。作者签名:年么月鱼日指导导师签名:“月鱼日11第一章帚一旱绪论强比视觉、听觉和触觉是人类接收信息的主要方式,在这些方式中视觉又占到了大约70%的比重,视觉接收到的信息包括图像、图形、视频、文本、数据等,全部是图像(Image)信息,而自然界给予了我们人类一个完美、强大的视觉系统,能够轻而易举的处理和理解各种视觉信息,随着信息时代特别是数字时代的来临,再加上计算机处理速度的提高和图像处理技术的成熟,数字图像作为一种直接而内容丰富的信息载体己成为计算机科学领域越来越重要的研究对象。1.1题目研究的意义1.1.1数字图像处理技术数字图像处理(DigitalImageProcessing)是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,为人们开始利用计算机来处理图形和图像信息提供了硬件支持。随着人们研究的不断深入,20世纪60年代初期,数字图像处理逐渐发展成为一门学科,早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目标。人们常用的图像处理方法有图像增强、复原、编码、压缩等技术。在图像处理发展的过程中,美国喷气推进实验室(JPL)使图像处理技术的实际性应用首次获得巨大的,标志性的成功,他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,包括灰度变换、几何校正、去除噪声等方法,并考虑了太阳位置和月球环境的影响,成功地绘制出月球表面的地图,对推动图像处理技术的发展具有重大意义。Ⅲ数字图像处理取得的另一个巨大成就是在医学上的应用,英国EMI公司的工程师Housfield,1972年发明了用于人的脑部疾病诊断的X射线计算机断层摄影装置,也就是我们现在通常所说的CT(ComputerTomograph)。CT的基本方法就是根据人的截面的投影,经过计算机的处理来重建截面图像,这种技术在图像处理中称为图像重建。与此同时,图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就,如生物医学工程、工业检测、机器人视觉、航空航天、公安司法、军事制导、文化艺术等,使图像处理成为一门引人注目、前景远大的学科。随着图像处理技术的深入发展,从70年代中期开始,计算机技术和人工智能、思维科学的研究迅速发展起来,取得巨大的进步,数字图像处理技术开始向更高、更深层次发展。人们开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界的功能,被称为图像理解或计算机视觉。¨1对图像进行分析和理解基本包括下面几个环节:1.首先需要对图像进行分割,也就是将不同类别的东西分开。2.其次在分割的基础上提取各个区域的特征。3.识别图像中感兴趣的目标区域,或者对图像中的特征区域进行分类。4.对图像进行描述和解释,找出近似的结构,或者将相关区域连接成有意义的结构。在上面这个过程中,图像的分割结果是影响后续工作能否正确进行的前提,是对图像进行视觉分析和模式识别的基础。1.1.2图像分割技术图像分割就是把图像分成各具特性的区域,并提取出感兴趣目标的技术。图像分割在很多领域(包括工业,精密仪器,农业,医学医疗)都有着非常广泛的应用,并涉及各种不同类型的图像。例如,在当今现代化的生产企业,计算机视觉检测正在逐步代替人类的肉眼检测和触摸检测,成为不可缺少的环节,像药品的包装是否正确,纺织品是否存在质量上的缺陷,产品原料是否存在混入的杂质等等,以前都需要众多的检测工人通过肉眼或结合显微镜等设备进行观测检验,大量的人工检测不仅影响工作效率,而且带来不可靠的质量因素,直接影响产品质量与成本。在有些环境下,例如食品生产和药品生产,必须要尽量减少人为的介入。除此以外,许多检测不仅需要一个判断,而且需要准确获取检测数据,比如零件的长度、宽度、厚度等,有时候,还要求这些数据必须满足一定的可重复性,即多次检测同一数据结果差异不大,这些都是人工检测很难完成的,需要借助于计算机视觉技术。在这些应用中,图像分割通常是为了进一步对图像进行分析、识别处理而必不可少的前期工作,分割的准确性直接影响后续任务的有效性和正确性,因此具有十分重要的意义。为了说明图像分割技术在图像处理技术中所处的地位,我们需要引入图像工程这个概念。在广义上讲,图像技术是指所有与图像有关的处理技术的总称,而与之有关的技术不仅包括图像的采集、获取、编码、存储、传输等基本的技术,还有合成、变换、增强、修复、重建、分割、识别等实用性技术,以及近几年来提出的描述、分析、索引、分类、检索等等一系列新技术。正是由于图像技术近年来得到极大的重视和长足的发展,不断涌现新方法、新技术、新手段、新设备,因此人们认为需要将图像技术进行综合,集成到一个整体框架下,那就是图像工程。图像工程内容丰富,人们根据抽象成度和研究方法把它分为三个层次:图像处理、图像分析、图像理解。如图1.1所示:2符号.,/操作对象目标。、、.像素图1.1图像工程框架[21其中图像处理着重强调在图像之间进行变换以改善图像的视觉效果为目的,图像分析则主要是对图像中感兴趣的目标进行监测和测量,以获得它们的客观信息从而建立对图像的描述。图像理解的重点是在图像分析的基础上,进一步研究图像中各目标的性质和它们之间的相互联系,并得出对原始成像客观场景的解释,从而指导和规划行动。我们由此可以看出,图像处理、图像分析和图像理解具有不同的操作对象,图像处理是比较低层次的操作,它主要在图像像素级上进行处理,处理对象是具有亮度信息和颜色信息的一个个像素点;而图像分析则进入了中层,处理对象是组成图像内容的目标,侧重于对像素集合目标的表达、测量、描述;图像理解是高层操作,基本上是对从描述中抽象出来的数据符号进行运算推理。在对图像的研究和应用中,人们往往对图像中的局部内容感兴趣,这些部分常被称为前景目标而其他部分称为背景,前景目标一般对应图像中特定的、具有独特性质的区域,为了识别和分析目标,需要将它们从图像中分离提取出,只有完成这个任务,才有可能对目标进一步利用。图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程,这里的特性可以是像素的灰度、颜色、纹理等单独或者综合的特征。‘11‘211.1.3题目研究意义由前面的论述,我们知道,图像分割是由图像处理过渡到图像分析的关键步骤,在图像工程中占据重要的位置。一方面,它是图像前景目标表达的基础,对特征测量有重要的影响,另一方面,因为图像分割及其基于分割的目标表达、特征提取和参数测量等一系列技术环节将原始图像转化为更抽象、紧凑的形式,使得更高层的图像分析和理解成为可能。在实际生产生活中,图像分割的应用也非常广泛,几乎出现在有关图像处理的所有领域,包括卫星云图的处理、脑部MR图像分析、在交通管理中违章车辆车牌区域的分割以及在面向对象的图像压缩和基于内容的图像检索中特征区域的提取。在这些应用中,图像分割通常是为了进一步对图像进行分析、识别、压缩编码等处理,区域提取的准确性将直接影响后继任务的有效性,因此分割的方法和精确程度是至关重要的。综上所述,图像分割技术的研究是非常具有学术价值和实用意义的,其深入研究不仅会不断完善对自身问题的解决,而且必将推动模式识别、计算机视觉、人工智能等计算机科学分支的发展。1.2图像分割技术的发展现状多年来,对图像分割的研究一直是图像技术研究中的热点和焦点,由于图像分割在实际工作生活中的广泛的应用,人们对它的关注和投入不断提高。作为一种重要图像分析技术,在计算机视觉和图像识别的各种应用系统中占有相当重要的地位,也是研究计算机视觉系统、字符识别和目标自动获取等图像识别和理解系统首先要解决的问题。对图像目标进行提取、测量等都离不开图像分割。虽然几乎自数字图像处理问世不久就开始了图像分割的研究,吸引了很多研究人员为之付出了巨大的努力,在不同的领域也取得了相当的进展与成就,但是同时它也是一个经典难题,人们尽管己经提出了大量的算法,但是到目前为止既不存在一种通用的图像分割方法,也不存在一种判断是否分割成功的客观标准。人们至今还一直在努力发展新的、更有潜力的分割算法,以期实现更通用、更完美的分割结果。虽然目前针对各种具体问题己经提出了许多的分割算法,甚至对图像分割的效果也有大量的的分析结论。但是,由于图像分割问题所面向领域的特殊性,而且问题本身具有一定的难度和复杂性,对于寻找一种能够普遍适用于各种复杂情况的准确率很高的分割算法,还有很大的探索空间。1.2.1阈值分割方法阈值分割方法是最早提出的图像分割方法之一,具有简单、快速的优点。基本思想是先确定一个处于图像灰度取值范围之中的灰度阈值,然后将图像中各个象素的灰度值都与这个阈值相比较,并根据比较结果将对应的象素分为两类,这两类象素一般分属图像的两类区域,从而达到分割的目的。显然对于阈值分割方法,确定一个最优阈值是分割的关键问题,现有的大部分算法都是集中在阈值确定的研究上。阈值的选取可以根据图像自身的特点分为单阈值和多阈值选取,也可根据象素值的图像区域的取值特征选取。近年来人们提出许多选取的阈值的方法,主要有:直方图与直方图变换法、最大类空间方差法、最小误差法、均匀化误差法、共生矩阵法、最大熵法、简单统计法与局部特性法、概率松驰法、模糊集法、特征空间聚类法、基于过渡区的阈值选取法等。不管采取什么方法,结合什么工具,基本思想是一致的,4就是为了寻求最佳阈值。Ⅲ‘911.2.2边缘检测方法当眼睛看一个物体时,如果亮度好、物体的边界清晰,就会很容易的把物体分割成区域分明的若干个部分。相反,如果亮度不好,或者是亮度在逐渐的变化,就不能很好的分割这个区域。然而,如果此区域有亮度突变,眼睛就立刻能感受到边缘的存在。图像分割的一种重要途径是通过边缘检测,即检测灰度级或者结构具有突变的地方,表明一个区域的终结,也是另一区域开始的地方。这种不连续性称为边缘。不同的图像灰度不同,边界处一般有明显的边缘,利用此特征可以分割图像。边缘提取和分割是图像分割的经典研究课题之一,但是,一直到现在,目前的理论和方法仍存在许多需要改进的地方,仍然在不断改进和发展。边缘检测算法主要是基于图像的灰度函数求导和在图像中匹配特定的边缘模型这两种方法,在具体做法上表现为空域算子与图像模板求卷积和用迭代等方法求匹配函数的系数等。根据检测边缘采用方式的不同,边缘检测方法大致包括以下几类:基于局部图像函数的方法、多尺度方法、图像滤波法、扩散方程的方法、基于边界曲线拟合方法、状态空间搜索法、动态规划法、边界跟踪法、哈夫变换法等。u11.2.3区域提取方法区域提取法有两种基本形式:一种是从单个象素出发,逐渐合并以形成所需的分割区域;另一种是从全图出发,逐渐分裂切割至所需的分割区域。在实际中使用的通常是这两种基本形式的结合。根据这两种基本形式,区域提取法可以分为区域生长法和分裂合并法。区域生长法的基本思想是将具有相似性质的象素合起来构成区域,具体做法是选给定图像中要分割的目标物体内的一个小块或者说种子区域,再在种子区域的基础上不断将其周围的象素点以一定的规则加入其中,达到最终将代表该物体的所有象素点结合成一个区域的目的。该方法的关键是要选择合适的生长或相似准则。生长准则一般可分为三种:基于区域灰度差准则、基于区域内灰度、分布统计性质准则和基于区域形状准则;分裂合并法是先将图像分割成很多的一致性较强的小区域,按一事实上的规则将小区域融合成大区域,达到分割图像的目的。¨¨¨411.2.4结合特定理论工具的方法近年来随着各学科新理论和方法的产生,人们也提出了许多结合特定理论工具的分割方法,例如基于数学形态学的分割方法,基于统计模式识别的分割方法,基于神经网络的分割方法,基于信息论的分割方法,基于模糊集合和逻辑的分割方法,基于小波分析和变换的分割方法,基于遗传算法的分割方法等。‘61m‘盯1.2.5图像分割评价嘲图像分割的评价与图像分割方法一样是人们一直讨论的难题,到目前为止还没有一个大家都能接受的分割评价标准。分割评价的目的是为了能指导、改进和提高分割算法的使用性能,同时也为研究新的技术起指导作用。图像分割评价可分为两种情况:(1)掌握各算法在不同分割情况中的表现,通过选择算法参数来适应分割具有不同内容的图像和分割在不同条件下采集到的图像需要。(2)比较多个算法分割给定图像的性能,以帮助在具体分割应用中选取合适的算法。这两方面的内容是相互关联的,分割评价不仅可以提高现有算法的性能,对研究新的技术也具有指导意义。为此对评价方法的基本要求有:(1)应该具有通用性,适于评价不同类型的分割算法并且适合各种应用领域情况。(2)应采用定量的客观的性能评价准则。(3)应选取通用的图像进行测试使评价结果具有可比性。1.2.5图像分割技术研究的趋势虽然近年来研究成果越来越多,但由于图像分割本身所具有的难度,使研究没有大的突破性的进展,仍然存在的问题主要有两个:一是没有一种普遍使用的分割算法,二是没有一个好的通用的分割评价标准。从图像分割研究的历史来看,可以看到对图像分割的研究有几个明显的趋势:(1)对原有算法的不断改进。(2)新方法、新概念的引入和多种方法的有效综合运用。人们逐渐认识到现有的任何一种单独的图像分割算法都难以对一般图像取得令人满意的分割效果,因而很多人在把新方法和新概念不断的引入图像分割领域的同时,也更加重视把各种方法综合起来运用。(3)交互式分割研究的深人。由于很多场合需要对目标图像进行边分割边分析,例如对医学图像的分析,事实证明交互式分割技术有着广泛的应用。(4)对特殊图像分割的研究越来越得到重视。目前有很多针对立体图像、彩色图像、多光谱图像、运动图像、视频图像中目标分割、计算机断层扫描(CT)、磁共振图像、共聚焦激光扫描显微镜图像、合成孔雷达图像等特殊图像的分割技术的研究。(5)对图像分割评价的研究和对评价系数的研究越来越得到关注。61.3论文的主要工作内容论文首先在第一章详细论述图像分割技术在图像工程中的地位、研究的意义和发展现状。其次在第二章对图像分割的基本理论包括图像分割的定义、基于边缘检测技术的图像分割方法的基本步骤和并行边界的基本技术原理进行了系统介绍。论文的主要内容从第三章开始,对基于边缘检测技术的图像分割的实现过程中关键技术环节采用的方法及其改进进行了讨论,主要包括:微分算子定位边界的比较;为提高抗噪能力,对微分算子的扩展,采用DCT变换技术对高频区域平滑处理,提高分割效果:采用形态学变换方法进行边界闭合,连接不连贯的边界片段。第四章利用色度信息,采用基于子块的区域生长算法,拟合边缘子块和亮度边界,消除对纹理区域的过度分割。第二章基于边缘检测的图像分割的基本理论2.1图像分割的定义‘11图像分割是从图像处理进入到图像分析的关键步骤,也是一种基本的计算机视觉技术,这是因为图像的分割、目标的分离、图像特征的提取、参数测量使原始图像转化为更抽象更紧凑形式,使高层的分析和理解成为可能。所谓图像分割,从总体上说,就是把图像分成若干有意义的区域的处理技术,这些区域互不交叠,每一区域内部的某种特性或相同或接近,而不同区域间的图像特征则有明显差别,即同一区域内部特性变化平缓,相对一致,而区域边界处则特性变化比较剧烈,区域内的所有像素是一个连通集,在一个连通集中任意两像素之间,都存在一条完全由这个集合元素构成的连通路径,连通路径是一条可在相邻像素间移动的路径。可借助集合概念用如下比较正式的方法定义:令R代表整个图像区域,对R的分割可以看作是将R分成N个满足以下五个条件的非空子集,R.,…,RⅣ:oUR,=R;i=l②对Vi,J,isj,有R,nRj=a;③对i=l,…,N,P(R,)=TRUE;④对Vi,j,i≠J,有P(RfUR,)=FALSE:⑤对i=l,…,Rj是联通区域;其中R是连通区域,其中P(R,)是对所有在集合R,中的元素的逻辑谓词。上述条件1指出:分割结果中全部子区域的总和应能包括图像中所有像素,或者说图像中每个像素都分进某个子区域。条件2指出:分割结果中各个子区域是互不重叠的。条件3指出:分割结果中每个子区域的像素具有相同特性。条件4指出:分割结果中不同的子区域具有不同的特性。条件5指出:分割结果中同一个子区域内的像素是连通的。最后一个条件并非必要,因为要分割的对象未必一定是连通的。当然,如果把对象不连通的部分看作是不同的子对象,那么这个条件就是必要的。82.2图像的特征如何将图像分割成具有独立特性的区域呢?回答是利用图像的特征。图像有那些特征?在图像处理技术中,图像的特征指图像中可用做标志的属性,可以分为图像的统计特征和图像的视觉特征。图像的统计特征指的是一些人为定义的特征,通过变换才能得到,如图像的直方图:图像的视觉特征指的是人的视觉可以直接感受到的自然特征,如区域的亮度,纹理或轮廓等。利用这两类特征把图像分解为一系列有意义的目标或区域的过程就是图像的分割。221图像的统计特征灰度直方图是一个二维结构的图表,用于描绘图像各灰度值的统计特性,显示各个灰度级出现的次数或概率。如图2.1,其横坐标表示图像的灰度值,取值范围是。到255。其纵坐标则通过高度来表示灰度值出现次数的多少或者概率的高低。通过直方图,我们可以分析图像的特点,例如,高亮度图像,整个画面的颜色偏亮,故灰度直方图偏向灰度高的一侧,相反,低亮度图像的直方图则偏向灰度较低的一侧;在高对比度的图像中,直方图的覆盖范围很广,因为图像在任意一段灰度范围中都有一定的像素数量,因此其灰度分布相比其它图像而言较为均匀,整个直方图显得比较平滑,而低对比度图像的灰度则主要分布在中间狭窄的区域中。a)茸方图(b)原囤图2l灰度直方图实例222图像的视觉特征图像的视觉特征有很多t图像中的颜色、图像中的纹理、图像中物体的形状、图像中物体的空间关系,这些特征与图像中的内容有密切关系。2.2.2.1图像的颜色特征m1颜色是图像的一种重要视觉性质。图像系统中存在着多个颜色模型,对颜色的特征表达依赖于所用的颜色模型,并不是所有的颜色空间都与人的感觉相一致。所以,对特定问题,要选择合适的颜色模型(颜色模型问题参见论文第四章的论述)。常用的颜色模型主要有两类:一类是面向硬件设备(CRT显示器,LED显示器,投影仪,扫描仪,打印机等)的颜色模型,另一类是面向视觉感知的颜色模型。对图像中颜色的表达方法有许多种,如直方图法,累计直方图方法,局部累加直方图方法,颜色布局法,中心矩方法。得到这些特征后可以通过颜色匹配算法来进行识别分割。2.2.2.2图像中的纹理特征‘例目前对纹理还没有一致的定义,对纹理的感受是与心理效果相结合的,所以用语言文字来描述纹理很困难。纹理可认为是灰度(颜色)在空间以一定的形式变化而产生的图案(模式),是真实图像区域固有的性质之一,任何物体的表面如果一直放大下去进行观察,.一定会出现纹理。纹理是图像的一种区域性质。人类观察到的纹理特征有粒度、方向性和重复性。要描述一个图像中的纹理区域,常使用区域的尺寸、可分辨灰度元素的数目以及这些灰度元素的相互关系。注意到纹理是与尺度有关系的,在某些尺度下看来是纹理的,在更小的尺度下可能不看作是纹理,图像纹理特征的描述模型有很多:1.基于空间性质的纹理模型:图像中的纹理具有某种周期性,也就是说纹理近似的是由纹理基元重复结合产生的,所以真实图像区域可以借助于其中纹理基元的空间尺度来表达纹理。较细的纹理对应小尺度的纹理基元,粗糙的纹理对应大尺寸的基元。利用图像的自相关函数可以表达这种纹理基元的尺度特征。图像中的纹理还有空间分布特征,利用共生矩阵可以表达这种特征,此外另外还有随机分形模型和随机场模型等等。2.基于频率性质的纹理模型:图像正交变换的系数揭示了图像中像素模式之间的相关程度,因此,对于图像功率谱密度函数的频率或者变换系数可以表达纹理特征,粗纹理的空间能量都集中在低频部分,而细纹理对应的频率分量主要集中高频部分,这样就可以用很多工具如小波变换,将图像分成小块,分析不同块的功率谱。3.基于结构性质的纹理模型:图像纹理在视觉上直观看起来是由一些简单的纹理基元按照一定的规律的形式重复排列组合而成的,如果我们能把这种排列的规则描述出来,就可以特征化纹理。102.2.2.3形状特征形状是一种比颜色和纹理要高层的特征。因为黑白电视没有彩色,但是大多数情况下不影响我们对于电视内容的理解,计算机图形学中生成的很多图像并没有纹理,但是大多数情况下也不影响我们对于图像内容的理解。真正与图像内容有重要关系的是图像中物体的形状。表达图像中目标的形状特征的方法有以下几种:l特征方法:比如说全局形状特征的面积、主轴方向、局部形状特征的角点,还有图像中物体的边界特征等等。可以分为两类:(1)内部参数法:利用目标区域中的像素集合。(2)外部参数方法:利用目标区域边界上像素集合。2.关系方法:把目标形状近似分解为一些基本的形状(组元),用这些组元的描述以及它们之间的关系来描述图像中目标的形状。2.2.2.4图像中的空间关系特征二维图像是三维场景通过投影得到的,场景中的物体之间位置和物体之间的相互关系是图像中的重要内容。当然我们关心的是图像中的相对位置,这里称之为空间关系。空间关系表达了图像内部各个部分之间的关系,这种空间关系也可以告诉我们很多信息。空间关系包括:空间位置关系、朝向关系、拓扑关系、结构关系等。2.2.3边缘是图像的重要特征前面说过,图像中物体的形状是描述图像的一个重要特征,因为形状常与目标联系在一起,有语义的含义,因此形状特征要比颜色和纹理特征要高层一些。而图像不同目标区域的形状,是通过目标区域的边缘来体现,边缘广泛存在于物体与背景之间、物体与物体之间、基元与基元之间,因此它是图像分割所依赖的重要特征。通常意义上讲,计算机视觉处理可以看作是为了实现某一任务从包含有大量的不相关的变量中抽取不变量,总之就是简化信息,这就意味着尽可能利用物体的不变性质而要扔掉一些不必要的信息。那些信息具有不变性呢?边缘信息就是最重要的不变性质,光线的变化显著地影响了一个区域的外观,但是不会改变它的边缘。例如:一副画面里有一个桌子,由于拍摄光线的变化或后期处理的结果,会呈现出不同的颜色,但对于人的视觉系统,并不因为颜色的不同而把它看成其它的东西,这里人的视觉系统判断的依据应该是形状特征。而三维世界中物体的形状反应N--维世界中,正是通过图像边缘特征来体现,更重要的一点是人的视觉系统也是对边缘很敏感。边缘是指周围像素灰度有阶跃变化或屋顶变化的那些像素的集合。或许对应着图像中物体的边界或许并没有对应着图像中物体的边界,但是边缘具有十分令人满意的性质,它能大大地减少所要处理的信息但是又保留了图像中物体的形状信息。常见的边缘点有三种。第一种是阶梯形边缘(Step—edge),即从一个灰度到比它高好多的另一个灰度;第二种是屋顶型边缘(Roof-edge),它的灰度是慢慢增加到一定程度然后慢慢减小。还有一种是线性边缘(Line-edge),它的灰度从一级别跳到另一个灰度级别之后再回来。』—r阶梯形边缘j线性边缘屋顶式边缘图2.2边缘类型各种不同的边缘有不同的特征。在大部分情况下,我们都是把图像的边缘全部看作是阶梯形边缘,然后求得检测这种边缘的各种最优滤波器,然后应用在实践中。边缘检测主要是(图像的)灰度变化的度量、检测和定位,检测到边缘,也就可以根据边缘信息对图像区域进行有效的分割提取。有很多种不同的边缘检测方法,同一种方法使用的滤波器也不尽相同,边缘检测就是研究更好的边缘检测方法和检测算子。应用最广泛的方法主要是检测梯度的最大值和二阶导数的零交叉点。1检测梯度的最大值:由于边缘发生在图像灰度值变化比较大的地方,对应连续函数,就是函数变化较快的地方,所以研究比较好的梯度算子就成为一种思路。Roberts算子、Prewitt算子和Sobel算子等就是比较简单而常用的例子。2检N-阶导数的零交叉点:边缘处的梯度取得最大值,也就是灰度图像的拐点是边缘,从数学分析上我们知道,拐点处函数的二阶导数是0。此外,随着小波分析的迅速发展,小波开始用于边缘检测,作为研究非平稳信号的利器,当然还有其它一些方法,比如说模糊数学的方法、基于积分变换的边缘检测方法等,那种方法是比较好呢?一般地说这个问题是没有意义的,因为方法好不好依靠具体的应用领域。但是这些不同的领域之间还是存在着一些共同要求。n12.3梯度算子b1梯度是函数变化的一种度量,在一维情况下,阶跃边缘同函数的一阶导数局部峰值有关,而一幅图像可以看作是图像灰度连续函数f(x,y)的采样点阵列,在位置(x,y)的梯度可以表示成一个矢量,假设用G,和GY来表示f(x,y)’沿着x方向和Y方向的梯度,那么梯度矢量可以表示为公式(2.1):可(x,y)Gcx,y,=[善]=苏可(x,y)砂.(2.1)梯度方向是图像灰厦值变化最侠的方向,令g表不梯度方同:g(w)=argtan(o%,)在g方向的变化速度为下面公式定义:(2.2)咖)=√(掣Ox)2+掣)2Y(2.3)劣在实际应用中通常用绝对值或取最大值来逼近:g㈦加l(掣)+(掣]|max[1(掣)1,l掣口达式为公式:G,=If(x,y)一f(x+l,Y)IG.r:If(x,y)一f(X,y+1)l(2.4)(2.5)对于数字图像,公式2.6的一阶偏导可用向后差分来近似,最简单的梯度近似表(2.6)(2.7)这些计算可用简单的lx2和2xl卷积模板来完成,但是在计算梯度时,计算空间上同一位置X和y处的真实偏导数是至关重要的。然而采用上面公式计算的梯度近似值G;和G,并不位于同一位置,G。实际上是内插点(x+l/2,y)处的梯度近似值,G,是内插点[x,y+l/2]处的梯度近似值,由于这个缘故,人们常常使用2x2一阶差分模板而不用lx2或2xl模板来求X和Y的偏导数:G,=|=:|G,=¨1』汜8,用上式计算X和Y方向梯度的位置是相同的,即在2x2邻域的所有四个像素点之间,不过这种计算可能会导致一些混淆,所以,通常用3x3模板计算梯度值。常用的梯度算子有Robert算子,Sobel算子,Prewitt算子。它们都是模板运算,运算时,对图像进行扫描,把模板中心与图像的每一个象素相对应,然后用与模板对应的公式,对中心点及其周围点的象素值进行运算(当然,根据模板的不同,靠近图像边界的几行或几列不能进行这种运算),得出的结果即可作为输出图像中对应点的象素值。2.3.1Roberts算子Roberts边缘检测算子是一种利用局部差分算子寻找边缘的算子,如下所示:g(i,j)=IA,f(i,j)l+I△,f(i,j)I其中△,f(i,j)和△,f(i,j)为一阶差分:△,f(i,J)=f(i,j)一f(i+l,j+1)△。f(i,j)=f(i+l,j)一f(i,j+1):Robets算子所对应的模板如图2.3所示。(2.10)(2.11)(2.9)0一11O图2.3Robets算子模板从上面模板的形式可以看出,Roberts计算时利用的像素数一共有4个,Roberts算子边缘定位准,但是对噪声敏感。适用于对比度高、边缘明显而且噪声较少的图像分割,例如二值图像。2.3.2SobeI算子Sx={厂(x+1,y—1)+2厂(x+1,少)+厂(x+l,y+1))一(2.12)Sy2{f(x-1,y一1)+2厂(x,y一1)+厂(x+1,y一1))-(2.13)吁雕㈠剖还可以对这两组滤波器进行旋转得到两个倾斜方向的梯度算子,旋转后的Sobel算子的模板如下:14。=-10卜㈥2.3.3Prewitt算子s,=[;}毫}]s,=[j:,.>]2.4二阶导数算子前面讨论了计算一阶导数的边缘检测方法,如果所求的一阶导数高于某一阈值,则确定该点为边缘点,这样做会导致检测的边缘点太多。一种更好的方法就是求梯度局部最大值对应的点,并认定它们是边缘点,如图2.7所示。图2.7梯度局部最大值在图2.7中,若用阈值来进行边缘检测,则在a和b之间的所有点都被记为边缘点。但通过去除一阶导数中的非局部最大值,可以检测出更精确的边缘。一阶导数的局部最大值对应着二阶导数的零交点,这意味着在边缘点处有一阶导数的峰值,就会有二阶导数的零交叉点。这样,通过找图像灰度的二阶导数的零交叉点就能找到边缘点。一般来讲,图像处理的过程中,对图像可以采用差分方法计算三阶或者更高阶导数,但是因为噪声的影响,三阶以上的导数信息往往失去了应用价值,所以实际中的图像分割,往往只用到二阶导数。由于利用了二阶微分信息,所以对噪声更加敏感。解决的方法是先对图像进行平滑滤波,消除部分噪声,再进行边缘检测。2.4.1拉普拉斯算子拉普拉斯算子是二阶导数的二维等效式,函数f(X,Y)的拉普拉斯算子公式为V2/=筹+万02f使用差分方程对X和Y方向上的二阶偏导数近似如下:(2.14)窑:冬一w【f,川卜几巾咖‘劣一——————■=_—————一C%缸缸(2.15)---(f[i,/+2卜2f[i,/+l】)+九f,歹】这一近似式是以点[i,j+1]为中心的。用j-1替换J,得到罢三≠:(厂【f,/+1】一2f[i,/】)+f[i,,一1】办‘—0万2f:(/p+l,jJ-2f[f,/】)+f[i—l,/】咖‘(2.16)(2.17)儿㈠]16结果可能不会很精确。2.4.2拉普拉斯高斯算法正如上面所提到的,利用图像强度二阶导数的零交叉点来求边缘点的算法对噪声十分敏感,所以,希望在边缘增强前滤除噪声。为此,Marr和HiIdreth将高斯滤波和拉普拉斯边缘检测结合在一起,形成LoG(LaplacianofGaussian)算法,也称之为拉普拉斯高斯算法。LoG边缘检测的基本特点是:(1)首先与高斯滤波器进行卷积,这一步既平滑了图像又降低了噪声,孤立的噪声点和较小的结构组织将被滤除。(2)用二阶导数(二维拉普拉斯函数)增强。(3)边缘检测判据是二阶导数零交叉点并对应一阶导数的较大峰值,为了避免检测出非显著边缘,应选择一阶导数大于某一阐值的零交叉点作为边缘点。(4)使用线性内插方法在子像素分辨率水平上估计边缘的位置。LoG算子的输出h(x,y)是通过卷积运算得到的:h(x,y)=V2【g(x,Y)宰/(x,y)】根据卷积求导法有(2.18)h(x,y)=【V29(x,y)】幸/(x,y)其中:vz龇加f,掣l等L6(2.19)/称之为墨西哥草帽算子。这样,下面两种方法在数学上是等价的:(1)求图像与高斯滤波器卷积,再求卷积的拉普拉斯变换。(2)求高斯滤波器的拉普拉斯变换,再求与图像的卷积。如果采用第一种方法,就可能用到高斯平滑滤波器。直接实现LoG算法的典型模板见图2.9:O0—100O—1—2—10一1—216—2—1O—1—2一1O00一O0图2.95*5拉普拉斯高斯模板滤波、增强、检测这三个边缘检测步骤对使用LoG边缘检测仍然成立,其中平滑使用高斯滤波器来完成的;增强是将边缘转换成零交叉点来实现的;边缘检测则是通17过检测零交叉点来实现的。‘812.5基于边缘检测的图像分割基于边缘检测的分割方法是一种历史悠久并且应用广泛的分割方法。通过检测不同均匀区域之间的边界来实现对图像的分割。通常把边缘检测方法分为两类,即串行或顺序的边缘检测技术和并行的检测技术。串行技术首先要检测出一个边缘起始点,然后,根据某种相似性准则寻找和前一点同类的边缘点,这种确定后续相似点的方法又称为跟踪。并行边缘检测方法可以使每个象素点是否为边缘点的检测同时在每个像素上进行,因而可以大大加快搜索检测的时间,本文主要讨论并行检测技术。2.5.1图像的预处理由于得到的原始图像通常包含了许多噪音,所以在分割前要对原始图像进行预处理,也就是通过一定的手段将原始图像的噪音去掉,突出感兴趣部分的过程。本文主要采用了以下几种方法2.5.1.1直方图均衡化灰度直方图均衡化是数字图像处理总图像点变换的一种常用方法,其目的是变换灰度的统计直方图使得在输出的图像中每种灰度大致有相同的点数,这样输出的图像看上去会比较清晰。一副图像中灰度级%出现的概率近似表示为:Pr(%):鱼,k:0,1,2,3,4,...,三一1甩(2.20)其中,n是图像中像素的总和,仇是灰度级%的像素个数,L为图像中可能的灰度级总数,将输入图像中的灰度级为rk的各像素映射到输出图像中灰度级为&的对应像素。变换函数的表示形式为:&=丁(%)=∑p奶),=∑等,k=o,1,2,3,4,...,£一1j=01=0,‘(2.21)18(a)原网(b)扶度拉伸后的图像图2】2灰度拉伸2.5.1.3图像的平滑图像平滑主要是为了消除噪声。噪声并不限于人眼所能看的见的失真和变形,有些噪声只有在进行图像处理时才可以发现。图像的常见噪声主要有加性噪声、乘性噪声和量化噪声等。图像中的噪声往往和信号交织在一起,尤其是乘性噪声,如果平滑不当,就会使图像本身的细节如边界轮廓、线条等变的模糊不清。一般来说,图像的能量主要集中在其低频部分,噪声所在的频段主要在高频段,同时图像分割处理中要提取的边缘信息也主要集中在其高频部分,因此,如何去掉高频干扰又同时保持边缘信息,是本文研究的内容。为了去除噪声,有必要对图像进行平滑,可以采用低通滤波的方法去除高频干扰,本文采用基于正交变换的方法对图像进行预处理,具体实现过程参见第三章。2.5.2边缘检测边界存在于目标与背景、目标与目标、区域与区域之间,它是图像最基本的特征,包含了用于分割的基本信息,在实际应用中,正如前所述,通常就是利用简单的卷积核来计算方向差分,不同的算子对应不同的卷积核,它们产生的两个偏导数在图像一个点上用均方值或绝对值求和的形式结合起来,一旦估计出梯度值,将梯度值与某个给定的阈值比较来判断是否存在边缘,如果梯度值大于这个值,就认为存在边缘。显然,阈值的选择是很重要的,在含噪声的图像中,阈值的选择是一个涉及在丢失有效边缘和由于噪声所造成的错误边缘之间进行折衷考虑的问题。2.5.3边界闭合由于噪音或者阈值选取的问题,运用各种算子得到边缘像素常常是孤立或者分小段连续的,为了组成区域的封闭边界,而达到分割的目的,需要将边缘像素连接起来,前面介绍的边缘检测算子是并行工作的,通常希望边缘连接的工作也可同时并行的完成,可以利用像素梯度的幅度和方向进行边界闭合的运算。通常边缘像素连接的基础是它们的相似性,我们理想的认为同一区域的边缘的梯度相似,相邻边缘片段的方向类似,如果像素(X,Y)和(S,T)的梯度幅度和角度小于一定的幅度阈值和角度阈值,那么就将这两个像素连接,如果所有的边缘像素都做这样的处理,就有希望闭合边界片段。这种方法可以连接较近的间断边缘,由于可以与边缘检测同时并行进行,速度较快,运算简单,但是会产生伪边界。本文采用基于数学形态学的方法实现边界闭合,具体过程参见第三章。20第三章基于边缘检测的灰度图像分割的实现人类的视觉系统不仅具有对边缘敏感的特性,相对于颜色而言,对亮度信息更加敏感,因此在许多图像的传输系统和存储系统中都给亮度分配较多的传输带宽和样本宽度,而前面介绍的梯度算子,最早也是应用于灰度图像,即处理的是亮度信息,因此在许多的图像分割应用系统中,都是将彩色图像经灰度转换处理成灰度图像再进行分割,而图像中的边界信息并不因为这种转换而丢失。本文下面主要就基于边缘检测的灰度图像分割的三个步骤:预处理、边缘检测、边界闭合所选取的具体技术方法进行论述。针对如何提高分割算法的抗噪能力和计算效率确定每个环节的技术方案。3.1图像的预处理3.1.1灰度转换将彩色图像转变成灰度图像的过程称为灰度转换或灰度化处理。灰度图是指只包含亮度信息,不包含色彩信息的图像,通常将灰度分成0"-'255共256个级别,0最暗(全黑),255最亮(全白)。一般24位真彩色图像,每一个象素包含红(R)、绿(G)、蓝(B)三个分量,三个分量对亮度的影响不同,按如下公式将其转换成亮度信息:F(X,Y)=O.3×R(x,Y)+0.59XG(X,Y)+0.11×B(X,Y)(3.1)上式中F(X,Y)表示象素点(X,Y)的灰度值,R表示象素点(X,Y)的红色分量,G(X,Y)表示象素点(x,Y)的绿色分量,B(X,Y)表示象素点(x,Y)的蓝色分量。通过灰度转换可为计算机快速处理图像信息提供了必要的条件。3.1.2灰度拉伸灰度拉伸是指根据灰度直方图的分布有选择的拉伸某段灰度区间以改善输出图像。如果一副图像灰度集中在较暗的区域而导致图像偏暗,可以用灰度拉伸功能来拉伸物体灰度区间以改善图像;如果图像灰度集中在较亮的区域而导致图像偏亮,也可以用灰度拉伸功能来压缩物体灰度去。在0到255之间按顺序取两个点x1和x2,他们将0-255之间的灰度值划分成[0,x1],[x1,x2]和[x2,255]两个区间内,采用分段式的线性拉伸方程强化前景和背景的灰度差异,通过调整y1,y2点的大小来改变灰度拉伸方程在[0,x1]和[x2,255]区间的斜率,加深背景灰度,增强前景区域,从而增加前景和背景的对比度。本文采用的灰度拉伸的变换函数表示如下:21,(z,,)=YJ22一-JYⅢl(㈠-)+y,(Jl≤,≤j2)(32;;;三皇c…:,+,tz,z:,313基于DCT变换的平滑经典的边缘检测方法是构造对像素灰度级阶跃变化敏感的微分算子,如roberts梯度算子、Sobel梯度算子等,其边缘检测速度快,但得到的往往是断续的、不完整的边界,这类方法对噪声较为敏感,为了有效地抑制噪声,~般都先对原图像进行平滑,再进行边缘捡测就能成功地检测到真正的边缘。一般来说,图像的能量主要集中在其低频部分,噪声所在的频段主要在高频段,同时图像分割处理中要提取的边缘信息也主要集中在其高频部分,因此,如何去掉高频干扰又同时保持边缘信息,是一个比较困难的问题,此外有些图像背景细节较多,直接分割会造成许多零碎的区域,如图3l所示,女孩头发部分造成很多的过渡分割区域,不方便主要区域的提取,鉴于这些原因,本文利用图像正交变换运算,将图像转换至频率域。通过对频率系数量化,过滤消除一些影响分割的细节,如毛发的弯曲、背景中的树叶、以及噪音信号。(a)原月幽3l过度井割丈例3131DCT变换DCT变换广泛应用于图像压缩技术中,在JPEG和MPEG中都有DCT变换的应用,DCT对一个8×8的矩阵进行处理,得到一个8×8的频:#系数矩阵,物理意义是将信号从一种表达形式(空间域,即图像的像素值)变成另一种等同的表达形式(频率域,即频率系数),并且这种变换过程是可逆的,下面公式便是基于8×8的像素矩阵的FDCT(正向DCT)}flIDCT(逆向DCT)的变换模型:rDCT:S。=;%耋弘cos譬乎cos譬磐z唧:s,=;砉褰%s—s—(21x+r1)u’rcos譬竽慨。,c。t,其中,S。是DCT变换后DcT块中的系数,s。是DcT变换前块中的系数,其中(t曲(且神都表示块中系数的坐标。这里,当“r=o时,c.c:娄,其他情况下,£,£=1。如图32所示,这是一个DCT变换实例,图a是8×8像素的放大图像。图B是像素矩阵的灰度矩阵,图c是DCT变换结果BPDCT系数矩阵,矩阵中每个元素称为变换系数,这些系数都有明确的物理意义,(0行,o列)的值称为直流(DC)系数,它与数组的平均值有关。其余的值称为交流(AC)系数。随着行数和列数的增加,相应系数分别代表逐步增加的水平空间频率分量和垂直空间频率分量的大小。__一4={0000口f口0000[)LaJ~DJLc,圈32I)CT变换实例图DCT变换有很多的特性在图像处理中可以应用,在本文中主要应用它的能量集中性,即原始图像经DCT变换后.能量主蔓集中在左上角区域(即直流、低频和中频区),而右下角区域(即高频区)的能量分布比较弱,在图像压缩领域,JPEG和MPEG利用这个特性在图像质量不失真的前提下使数据得到了压缩,既然图像质量能够不失真,说明主要边界信息能够保留,损失的是一些微小的细节。3.1.32基于DCT变换的平滑常用的平滑技术主要采用局部平均法,其基本思想是利用像素邻域内的像素的平均灰度值代替该像素原来的灰度值,实现图像的平滑,最简单的局部平均法就是非加权邻域平均,它均等地对待邻域中的每个像素,该算法简单,计算速度快,但主要缺点是在降低噪声的同时使图像模糊,特别在边沿和细节处,相邻区域取的越火,模糊程度越厉害。本文采用的基于DCT变换的平滑,对不同频率的系数根据人视觉系统特征分配不同的量化步长,消除视觉系统不敏感的频率,消除高频噪音同时保持图像主要能量区域特征。处理过程如图3.3所示。读入图像上将图像划分成8×8子块J以子块为单位进行FDCTJI对FDCT结果进行量化JI以子块为单位进行ID输出图像cT图3.3基于OCT变换的平滑的处理过程图量化过程为对64个DCT系数除以量化步长并取整,量化步长由量化表(量化矩阵)决定,量化表本文选择3PEG中的亮度分量Y的量化矩阵,如图3.4所示,左上角的量化步长都比较小,右下角的量化步长较大,这样量化后,高频系数为零,在压缩应用中,大部分高频系数零值化后,可提高压缩效果,但是对于分割处理是为了消除噪音,平滑图像。图3.5给出了变换实例。ll12lO141624405857871091041211005l6l555662779210l991924295664879826405l6881103112606980103113120103珩挖M1317223564162237557895M堪M纷铊925图3.4量化矩阵24置文有图像法,微子对图分分0飘一一黼■一■僦薰■一■瓯羹■~■C)prewit算子处理后的图片(D)log算子处理后的图片图3.6基于微分算于的边缘检测由上面的处理实例我们看出.微分算子对噪音是相当敏感,尤其是二阶差分算予,而且对于连续色调的图像,存在过度分割和边界不连续等缺点,本文为下面章节主要从提高抗噪能力.消除过度分割这几个方面提出一些方法。322扩展微分算子增强抗噪性前面提到的这些微分算子,都具有下面的特点:(1)每一个模板中所有数据的和都是零,在灰度为常数的区域,这些微分算子卷积的结果都是零。(2)这些算子的模板大小都不超过3x3,并且模板中的数据都是很简单的数。所以,使用这些算子可以十分快速的计算图像微分。另外,Prewitt算子、Sobel算子以及各向同性的Sobel算子以及拉普拉斯算子都具有很好的对称性。但是,对于噪声比较大的图像,3X3模板中简单的三个数字加权平均,然后求差仍然对噪声5、7×7和99等很敏感。直观上,为了更好的抑制噪声,需要更大范围的加权平均然后求差分,这就得到了扩展的差分算子。考虑到算子的对称性,只使用55模板,对图35处理结果如图38所示。——3——4—4—6—6—1246000004312343464l一20214641XX大小的模板,扩展的算子计算相对复杂,速度要慢一些,本文使用如图37所示5×4—86一124—8175x000081282—.3——43—2图35模板图385×5模板处理后的图片Lap]-cian算子模板也可以进行扩展,以更好的抑制噪音。常见的有F面两种,这些扩展的模板,由于平均的范围扩大,对噪声的抑制更好,但是计算速度会变慢一1一1—1—1一l—124—1—1一l—1一1—1X—1—1图3.9Laplician算子5一l一l一l5模板一1一1一1—1一1一1—1昼7)=48一l一l—1图3.10Laplician算子7×7模板扩展微分算子在一定程度上增强了对噪音的抵抗能力,但是能够看出边缘检测的结果图像中,边界存在许多不连贯的地方,需要进行边界的闭合,只有闭合了边界,才能够以提取目标区域或以某种方式表达区域的形状。边界闭合的方法很多,本文采取数学形态学的闭运算来完成这个工作。3.3基于数学形态学的边界闭合数学形态学的算法具有天然的并行实现的结构,实现了形态学分析和处理算法的并行,大大提高了图像分析和处理的速度,数学形态学基本思想是利用一个称作结构元素的”探针”收集图像的信息,当探针在图像中不断移动时,便可考察图像各个部分之间的相互关系,从而了解图像的结构特征.数学形态学基于探测的思想,与人的的视觉特点有类似之处.作为探针的结构元素,可直接携带知识(形态,大小,甚至加入灰度和色度信息)来探测,研究图像的结构特点。数学形态学所涉及的变换或运算、概念和算法不同于常用的空域或频域方法,它是建立在积分几何以及随机集论的基础之上的。3.3.1数学形态学基本算法1、腐蚀与膨胀运算腐蚀是最基本的一种数学形态学运算,对一个给定的目标图像X和一个结构元素B,将B在图像上移动,在每一个当前位置X,B[X]只有三种可能的状态,见图3.11。27B【D】B【Iz】门匕。翻图3.11腐蚀运算在第一种情形中,BEx]与X的相关最大;在第二种情形中,BEx]与X只是部分相关。因此,满足第一种情形的点x的全体构成结构元素与图像的最大相关点集,定义它为B对X的腐蚀操作,记为XoB,在形式上定义为XoB={XB[xl-_X)上所有点都在X的范围内,则该点保留,否则将该点删除。腐蚀可以看作是将图像X中每一个与结构元素B全等的子集B[X]并行地收缩为点X。那么反过来,我们也可以将X中每一个点X扩大为B[x],这就是膨胀运算,记为XeB,定义如下:XeB={XI矗[X]nX≠0}其中盖表示B关于坐标原点的反射。2开运算(3.6)(3.5)腐蚀的方法就是将结构元素B中的点与目标图像X上的像素点逐一对应,倘若B在腐蚀和膨胀这两种基本运算的基础上,我们可以构造出形态学的运算族。其中两个最为重要的组合运算是形态学开和闭。对图像X及结构元素B,用XoB表示X对B的开运算,它定义为:XoB=(XOB)审B(3.7)图3.1l演示了开运算的过程,图3.12(a)为原始图像X,图(b)为3x3正方形结构元素B,图(c)为腐蚀结果图像,图(d)为在此基础上膨胀的结果。可以看出,原图像经过开运算后,一些孤立的散点被消除了。一般来说,开运算能够去除孤立的散点、毛刺和小桥(即连通两块区域的小点),而总的位置和形状不变。因此,XoB可视为对图像先腐蚀运算(XOB)再进行膨胀运算来进行恢复,不过这种恢复不是信息无损的,即结果通常不等于原始图像。疆(·)原籀图像I“)括构元素-I23456T8【c)囊蚀图像z9■图3.12开运算不例由开运算的定义式,我们可以推导出:XoB=盛xBVx](3.8)因而,XoB由所有X的与结构元素B全等的子集的并组成,或者说对XoB中的每一个点X,我们都可以找到某个包含在X中的结构元素B的平移B[Y],使得x∈B[y],即X在x的近旁具有不小于B的几何结构。而对于X中不能被XoB恢复的点,其近旁的几何结构总比B要小。这一几何描述说明XoB是一个基于几何结构的滤波器。如图3.13所示为两个开运算的示例。我们可以看出,当使用圆盘结构元素时,开运算对边界进行了平滑,在凸角点周围,图像的几何外形无法容纳给定的圆盘,从而凸角点周围的点被开运算删除;而当使用线段结构元素时,沿线段方向宽度较大的部分方可被保留,较小的凸部分将被剔除。不同的结构元素的选择提取出不同的特征。需要注意的是,如果结构元素B为非对称的,则进行开运算时,要用B的对称集首进行膨胀,否则,开运算的结果和原图像相比会发生平移现象。oB图3.13开运算的示例3闭运算执行闭运算的过程与开运算恰好相反:目标图像X先被结构元素B膨胀,然后再被结构元素B腐蚀。我们用XeB表示X对B的闭运算。它定义为:XoB=(X国B)OB(3.9)首先还是来看一个闭运算的例子,如图(3.14)所示:图(a)为待处理的原始图像X,图(b)为3x3方阵结构元素B,图(c)为膨胀图像,图(d)为在此基础上腐蚀的结果。可以看出,目标图像经过闭运算后,断裂的地方弥合了。一般来讲,闭运算能够添平小孔,弥合小裂缝,而总的位置和形状不变。和开运算同样的需要注意的是,如果结构元素B是非对称的,则进行闭运算时要用B的对称集岳进行膨胀,否则和原图像相比闭运算的结果要发生平移。I23●56T8‘I)晨蛤囝l虹l23456T8口I23456T8(c)舅量囝儡似)母运茸结果囝t图3.14闭运算示例XoB可看作对膨胀图像熵B用腐蚀来进行恢复,由于开运算和闭运算是一对对偶变换,即满足下面公式:(XcoB)c=XeB,(XcoB)c=XoB(3.10)所以闭运算的几何意义可由开运算的补集的几何意义导出,如图(3.15)所示为两个闭运算的示例。从中可以看出,闭运算通过填充图像的凹角点来平滑图像,而XoB—X给出的是图像的凹入的特征。(2)闭变按圈倒图3.15两个闭运算示例332基于数学形态学闭运算的边界闭合由上面闭运算的介绍我们知道,它具有弥合小裂缝的功能,因此本文利用闭运算,来处理经过微分算子边缘检测的结果图像,连接小的边界片段,完成边界闭合。由于开闭运算具有位移不变性,因此实现简单,便于并行处理。基本处理流程如图3所示。15曩■317经过边界闭台处理的图像3.3.3结构元素的选取数学形态学中最基本的概念是结构元素,它本身具有一定的形态(如:点、点对、线段、圆等等),其作用相当于一个“探针",在图像中不断移动结构元素,便可考察出图像各部分间的关系,采用不同的结构元素可以得出不同的结果。在图像的形态分析中,结构元素起着重要的作用,无论使用哪种形态运算,其结果都与结构元素矩阵B的取法有很大关系,对于不同的图像,不同的研究目标应该取不同的结构元素矩阵,有时甚至要取不同尺度的多个结构元素矩阵,因此本文在边界闭合过程中,可以根据具体情况设置结构元素。结构元素主要分为直线型和团型两种:1直线型结构元素通常我们不会取一个点做结构元素,因为点元素不能改变图像形状只能平移,因此不具操作意义,除点以外的最小结构元素是直线形结构元素。此种结构元素适于按照一定方向处理图像。当原点在直线形结构元素的某一端时(如右端),腐蚀与膨胀的运算将在图像的另一侧(如左侧)进行。其腐蚀的“深度"与膨胀的“厚度’’就是结构元素矩阵的长度。如果原点选在直线形结构元素矩阵的中间,腐蚀与膨胀运算可使图像沿此直线方向的两侧进行,其效果相当于两个原点在端点的结构元素的叠加。在每一种同形状的直线结构元的情况中,不同尺度的结构元素进行形态运算后的结果也是很不相同,并有规律可循,由形态开、闭运算的性质不难想象,在直线结构元素下的开运算可以去掉图像中与结构元素矩阵垂直方向宽度小于结构元素矩阵长度的“毛刺”,闭运算可以填平垂直方向宽度小于矩阵长度的“麻坑”。2团形结构元素团形结构元素矩阵,或者说任何形状的结构元素矩阵,从本质上说,都可以看成是直线形结构元素矩阵的叠加。用以原点为中心的团形结构元素进行腐蚀运算时,图形四周被腐蚀一圈,腐蚀深度为结构元素矩阵的半径;作膨胀运算时,图形四周被膨胀一圈,膨胀的厚度也为结构元素矩阵的半径。团形结构元素作开运算,可以去掉宽度小于结构元素矩阵直径的“毛刺’’或噪声点;作闭运算可以去掉宽度小于结构矩阵直径的“麻坑",但可以保留“毛刺"和噪声点。3结构元素设置本文为操作方便将直线型结构元素和团型结构元素合并如图3.18,按形状分为矩形、菱形、圆形、正方形,直线型可认为是矩形的特例即宽度为1,那一种合适需要根据图像边缘的特点。本文在试验中基本采用直线型的结构元素,因为经过梯度算子的运算后,图像边缘定位精度如果较好,分别采用垂直和水平两个方向的直线型结构元素,闭合效果较好,如果存在伪边界或者过分割比较严重,可采用团型结构元素闭合,再综合图像其他特征进行边界的二次定位。时间有限,本文在这方面没有做进一步细致研究,在第32四章只讨论了如何尝试利用图像的色彩特征对过度分割进行处理。图3.18结构元素图33第四章利用颜色信息消除彩色图像的过度分割上一章,本文主要讨论了对于灰度图像的分割过程和关键技术,图像预处理的第一步就是灰度图像转换,也就是将彩色图像转换成灰度图像处理,人的视觉系统对亮度敏感,相比之下对颜色的敏感性要差,另外彩色图像表示色彩的方式也给处理造.成不变,但是在图像中颜色往往带有很强的区域性,也是图像的重要特征,弃之不用,是很浪费的,因此本章主要讨论,分割过程中对颜色信息的处理和利用。4.1色彩空间的选择前面我们说过,人的眼睛对颜色分辨能力并不是很高的,其实不同人的眼睛对于色彩的感受能力也是有着明显差异的,而扫描仪、数码相机、显示器、以及各种打印机再现色彩的方法也是不一样的。因此,我们应该对图像色彩空间的本质及其各种描述形式有所了解。1)RGB色彩空间颜色是什么?颜色是人的视觉系统对可见光的感知结果,所以要了解颜色的特性需要先了解光的特性,光的物理特性由它的波长和能量来决定,波长决定了光的颜色,能量决定了光的强度。光映射到人的眼睛时,波长不同则光的颜色不同,如果波长相同而能量不同,则人的眼睛就会感受到的色彩明暗程度的变化。人的视网膜有三种锥体细胞,对红色、绿色和蓝色具有不同的敏感程度,而自然界中的任一种颜色都可以由红、绿、蓝三种色光混合而成,三种颜色占比重不同,得到的颜色就不一样,基于这个原理,RGB相加混色是计算机系统中定义颜色的最常见方法。红、绿、蓝三原色光等比例混合得到白光,红光和绿光等比例混合得到黄光,红光和蓝光等比例混合得到品红光,绿光和蓝光等比例混合得到青光变换混合的比例,则会得到各种各样的混合效果。2)CMY色彩空间计算机的显示器和电视采用的都是RGB色彩空间,阴极射线管采用3个电子枪分别产生红、绿、蓝三种色光,以不同的相对强度综合产生一种颜色。而对于彩色打印机或者是彩色印刷,纸张和油墨都不能发光,因此不能使用RGB色彩空间。它们采用的是CMY色彩空间:青(Cyan)、品红(Magenta)和黄(Yellow)。RGB混合形成色彩的方式称为相加混色,而CMY混合形成色彩的方式称为相减混色。原因是CMY空间正好与RGB空间互补,用白色减去RGB空间中的色彩值就等于同样色彩在CMY空间中的值,如图3.1所示。色料的颜色是由于色料选择性地吸收了入射光中的补色成分,而将剩余的色光反射或透射到人眼中,由于对复色光中的某一单色光被吸收,入射光的能量就会减弱,光的能量下降,亮度就会降低,因此称为相减混色。ROB相加混色一0000ll1100ll00ll0p1p0.)1.)0.)1.)0.=1l一CMY相碱混色一lll100001l00l1p0pl|)0plp颜色一黑色‘蓝色,绿色‘音色p红色p1∞0l一品红一黄色.==白乍lp0吐图4.1CMY色彩空间3)HSI色彩空间我们的眼睛看到一副图像时,会根据颜色区域在大脑中自动分割图像,但是我们不会记得颜色的三种基色的亮度,我们习惯用深红、浅黄、墨绿、天蓝、等通俗的表达方法描述颜色,基于这种应用需求,我们需要一种更直观的色彩空间来表达颜色,这就是利用色相、饱和度、明度描述颜色的HSI色彩空间。人对自然界的颜色的感受很大程度上是受心理因素影响的,即心理颜色。而HSI色彩空间恰恰是从人的视觉系统特性出发,用色调(Hue)、色饱和度(Saturation或Chroma)和明度(Brightness)来描述色彩。为了定性、定量地描述颜色,国际上统一规定了鉴别心理颜色的三个特征量,它们是色相、明度和饱和度(或称纯度)。这三个特征量,又称为心理颜色的三个属性,色相对应于色光的主波长,明度对应于光的亮度,饱和度对应于颜色的纯度,这便是颜色的心理感觉与色光的物理特性之间对应关系。每一种颜色,都同时具备这三个属性。我们可以用一个三维圆锥模型来表示色相、明度和饱和度之间的关系。如图3.2所示,垂直轴表示从黑到白明度的变化,上端是白色,下端是黑色,中间是过渡的各种灰色。色相用水平的圆圈表示,圆圈上的各点代表可见光谱中各种不同的色相(红、橙、黄、绿、青、蓝和紫)且饱和度最高,向圆心方向,颜色的饱和度逐渐减弱,可见由圆圈向上或向下移动时,颜色的明度降低,饱和度也降低,但是同一水平面上颜色的色相和饱和度的改变,不影响颜色的明度。白■图4.2SHI模型HSI色彩空间比RGB色彩空间更符合^的视觉特性,并且可吡大夫简化图像分析和处理的工作量。因此,本文采用HSI色彩空间,但是通常图像存储丰u显示系统部是RGB色彩空间.因此在我们开始我们的算法之前,首相要进行色彩空间的转换。它们只是同一物理量的不同表示法,转换公式如下:‘”1JH:—L『90-Arctan(FT)+(0G>B,1(41)3601_80.6<Bi]vj一吖堕字叫JF:.2.R...-..G.—-—BG—e42基于子块划分的色调统计我们可以利用第三章的方法,先转换成灰度图像,快速找到边缘,从而达到对图像的快速分割。但是在第三章的实验中,我们也发现,在高频区域存在大量细小的边缘,难以形成一个大区域并且会产生区域错分,但又不直将高频区域分成小块,如图4.3所示,图片中色调基本是绿色的树、蓝色的天、黄色的土地三种,经边缘检测会出现大量的细小区域。为解决这个问题,本文利用像素的色调信息,将图像划分成8*8子块,计算每个子块的主要色调,然后利用区域增长的方法进行分割,处理过程如图44所示。(a)原图(b)处理后的图片图43图像的过度分割首先读入图像,进行色彩空间的转换,为提高运算速度,简化子块的特征比较将色度值进行量化,然后将图像分成8行8列大小的子块,统计各个子块出现的色调,计算每个子块的色度直图,确定出每个子块的主色调、次色调作为颜色特征,特征相似的相邻块可以认为是同一个区域,接下来就是选一个子块开始,找出与之相邻的相似子块和并,或者叫生长。‘311读入图像1L色彩空间转换及量化上子块划分上计算子块主色调'L基于子块的区域生长上与亮度边界的拟和1L输出图像图4.4彩色图像处理流程图4.3基于子块的区域生长技术区域生长技术的基本思想是首先为每个需要分割的区域确定一个种子像素作为生长起点,然后按一定的生长准则把它周围与其特性相同或相似的像素合并到种子像素所在的区域中,直到没有满足条件的像素可以被合并,这时生长停止,一个区域就形成了。然后再重新确定一个种子生长点重复以上动作,直到图像中所有像素点都被生长完毕,整个算法结束。本文基于子块的区域生长方式,将像素改为子块,生长规则即相邻子块相似。相似的条件分两种情况:1、若子块中只有一类颜色,仅按色度相近原则生长即可;2、若块中含有二类以上的颜色,可考察主色调和次色调,以避免多种颜色比较的复杂性,生长准则为以下3个条件的逻辑与。1)主色调和次色调占70%以上。2)相邻块主色调应近似。3)相邻块次色调应近似。37醚豳(a)原图尽■■(b)基于边缘检测分割图46分割效果比较(C)综合色度子块的分刮第五章结论与展望5.1结论图像分割是是图像处理的一个极其重要的部分,在实际生活中己得到了广泛的应用,并涉及各种类型的图像,包括工业,精密仪器等,农业,医学医疗。在这些应用中,图像分割通常是为了进一步对图像进行分析、识别处理,分割的准确性直接影响后续任务的有效性和正确性,因此具有十分重要的意义。图像分割就是将图像分为各具特色的区域并提取出前景的技术和过程,通常前景的边界是我们感兴趣的对象,如果我们能检测出这些边缘,就可以提取出前景。这种基于边缘的图像分割,也被称为边缘检测。本文首先简单介绍了一些常见的边缘检测方法和算子,给出了不同算子对同一幅图像进行分割的结果,并对结果进行了分析。微分算子存在以下不足:1无论哪一种算子,核心都是通过差值提取边缘,一旦边缘附近存在噪声点,直接会导致边缘的不完整。2.在高频区域存在大量细小的边缘,难以形成一个大区域并且会产生区域错分,但又不宜将高频区域分成小块,因为一旦在边缘图像中分块将会导致在彩色图像中图像的错分割。3.单独的边缘检测只能产生边缘点,而不是一个完整意义上的图像分割过程,得到的边缘点信息需要后续处理或与其他分割算法结合起来,才能完成分割任务。鉴于以上原因,本文从预处理、边界闭合、色度信息的利用等几个方面为提高抗噪能力和消除过度分割进行了探讨和实验。结合数学形态学、正交变换技术、运用扩展的微分算子提高算法的抗噪性,设计基于子块的区域生长方法,利用颜色信息减少彩色图像的过度分割。5.2展望本文对图像分割中的一些问题进行了粗浅的讨论和尝试,还有许多需要进一步改进的地方:1噪声问题一直是影响图像分割质量一个主要因素,平滑可以消除噪音,但是也会使边界信息损失,小尺度的滤波器,有可能平滑不完全而留有太多的噪声,大尺度滤波器在平滑相互邻近的两个边缘时,可能会将它们连在一起,这样只能检测出一个边缘。因此,在不知道物体尺度和位置的情况下,很难准确确定滤波器的尺度。使用多尺度滤波模板并在滤波器的不同尺度上分析边缘特性的方法仍在研究中,这些方法的基本思想是,通过使用大尺度滤波模板产生鲁棒边缘和小尺度滤波模板产生精确定,一39位边缘的特性,来检测出图像的最佳边缘。2我们不能期望用一种检测算子就能最佳检测出发生在图像上的所有特性变化。当需要提取不同特性变化的边缘时,要考虑多种算子的综合应用。3在正确检测边缘的基础上,要考虑精确定位的问题。由于图像分割本身的重要性和难度的挑战性,吸引了很多的学者和研究人员。图像自身存在许多不确定性和不精确性,虽然几乎自数字图像处理问世不久就开始了图像分割的研究,吸引了很多研究人员为之付出了巨大的努力,在不同的领域也取得了相当的进展与成就,但是人们至今还一直在努力发展新的、更有潜力的分割算法,以期实现更通用、更完美的分割结果。致谢时光如箭,转瞬即逝。不知不觉之间,在长春理工大学作为研究生的学习研究生活即将告一个段落,我将踏上新的旅程。回顾这3年,可谓是得益匪浅,收获良多。我学会了如何做研究,如何独立地进行学习。当然这些成果和那些帮助我的人是分不开的,和他们共同度过的这2年,相信一定会成为今后我人生道路上的一笔宝贵财富。在完成这片论文之时,衷心感谢我的导师叶青老师,本课题所取得的每一步进展无不凝聚着导师的心血和汗水。尤其是我在工作和生活中遇到困难时,是敬爱的导师给予了我细致的指导、耐心的帮助和亲切的关怀。她为人师表的风范,严谨的治学态度和忘我投入的科研精神将使我终身受益。同时我还要感谢实验室的师兄和师姐们,他们在我学习遇到问题时,多次亲切的和我一起进行讨论,帮助我学习和理解,提供给我他们的建议和方法。有了他们的帮助,我才能顺利克服一个又一个难题。在此特意对他们表示感谢。最后还要其他许许多多的同学和老师,以及我的父母,正是有了他们或明或暗的帮助,给我的鼓励,我才能顺利完成在这里的学业,在这一并表示谢意感谢两年多来所有关心和帮助过我的人。谢谢14l参考文献[1]张毓晋.图像分割.北京:科学出版社.2001年.[2]沈海.一种基于类推思想的图像分割方法.计算机工程与应用.2006年09月.[3][4][5][6][7][8][9][10][11][12][13][14]石扬.基于相位信息的图像边缘检测算法研究.[硕士论文].大连理工大学.2007年.李久权,王平,王永强.CT图像分割几种算法.微计算机信息.2006年04月.王坤.数字图像分割和质量评价方法韵研究.[硕士论文].沈阳:东北大学。2006年.李朝晖,陈明.基于小波和自学习神经网络的图像分割.计算机应用研究2006年01月.杨群.基于直方图和小波变换的图像分割方法的研究:[硕士论文].江西:南昌大学计算机学院.2006年.杨晖,曲秀杰.图像分割方法综述.电脑开发与应用.2005年03月.陈敏.一种自动识别最优阈值的图像分割方法.计算机应用与软件.2006年04月李卓,郭立红.快速图像处理中阈值选取方法的比较研究.2005年03月.王萍,苏秀琴,刘雅.给予区域合并的动态阈值分割算法.光子学报.2004年.修春波,刘向东,张宇河.基于混沌优化的最佳熵阈值的图像分割.计算机工程与应用.2004年.张谦,耿国华,周明全.基于阈值和snake模型的三维医学图像自动分割.微机发展.2005年陆剑锋,林海,潘志庚,等.自适应区域生长算法在医学图像分割中的应用[J].计算机辅助设计与图形学学报.2005年.[15]杨晓强,魏生民,汪焰思.一种基于知识模型的cT图像分割方法.计算机应用研究.2005年.[163王勇.数字图像设备颜色特征化及其再现理论与技术研究.[硕士论文].浙江:浙江大学.2006年.:[17][18]夏勇.基于特征的纹理图像分割技术研究.西安:西北工业大学.2008年.IsekiF.Extractionof3DtreestructureofbloodvesselsinlungareafromchestCTimages.In:Lemke刖.ed.Proceedingsofthe12thInternationalSymposi,,mandExhibitionofComputerAssistedRadi—ologyangSurgeryNetherland:E1sevierScience.1998年.[19]ZhengLin,JesseJin,HuguesTalbot.Unseededregiongrowingforcolorimagesegmentation.VisualInformationProcessing,2001:64—71.[20]MichaelH.F.Wilkinson.Optimizingedgedetectorsforrobustautomatiethresholdselection:CoPingthEdgeCurvatureandNoise.GraPhicalModelsandImageProeessing1998。60:385—401to[213ChenCw,LuoJ,ParkerKJ,et.a1.Aknowledgebasedonapproachvolumetricmedicalimagesegmentation[C].IEEEInternationalCon—ferenceImageProcessing.2004年.on[22]GangWU,ChunhongandPAN,VeroniquePRINET,SongdelIA.ALandUseClassificationMethodBasedRegionEdgeInformationFusion.PrinciplesandMethodsforRemoteSensingApplicationandAnalysis。Beijing,2004:53—61.[23]ZiouD,Tabbones.Amultisealeedgedetector.PatteⅢReeognition,1993,26(9):1305—1314[24]PEMIIARAJlJS,MITRAS,SHIEHY,etal.Multiresolutionwaveletdecompositionandneuro-fuzzyclusteringforsegmentationofradiographicimages[J].ProceedingsoftheEighthAnnualIEEESym-posiumonComputer—BasedMedicalSystems(CBMS’95).2004年.forclinicallyeffective[25]ArambulaCosioF.DaviesBL.Automatedroboticprostaterecognition:akeyprocessprostatectomy[J].MedBiolEngComput.2006年.Y.Aself—learningsegmentationframeworkthe[26]ChenD,SunTaguchiapproach[J].ComputMedImaging(;raph,2000年.[27]ALIMA,DOOLEYLS,KARMAKARGC.Fuzzyimagesegmentationcombingonringande11ipticshapedclusteringalgorithms[C]//|lARIOC.InternationalConferenceInformationTechnology:CodingandComputing(ITCC05)一VolumeII.Nevada:IEEECSPress.2005:118—122.[28]Kenneth,凡CaStleman.DigitalImageProcessing.PrinceHall.2006年.42[29]KimDY,KimJH,NohSM,et.a1.PulmonarynoduledetectionUS—ingchestCTimages[J].ActaRadi01.2003.44(3):252-257.MilanSonka,等.图像处理、分析与机器视觉[M].2版.北京:人民邮电出版社,2000.郭建甲.基于数字图像处理技术的水厂自动加矾系统.[硕士论文].南京:河海大学.2005年.杨枝灵,王开.VisualC++数字图像获取、处理及实践应用.北京:人民邮电出版社.2003年1月.张树忠.基于Canny理论的彩色图像边缘检测:[硕士论文].四川:成都理工大学。2006年.潘天工.汽车牌照自动识别系统的研宄.[硕士论文].哈尔滨理工大学。2006年.马英辉,韩焱.彩色图像分割方法综述.科技情报开发与经济.2006年04月.周猛.图像边缘检测技术在车锁识别打码系统中的应用研究.[硕士论文].安徽:合肥工业大学。2006年.林开颜,吴军辉,徐立鸿.彩色图像分割方法综述.中国图象图形学报2005年01月.26屈彬,王景熙.一种基于区域增长规则的快速边缘跟踪算法.四川大学学报,2002,34(2):10-14.赵听,陈宜金,栾咏雪.数字图像中的边缘检测算法[J].科技信息,2006,11(3):3-5.张晓芸.彩色图像分割算法的研究与实现[硕士学位论文].重庆:重庆大学.2005年王振杰,盛焕华.一种基于边缘梯度的图像分割方法[J3.计算机应用研究,2004,21(2):254-257.43图像分割技术研究与应用

作者:

学位授予单位:

董明

长春理工大学

1.学位论文 张博 基于边缘检测的细胞图像分割方法研究与实现 2006

本文首先阐述了图像分割理论的定义和目标。图像分割是将整个图像区域分割成若干个互不交叠的非空子区域的过程,每个子区域的内部是连通的,同一区域内部具有相同或相似的特征。图像特征可以分为图像的统计特征和图像的视觉特征两类。对图像分割的方法进行了分类和探讨,把图像分割的方法分为四大类:基于阈值分割的方法,在图像分割过程中,物体象素的灰度级与背景象素的灰度级有不同,阈值化就是一个非常有效的技术,它可以将物体从背景中较好地分割出来;基于边缘检测的方法,图像最基本的特征是边缘,它是图像局部特征不连续(或突变)的结果,边缘检测方法是利用图像一阶导数的极值或二阶导数的过零点信息来提供判断边缘点基本依据;基于区域的分割方法,区域增长分割的实质就是把具有某种相似性质的象素连通起来,从而构成最终的分割区域;结合特定理论工具的方法,这些特定理论包括数学形态学、模糊技术、神经网络、小波等。通过对以上四类方法的探讨,以及对各种算法进行的MATLAB环境下的实验,总结了传统图像分割算法的优缺点,和各类算法的适应环境。针对细胞图像的特点,实现了一种基于边缘检测的细胞图像分割方法。在该方法中,应用了本文提出了的一种局部自适应阈值分割算法。对细胞图像进行阈值分割。该阈值分割算法是基于小区域的分割,细胞图像细节也能有很好的区分和分割,它适用于背景和目标对比不是很明显和具有一定噪声的细胞图像。最后对该边缘检测方法进行了实验,结果与传统方法相比,轮廓提取更为精确,且最大程度的保留了细胞内部细胞核的轮廓。

2.期刊论文 李禹.计科锋.粟毅.LI Yu.JI Ke-feng.SU Yi 基于MSP-ROA边缘检测的SAR图像分割 -信号处理2008,24(1)

该文以卡通模型为SAR图像分割的理论依据,提出了一种基于MSP-ROA边缘检测的SAR图像分割算法,算法中对边缘检测的结果做种子生长、标注和区域填充,并根据相似性准则对填充的初始分割结果进行相邻区域的合并处理,最终得到同质性和连通性都较好的SAR图像分割结果;文中给出了SAR图像分割处理的性能评估指标,并用实测的SAR图像数据验证了上述算法,最后给出了与其它分割方法比较的结果.

3.学位论文 徐志洁 基于边缘检测及Markov随机场模型的遥感图像分割研究 2005

图像分割是图像工程的一个重要的步骤,是图像处理到图像理解和分析的必由环节.人们很早就开始了对图像分割方法的研究,并且几十年来,这方面的研究从来没有间断过.到目前为止,已经有大量的关于图像分割的理论、技术、方法被人们提出并广泛应用.在遥感领域,由于遥感图像的尺寸大、多波段、内容丰富多样、纹理特征丰富、多尺度等特征,对遥感图像的分割比一般图像的分割难度更大,简单地将一般图像的分割方法运用到遥感图像的分割中并不能得到令人满意的结果,因此需要对这些方法做出改进或者提出新的方法以适应对遥感图像分割的要求.本文以遥感图像为主要的分割对象,对图像分割的相关技术进行了研究,并提出了一种有效的遥感图像分割方法. 论文的主要研究内容包括; (1)对近些年的图像分割方法和遥感图像分割方法进行了回顾和总结,并对它们的优、缺点进行了分析,指出了进一步研究的方向. (2)LIP模型能够克服传统的图像处理模型中可能出现的越界问题,更适合对图像进行各种操作,本文提出了一种基于LIP模型的边缘检测方法,通过实验表明了方法的有效性和与经典的边缘检测方法及LIP-Sobel算子相比的优越性,并对基于LIP模型的边缘检测方法的对低亮度图像敏感的性质,给出了理论证明. (3)CLARANS算法容易陷入局部最优点,为了克服这个问题,本文提出了基于模拟退火的CLARANS聚类方法. (4)提出了基于边缘检测的初始图像分割策略,引入高斯马尔可夫随机场(GMRF)模型提取纹理特征,应用基于模拟退火的CLARANS聚类方法实现了对遥感图像的分割. 最后,论文对所做的研究进行了总结,并对将来的研究进行了展望.

4.期刊论文 王辉.王来生.钟萍.WANG Hui.WANG Lai-sheng.ZHONG Ping 基于边缘检测函数尺度变换的水平集图像分割 -计算机工程2009,35(24)

针对Chan-Vese模型(C-V模型)存在收敛缓慢等缺陷,给出一种基于边缘检测函数尺度变换的水平集图像分割算法.引入边缘检测函数对C-V模型进行改进,在不降低分割质量的前提下,提高图像分割的速度.为了增强改进模型的灵活性,提出对边缘检测函数进行尺度变换的方法.实验结果表明,改进模型有良好的分割效果,尺度变换能有效加快改进模型的演化速度,保持分割过程的稳定性.

5.期刊论文 陶唐飞.韩崇昭.代雪峰.段战胜 综合边缘检测和区域生长的红外图像分割方法 -光电工程2004,31(10)

针对红外图像的特点,提出了一种综合应用边缘检测和区域生长方法的图像分割方法.其思路为:先对图像进行边缘提取,得到边缘像素点集;然后利用该点集的平均灰度和目标区域的连通性作为生长判决条件,采用区域生长法实现图像分割.仿真结果表明,该方法能快速准确有效地实现红外图像分割,避免了单独使用边缘提取或区域生长法进行图像分割时的典型分割错误.

6.学位论文 贺小虎 序列图像分割中的边缘检测方法研究及其在相控HIFU中的应用 2006

在相控HIFU治疗系统中,治疗计划是一个很重要的组成部分,直接影响到手术的效果,而病灶空间位置信息的获取是超声治疗计划的一个关键步骤。高强度聚焦超声靶点小、强度高,而人体内有很多重要器官,为了避免损伤正常组织和提高治疗效率,必须对病灶的三维空间结构有准确的了解,并需要提供治疗目标的精确位置。因此,需要图像定位系统,首先对术前和术中病灶区域进行多模态序列图像采集,进而采用序列图像分割方法,提取目标的有关信息尤其是病灶的边缘,然后利用这些信息精确地控制相控HIFU进行治疗。正是在这样的背景下,本文对HIFU手术定位系统中的关键技术:序列医学图像的分割进行了理论研究和算法设计及实现。 本文首先讨论了序列图像分割中的预处理算法,研究了基于边缘增强扩散的图像滤波方法与算法,确定了最优扩散系数和迭代次数。算法能有效地提高信噪比,改善医学图像质量。 本文在对比了多个边缘检测算法之后选定水平集(Level Set)方法来对预处理后的图像进行边缘检测。针对水平集方法的收敛速度和初始曲线之间的关系,以及HIFU手术定位系统对实时性的要求,本文将同一序列中前幅图像的边缘通过运动估计与运动补偿,作为后续图像水平集方法的初始曲线的思想,结合单指令多数据流(SIMD)技术的使用,大大减少了序列图像边缘检测的运算时间。 最后,以体模标本为实验对象来模拟HIFU手术的病灶,分别采集其CT和B超的序列图像。利用本文改进的边缘增强扩散方法和水平集方法结合对其进行边缘检测,并将SIMD技术结合使用,实验结果表明,本文采用的方法无论在精度还是速度上都取得良好的效果。

7.期刊论文 李朝晖.王冰.陈明.LI Zhao-hui.WANG Bing.CHEN Ming 结合遗传算法和多尺度边缘检测的红外图像分割

-光电工程2009,36(8)

用传统的解析法得到的函数最大梯度和局部极大只能是近似和局部意义上的.本文结合遗传优化搜索算法讨论多尺度边缘检测的新方法.为了提高遗传算法应用于边缘检测的收敛速度,改进基本遗传算法存在的局部搜索能力差的缺陷,提高全局解的质量,采用了改进的GA(遗传算法)+SA(模拟退火法)+TABU(列表寻优法)混合算法.将基本遗传算法与启发式搜索算法相结合,采取交替式的优化策略.试验结果表明,将该算法用于红外目标图像分割,可以使检测出的图像边缘细节丰富,单边缘,定位准确.

8.期刊论文 薛科悦.陈惠民.杨立瑞 一种基于边缘检测和区域生长的背散射图像分割算法 -警察技术2009(6)

针对安检领域背散射图像的特点,提出一种基于边缘检测和区域生长的背散射图像分割算法.实验结果表明,该算法可以准确、完整地分割出背散射图像中感兴趣的目标区域.

9.学位论文 雷静 支持向量机在基于边缘检测的图像分割和函数估计中的应用 2003

在基于边缘检测的图像分割中,该文应用支持向量机分类的原理对组成图像的像素的某种特性(灰度值)进行学习,根据\"支持向量\"判断出目标与背景的边界从而将图像进行分割.该文中我们分别采用了两种方法——两类分类与单类分类.它们分属于有监督学习与无监督学习.这两种方法最大的区别就在于学习样本是否包含有预先规定好的输出值.详细的原理和学习过程可参见正文第三章.函数估计主要包括两个方面——参数拟合及微分方程边值问题.受神经网络方法的启发,该文采用了支持向量机回归的原理.只要事先假设出所求函数的表达式,然后根据已知的微分关系和边界条件对待求函数进行约束将原问题转化为二次规划问题,再采用支持向量机回归算法对样本进行学习即可求出参数,确定待定函数的关系式.

10.期刊论文 王晓亚.刘素芳.WANG Xiao-ya.LIU Su-fang 图像分割中的边缘检测 -无线电工程2006,36(12)

数字图像的边缘检测在图像分割、模式识别、机器视觉等中有很重要的作用.从70年代到现在发展出了很多种边缘检测的方法,而对于不同的应用环境,不同算法的效果不同.针对高速公路中图像的特点,对几种典型的边缘检测方法的原理和实现方法进行了详细分析和说明,对比分析了各种算法应用在高速公路图像识别中的优劣,并根据高速公路图像识别系统的特点选择了合适的检测算法.

本文链接:http://d.g.wanfangdata.com.cn/Thesis_Y1524763.aspx

下载时间:2010年5月5日

因篇幅问题不能全部显示,请点此查看更多更全内容