文档库 最新最全的文档下载
当前位置:文档库 › 基于最大模糊熵和遗传算法的图像分割方法研究

基于最大模糊熵和遗传算法的图像分割方法研究

基于最大模糊熵和遗传算法的图像分割方法研究
基于最大模糊熵和遗传算法的图像分割方法研究

摘要

图象分割是数字图象处理与机器视觉的基本问题之一,是目标检测和识别过程中的重要步骤。由于待分割图象的可变性比较大,且混有噪声,构成了图象分割所面临的主要困难。到目前为止还不存在一种通用的、能使各种类型的图象达到最优分割质量的图象分割方法。

近年来一些学者将模糊理论和遗传算法引入到图象分割中,较传统方法取得了更好的分割效果。本文在研究传统的模糊阈值分割的基础上,提出了一种基于改进的自适应遗传算法的图象分割方法,提高了图象的分割质量和分割效率。本文具体研究工作如下:首先,针对标准遗传算法容易“早熟”的缺点,提出一种改进的自适应遗传算法。该算法引进新的变量来衡量群体适应度的集中程度,从而对交叉概率和变异概率进行自适应调整,提高了算法的收敛率。

然后,将模糊理论和遗传算法结合起来应用于图象分割处理。针对目标和背景两类图象分割,考虑二维灰度直方图,采用了一种更符合图象空间分布特点的隶属函数,建立了对应的二维图象模糊熵,分别采用标准遗传算法和改进的自适应遗传算法对二维图象模糊熵的各个参数进行优化,根据最大模糊熵准则,确定目标和背景的最佳分割阈值。实验结果表明,基于改进的自适应遗传算法的二维最大模糊熵阈值分割法具有较好的分割性能和较快的分割速度,对噪声有一定的抑制能力。另外,针对多目标的复杂图象分割问题,本文采用了一种三类阈值分割法,该方法将图象分为暗区、灰度区和亮区,通过建立相应的模糊隶属函数,对图象各个灰度级属于暗区、灰度区和亮区的模糊特性进行描述,并采用改进的自适应遗传算法对模糊熵参数进行优化,根据最大模糊熵准则,确定最佳的分割阈值;实验结果表明,基于改进的自适应遗传算法的三类阈值分割法能快速有效地分割复杂图象。

关键词:图象分割;模糊熵;遗传算法

Abstract

Image segmentation is one of basis problem of digital image processing and machine vision, and it is also an important step for detecting and identifying objects. The main difficulties lie in the great variability of images and the presence of noises.

Recently, many researchers have introduced fuzzy set theory and genetic algorithm to image segmentation, which can get better results than traditional algorithms. An improved adaptive genetic algorithm in image segmentation is proposed to improve image division performance and division efficiency based on the study of fuzzy threshloding methods.

Firstly, because the simple genetic algorithm is easily premature, an improved adaptive genetic algorithm is proposed. This method adopts a new variable to evaluate the concentration degree of population fitness. According to the concentration degree, the crossover probability and mutation probability is adaptively changed, which could improve the convergence of the genetic algorithm.

Then, a thresholding method for image segmentation is presented, based on two-dimensional maximum fuzzy entropy and genetic algorithm. Utilizing two-dimensional histogram, the method defines a membership function that is fitter for image characteristics, and then gives the description of image’s fuzzy entropy. The procedure for finding the optimal combination of fuzzy parameters is implemented by simple genetic algorithm and improved adaptive genetic algorithm. Finally, the optimal threshold is determined by maximizing the fuzzy entropy. The experimental results indicated that the proposed method gave better performance and higher calculation speed, and the ability of resisting noise is improved. For multi-target image segmentation, a three-level thresholding method is presented. The method defines different membership functions for dark part, gray part and bright part of the image, and then gives the definition of fuzzy entropy. An improved adaptive genetic algorithm is proposed for the optimization of fuzzy parameters. Finally, the optimal thresholds can be determined by maximizing the fuzzy entropy. The experimental results demonstrated that the proposed method could segment the image effectively and fast.

Keywords:image segmentation; fuzzy entropy; genetic algorithm

目录

第一章绪论 (1)

1.1图象分割技术简介及其意义 (1)

1.2遗传算法发展简介 (4)

1.3模糊理论简介 (5)

1.4本文的研究内容和拟解决的关键问题 (5)

1.5本文的章节安排 (6)

第二章图象分割原理和方法 (7)

2.1图象分割的理论基础 (7)

2.2图象分割的基本方法 (7)

第三章遗传算法的基本理论 (11)

3.1遗传算法的基本概念 (11)

3.2标准遗传算法 (12)

3.3遗传算法的基本定理 (15)

3.4遗传算法的特点 (15)

3.5遗传算法的理论及应用研究现状 (16)

第四章模糊理论基础与应用 (18)

4.1模糊理论的提出 (18)

4.2模糊集基础 (18)

4.3模糊理论在图象处理中的应用 (20)

4.4图象分割中的模糊技术 (21)

第五章基于最大模糊熵和遗传算法的图象阈值分割 (23)

5.1引言 (23)

5.2阈值分割原理 (23)

5.3基于一维最大模糊熵的图象分割算法 (23)

5.4基于二维最大模糊熵的图象分割算法 (25)

5.5遗传算法的改进 (27)

5.6利用遗传算法优化二维最大模糊熵进行图象分割 (29)

5.7基于最大模糊熵和改进的自适应遗传算法的三类阈值分割 (33)

第六章结束语 (38)

6.1论文的主要工作 (38)

6.2论文的创新点 (38)

参考文献 (40)

研究生期间发表的论文 (45)

致谢 (46)

第一章绪论

1.1图象分割技术简介及其意义

图象分割一直是图象处理领域中的重点和难点。图象在分割后的处理,如特征提取、目标识别等都依赖图象分割的质量,所以图象分割在图象处理中占有非常重要的地位。在图象分割最初发展的二十年里,人们主要对阈值分割、边缘检测和区域提取这三种分割方法进行研究。进入八十年代以后,越来越多的学者开始将模糊理论、马尔可夫模型、遗传算法理论、分形理论和小波理论等研究成果运用于图象分割的研究,取得了很大进展。图象分割技术从兴起到现在,算法上得到了不断的改进和创新,已经取得了很大的进步。

图象分割在其它领域的应用也非常广泛,并涉及各种类型的图象。例如,在工业监控应用中,分割燃烧炉中的火焰以便监测燃烧过程[1]等;在农业应用中,图象分割被用于户外植物的检测[2]等;在遥感应用中,分割合成孔径雷达图象中的目标[3]或遥感云图中的不同云系和背景分布[4]等;在医学应用中,脑部MR图象分割成灰质、白质、脑脊髓等脑组织和其它非脑组织区域[5]等;在交通图象分析中,把车辆目标从背景中分割出来[6]等。在这些应用中,图象分割通常是为了进一步对图象进行分析、识别、编码压缩等,分割的准确性直接影响后续任务的有效性和正确性,因此具有十分重要的意义。

但由于图象种类的多样性,很难用一个精确的数学公式来表征图象分割的过程。因此,尽管分割的方法很多,但至今为止还没有一种通用的、可靠的自动分割算法[7]。可以预见,在未来的几年内,迫切需要解决的分割问题仍将是研究的热点。

1.2遗传算法发展简介

遗传算法(Genetic Algorithm, GA)是由美国密歇根大学J. Holland等人在七十年代首次提出,并发表了第一本比较系统论述遗传算法的专著《自然系统与人工系统中的适应性》(《Adaptation in Natural and Artificial Systems》),该书比较全面地介绍了遗传算法,并建立了它的数学框架。该方法一经提出便受到了关注,到80年代中期其研究开始进入高潮。人们通常把J. Holland所提出的遗传算法称为简单遗传算法或标准遗传算法,简记为SGA。在J. Holland的简单遗传算法基础上,人们不断对之进行各种改进和完善,并将SGA与其它算法相结合解决各自不同领域的问题。九十年代以后,遗传算法进入了它的发展期,随着以不确定性,非线性,时间不可逆为内涵,以复杂问题为对象的科学新范式得到学术界的普遍认同,遗传算法以其能有效的求解属于NP-完全类型的组合优化问题及非线性多模型,多目标的函数优化问题而得到了多种学科的广泛重视,不断地向广度和深度发展,遗传算法的理论与应用已全面展开。

遗传算法主要在复杂优化问题求解和工业工程领域应用,取得了一些令人信服的结果,所以引起了很多人的关注。遗传算法成功的应用包括:旅行商(TSP)问题、煤气管

道的优化、自动控制、车辆路径选择与调度、交通问题等。近年来迅速扩展到机器人工智能控制、设计规划、机器学习、神经网络优化、核反应堆控制、喷气发动机设计、通信网络设计、人工生命等领域,这些充分显示了遗传算法应用的巨大潜力。目前,遗传算法作为一种基于统计理论的优化和搜索技术,在计算机视觉领域中的应用也正日益受到重视,如在特征提取、图象匹配、图象分割中的应用。

1.3模糊理论简介

1965年美国自动控制专家、数学家扎德(L. A. Zadeh)在杂志《Information and Control》上发表了一篇开创性的论文“Fuzzy Set”,正式提出了多值集合理论[8],并把“模糊(Fuzzy)”一词引入技术文献中。

模糊数学从它诞生的那天起,便和计算机的发展息息相关,相辅相成。没有计算机,就没有模糊数学;没有模糊数学,计算机的应用也会大大受到限制。因为利用模糊数学构造数学模型、编制计算机程序,可以更广泛、更深入地模拟人的思维。而且,模糊数学既认识到事物“非此即彼”的明晰性状态,又认识到事物的“亦此亦彼”的模糊性状态,因此,其适应面比传统数学广泛得多。迄今为止,模糊数学已在模式识别、自动控制、信息处理、天气预报、地震研究、人工智能、医疗诊断、农作物选种以及心理学、生态学、语言学等多种领域内得到应用。

“模糊”是人类感知万物、获取知识、思维推理、决策实施的重要特征。“模糊”比“清晰”所拥有的信息容量更大,内涵更丰富,更符合客观世界。所谓模糊理论就是通过模拟人的这种模糊信息处理能力来处理实际问题的一门理论学科。模糊理论的提出,使人类对于客观世界的认识又前进了一大步。

到20世纪90年代,已经形成了具有完整体系和鲜明特点的模糊拓扑学[9]、框架日趋成熟的模糊随机数学[10]、模糊逻辑理论[11]以及模糊代数学等。这些理论的形成和发展无疑极大地丰富和完善了模糊理论的内容。模糊理论的应用已经遍及自然科学、社会科学和工程技术的各个领域,各种模糊技术成果和模糊产品也逐渐从实验室走向社会并取得了显著的社会效益。

1.4本文的研究内容和拟解决的关键问题

1.4.1本文的研究内容

本文将模糊理论和遗传算法有机结合起来,成功地应用到图象分割领域,比传统的方法更合理有效。其研究内容主要包括以下两个方面:

(1) 对标准遗传算法进行适当改进,在比例选择的基础上采用最优保存策略,提出了新的变量来衡量群体适应度的集中程度,从而对遗传算法的运行参数进行了自适应调整。

(2) 针对目标和背景两类图象分割,考虑二维灰度直方图,采用了一种更符合图象空间分布特点的隶属函数,建立了对应的二维图象模糊熵,分别采用标准遗传算法和改进的自适应遗传算法对二维图象模糊熵的各个参数进行优化,根据最大模糊熵准则,确定目标

和背景的最佳分割阈值,提高图象的分割运算效率。针对多目标的复杂图象分割问题,本文采用了一种三类阈值分割法,该方法将图象分为暗区、灰度区和亮区,通过建立相应的模糊隶属函数,对图象各个灰度级属于暗区、灰度区和亮区的模糊特性进行描述,应用指数熵的概念,基于概率分析,引进了一种新的模糊熵定义;并根据最大模糊熵准则,应用改进的自适应遗传算法,确定最佳的分割阈值。

1.4.2拟解决的关键问题

(1) 对于目标和背景的两类图象分割和多目标的复杂图象分割问题,如何恰当选择相应的模糊隶属函数,对图象各个灰度级的模糊特性进行描述。

(2) 以遗传算法作为优化工具,如何对模糊参数进行组合寻优,确定目标和背景的最佳分割阈值。如何对遗传控制参数作适当改进,自适应调整交叉概率和变异概率,提高算法的收敛率。

1.5本文的章节安排

本文的各章节安排如下:

第一章绪论。分别介绍了图象分割技术和研究意义、遗传算法发展简介和模糊理论简介。

第二章介绍图象分割的原理和方法。

第三章介绍遗传算法的基本理论。

第四章介绍模糊理论基础及其在图象处理中的应用。

第五章介绍基于标准遗传算法和改进的自适应遗传算法的二维最大模糊熵阈值分割法分割简单图象。然后介绍了基于改进的自适应遗传算法的最大模糊熵三类阈值分割法分割复杂图象。

第六章总结了本论文的主要工作、论文的创新点并指出将来研究的方向。

本课题先后得到以下专项研究基金的共同资助,特此致谢。

1) 国家自然科学基金:低雷诺数气动特性与微机电系统控制的多学科优化设计研究(项目号:50675161);

2) 湖北省国际科技合作重点研究项目:基于网络化智能体架构的微小型光机电系统(项目号:2006CA025);

第二章 图象分割原理和方法

2.1图象分割的理论基础

在对图象的研究和应用中,人们往往仅对图象中的某些部分感兴趣,这些部分常称为目标或前景(其它部分称为背景),一般对应于图象中特定的、具有独特性质的区域。为了辨识和分析目标,需要将它们分离提取出来,在此基础上才有可能对目标进一步利用。

图象分割是指把图象分成各具特性的区域并提取出感兴趣目标的技术和过程。这里特性可以是灰度、颜色、纹理等,目标可以对应单个区域,也可以对应多个区域。多年来,人们对图象分割提出了不同的解释和表达,可借助集合概念用如下比较正式的方法定义:

令集合R 代表整个图象区域,对R 的分割可看作将R 分成N 个满足以下五个条件的非空子集N R R R ,,,21???[12]:

1) R R

N i i ==∪1;

2) 当j i ≠,有Φ=j i R R ∩;

3) 对,,,2,1N i ???= 有TRUE R P i =)(;

4) 对j i ≠,有FALSE R R P j i =)(∪;

5) 对,,,2,1N i ???= i R 是连通的区域。

上述条件1指出:分割结果中全部子区域的总和应能包括图象中所有象素。条件2指出:分割结果中各个子区域是互不重叠的。条件3指出:分割结果中每个子区域都有独特的特性。条件4指出:分割结果中不同的子区域具有不同的特性,没有公共元素。条件5指出:分割结果中同一个子区域内的象素是连通的。

2.2图象分割的基本方法

图象分割方法一般可分为三类[13]:边缘检测法,区域的生长和分裂合并法,以及阈值分割法。

2.2.1边缘检测

图象的边缘是图象最基本的特征之一,基于边缘的分割方法可以说是人们最早研究的方法。所谓边缘是指其周围象素灰度有阶跃变化的象素的集合。边缘广泛的存在于物体与背景之间、物体和物体之间,它是图象分割所依赖的重要特征。边缘检测方法试图通过检测不同区域间的边缘来解决图象分割问题。边缘检测技术可以按照处理的顺序分为串行边缘检测以及并行边缘检测。在串行边缘检测技术中,当前象素点是否属于检测的边缘,取决于先前象素的验证结果;而在并行边缘检测技术中,一个象素点是否属于检测的边缘,取决于当前正在检测的象素点以及该象素点的一些相邻象素点,这样该模型可以同时用于检测图象中的所有象素点,因而称之为并行边缘检测技术。边缘检测常借助微分算子进行,

通过将微分算子对应的模板与图象相卷积,可检测出灰度不连续(或突变)的边缘。常用的微分算子有梯度算子(例如Robert算子、Prewitt算子、Sobel算子)、方向算子(例如Kirsch算子)、拉普拉斯算子、马尔算子、综合正交算子、坎尼算子和沈俊算子等[14]。

对于实际含有噪声的图象,仅用微分算子检测出的边缘点并不能组成封闭的边界而将目标从背景中分离出来。所以还需要利用检测到的边缘点组成目标的边界,例如,利用哈夫(Hough)变换,通过在参数空间的累加运算完成从图象空间(不连续)边缘点获取区域封闭边界的工作。近年来,边缘检测技术领域出现了一些新的方法,例如边缘拟合[15-16]、曲线拟合[17]、基于反应-扩散方程[18-19]、形变模型[20-21]的方法等。

2.2.2区域的生长和分裂合并

区域生长和分裂合并是两种典型的串行区域分割方法。其特点是:将分割过程分为顺序的多个步骤,且后续步骤需根据前面步骤的结果进行判断而确定。

区域生长的基本思想是:将具有相似性质的象素集合起来构成区域。先对每个要分割的区域找一个种子象素作为生长的起点,然后将种子象素周围邻域中与种子象素有相同或相似性质的象素合并到种子象素所在的区域。将这些新象素当作新的种子象素继续上述过程,直到再没有满足条件的象素可以包括进来。这样一个区域就生成了。所以区域生长是从单个种子象素开始,通过不断接纳新象素得到整个区域。

区域的分裂合并则是首先把图象分成任意大小互不重叠的区域,然后再合并或者分裂这些区域,最后得到分割结果。

区域生长往往是与其它分割方法一起使用,特别适用于分割小的结构,如分割医学图象中的肿瘤和伤疤。区域生长的缺点为:(1) 需要人工交互以获得种子点,这样使用者必须在每个需要抽取出的区域中植入一个种子点。(2) 区域生长方式对噪声较敏感,会导致抽取出的区域出现空洞。(3) 往往会造成过度分割,即将图象分割成过多的区域。区域生长方式的优点是计算简单。区域生长和分裂合并的关键都是要选择一个合适的准则,其中最常用的是基于灰度统计特征的准则。人们往往将基于区域信息的方法与其它方法,主要是边缘检测的方法结合起来,研究结合区域与边界信息的方法[22]。例如松弛迭代法[23],就是利用两种算法的优点,使分割既能在每个局部并行进行,又能借助迭代,利用运算中获取的信息不断调整,以自适应地取得较好的分割效果。

2.2.3阈值分割

阈值分割是最常见的直接检测区域的分割方法。如果只需选取一个阈值,则称为单阈值分割,它将图象分为目标和背景两大类;如果选取多个阈值,则称为多阈值分割,此时图象将被分割成多个目标区域和背景,为了区分目标,还需对各个目标区域进行标记。阈值分割方法是基于对灰度图象的一种假设:目标或背景内的相邻象素间的灰度值是相似的,但不同目标或背景的象素在灰度上有差异,反映在图象的直方图上,不同的目标、背景则对应不同的峰,选取的阈值应位于两个峰之间的谷,从而将各个峰分开。

阈值分割的优点是实现简单,当不同类的物体灰度值或其它特征值相差较大时,该方

法能有效地实现对图象的分割。阈值分割的缺点是:对于图象中不存在明显灰度差异或灰度值范围有较大重叠时,难以得到准确的结果。另外,由于它仅仅考虑了图象的灰度信息而未考虑图象的空间信息,阈值分割法对噪声和灰度不均匀较敏感。如何选取合适的阈值,是阈值分割方法的关键和难点所在。

最早的阈值化方法是1962年Doyle提出的p-tile法[24],该方法假设已知图象中目标和背景两类所占的面积比例,选取阈值使两类象素符合该比例。此方法的问题在于这种假设难以成立。

1966年Prewitt等提出了mode法,即常用的双峰直方图谷底法[25],对于目标与背景的灰度级有明显差异的图象,其灰度直方图的分布呈双峰状,两个波峰分别与图象中的目标和背景相对应,波谷与图象边缘相对应;当分割阈值位于谷底时,图象分割可取得最好的分割效果。该方法对双峰差异大、具有宽谷的直方图分割效果不理想,对单峰的图象则无法进行分割。

1979年提出的Otsu法中[26],阈值t把图象的象素点分为目标与背景,通过求取类间方差的最大值来求得最佳分割阈值,使得分割后图象的目标和背景的差异最大。

1986年提出的最小错误法[27]假定目标和背景的灰度值分布是均值、方差、先验概率的正态分布,把图象的灰度直方图看作是对概率密度函数的估计,在此假设的基础上,当按某一阈值分割后,目标象素被划分到背景及背景象素被划分到目标的错误率最小时,此阈值即为最佳分割阈值。

八十年代后,其它领域的概念被引入到阈值化图象分割领域,不断的提出了一些新的算法,例如利用模式识别理论的最大类间方差法、K均值聚类法等,其中给阈值化分割带来最大影响的是信息论和模糊集合理论的引入。1985年Kapur基于图象信号的随机性,应用信息熵的概念,提出了最大熵图象分割方法[28]。在该算法中,Kapur等将目标和背景看成两个子系统,并具有各自的概率分布,分割的最优准则是使两个子系统独立香农熵的和最大,直观而言,就是使目标(背景)内部的灰度尽可能呈均匀分布,即强调灰度相似性。上述方法只是基于一维灰度统计,对具有相同直方图的不同图象会产生相同的阈值化结果,这与人们的经验和知觉是不相符的,且当图象受噪声影响较大时,分割效果也会受到较大影响。为此,考虑图象二维信息的基于灰度共生矩阵或散射图的二阶熵算法很快被Pal 等学者提出,该方法是利用二维灰度直方图,对最大熵分割方法进行的改进[29-31]。由于图象所具有的不确定性往往是模糊性,而不仅仅是随机性。模糊理论能较好的体现这类特性,例如在灰度特征表达上,应用模糊理论可将某一图象的灰度值表征为对某类特征的隶属度。基于此,模糊理论被引入到图象分割领域,并且得到了广泛的应用。尤其是与信息熵理论的结合,提出了模糊熵[32-33]、模糊散度[34]等新的分割方法。

2.2.4其它分割方法

近年来,随着新理论和新工具的不断引入,出现了一些新的分割方法。前面介绍的只是几类较常用的方法及其改进,还有其它的分割方法,无法准确的划分到上面的某一类方

法中,如基于数学形态学的方法、基于模式识别中聚类的方法等。

数学形态学在图象处理中的应用近年来日渐受到重视,许多系统采用形态学算子对图象进行预处理或后处理。形态学图象处理采用在图象中移动一个结构元素并进行卷积的方式进行,结构元素可以具有任意大小。基本的形态学操作包括腐蚀和膨胀,基本运算的组合可产生较复杂的效果。比较有代表性的形态学图象分割方法是Luc Vincent等人提出的分水岭(watershed)分割算法[35],在此基础上,研究人员至今已提出了多种基于watershed 的形态学分割方法。虽然这些方法已成功地应用于图象分割,但它们需要用户的交互或准确的关于图象结构的先验知识。为改进早期方法所存在的问题,watershed算法通常与其它方法结合使用,K. Har提出将watershed与分层区域合并方法结合[36],B. Chanda给出了一种基于形态学算子的多尺度滤波算法[37],文献[38]中介绍了一种在分水岭算法基础上的松弛标号法。

聚类是模式识别领域中一种基本的分析方法。聚类是一种无监督的统计方法,因为没有训练样本集,聚类算法迭代地执行图象分类和提取各类的特征值。从某种意义上说,聚类是一种自我训练的分类。其中,K均值法、模糊C均值法、EM(Expectation Maximization)算法和分层聚类方法是常用的聚类算法。20世纪80年代以来,聚类方法开始被用于核磁图象多参数特性空间的分类,如脑白质和灰质的分割。随着近十年来医学影象数据保真度的提高,这类方法逐渐发展成熟起来,出现了一些改进的聚类算法,减小了图象灰度不均匀和噪声的影响,并在磁共振图象上取得了成功[39]。其中最有名的方法是Wells等人提出的自适应分割方法[40]。

在20世纪80年代后期,在图象处理、模式识别和计算机视觉的主流领域,受到人工智能发展的影响,出现了将更高层次的推理机制用于识别系统的做法。这种思路也开始影响图象分割方法,在解决具体问题时,出现了基于神经网络模型(ANN)的方法。神经网络模拟生物,特别是人类大脑的学习过程,它由大量并行的节点构成。每个节点都能执行一些基本的计算。学习过程通过调整节点间的连接关系以及连接的权值来实现。神经网络技术的产生背景是为了满足对噪声的鲁棒性以及实时输出要求的应用场合而提出的,一些研究人员也尝试了利用神经网络技术来解决图象分割问题。典型方法如:Blanz和Gish等人利用前向三层网络来解决分割问题[41],Babaguchi等人则使用了多层网络并且用反向传播方法对网络进行训练[42],Ghosh等人构造了大规模连接网络,并在此基础上从噪声环境中提取目标物体[43],Shah等人将边缘检测问题转换为能量最小化问题,利用ANN技术来提取边缘[44]。

第三章遗传算法的基本理论

生命科学与工程科学相互交叉、相互促进是近代科学技术发展的趋势。遗传算法的蓬勃发展正体现了学科发展的这一特征和趋势。工程领域中大量的复杂、非线性的优化问题,无法采用传统优化方法解决,而遗传算法作为一种新的全局搜索算法,具有简单、通用、鲁棒性强,易于并行性的特点,广泛应用于工程设计的优化,系统辨识和控制,机器学习,图象处理和智能信息处理等领域。

本章主要论述遗传算法的基本概念、原理,标准遗传算法,以及遗传算法的特点等。

3.1遗传算法的基本概念

遗传算法是基于自然选择,在计算机上模拟生物进化机制的寻优搜索算法。在自然界的演化工程中,生物体通过遗传(传种接代,后代与父辈非常相象)、变异(后代与父辈又不完全相象)来适应外界环境,一代又一代地优胜劣汰,发展进化。遗传算法则模拟了上述进化现象。它把搜索空间(欲求解问题的解空间)映射为遗传空间,即把每一个可能的解编码为一个向量(二进制或十进制数字串),称为一个染色体,向量的每一个元素称为基因。所有染色体组成群体,并按预定的目标函数(或某种评价指标)对每个染色体进行评价,根据其结果给出一个适应度的值。算法开始时先随机地产生一些染色体(欲求问题的候选解),计算其适应度,根据适应度对各染色体进行选择复制、交叉、变异等遗传操作,剔除适应度低(性能不佳)的染色体,留下适应度高(性能优良)的染色体,从而得到新的群体。由于新群体的成员是上一代群体的优秀者,继承了上一代的优良性态,因而明显优于上一代。遗传算法就这样反复迭代,向着更优解的方向进化,直至满足某种预定的优化指标。

遗传算法中的基本术语:

群体 (population):又称种群、染色体群,个体 (individual) 的集合,代表问题的解空间子集。

群体规模 (population size):染色体群中个体的数目称为群体的大小或群体规模。

适应度 (fitness):用来度量种群中个体优劣(符合条件的程度)的指标值,它通常表现为数值形式。

选择 (selection):根据染色体对应的适应值和问题的要求,筛选种群中的染色体,染色体的适应度越高,保存下来的概率越大,反之则越小,甚至被淘汰。

交叉 (crossover):指在一定条件下两条染色体上的一个或几个基因相互交换位置。

交叉概率:判断是否满足交叉条件的一个小于1的阈值。

变异 (mutation):指在一定条件下随即改变一条染色体上的一个或几个基因值。

变异概率:判断是否满足变异条件的一个小于1的阈值。

后代:染色体经过交换或变异后形成的新的个体。

3.2标准遗传算法

3.2.1标准遗传算法的基本流程

标准遗传算法(SGA)的基本流程如图3.1所示,算法主要步骤如下:

(1) 随机产生初始群体,作为第一代。个体长度、群体规模、交叉概率、变异概率为固定值;

(2) 对父代群体计算适应度值;

(3) 判断是否满足终止条件,是,则执行步骤4;否则,进行选择、交叉、变异操作形成子代群体,并将子代群体作为下一次迭代的父代群体,转入执行步骤2;

(4) 输出最佳个体,退出。

图3.1 标准遗传算法流程图

3.2.2标准遗传算法的要素

遗传算法具有五个基本要素:编码,初始群体的设定,适应度函数的设定,遗传算子,控制参数的设定。

(1) 编码

在遗传算法中,编码方法是把问题的搜索空间中每个可能的点表示为确定长度的特征串。编码方法的确定需要选择串长和字母表规模。在染色体串和问题的搜索空间中的点之间选择映射有时容易实现,有时又非常困难。选择一个便于遗传算法求解问题的编码方法经常需要对问题有深入的了解。二进制串是遗传算法中常用的表示方法,即0、1字符串。例如:对于[0,255]之间的数,可用8位二进制编码来表示,即用00000000-11111111来表

示[0,255]之间的数。

(2) 初始群体的设定

由多个染色体组成具有一定群体规模的染色体集合或称解的集合。遗传算法将基于这个集合进行遗传操作,每一轮操作(包括选择、交叉、变异)后生存下来的染色体组成新的种群,形成可以繁衍下一代的群体。初始种群的选取与实际问题有关,通常初始种群是随机产生的。

(3) 适应度函数

遗传算法在搜索过程中基本不采用外部信息,仅以适应度函数为依据引导搜索。当适应度函数确定以后,自然选择规律是以适应度函数值的大小以及问题的要求来确定哪些染色体适应生存,哪些被淘汰。

(4) 遗传算子

标准遗传算法的操作算子一般包括选择 (selection)、交叉 (crossover) 和变异 (mutation) 三种基本形式,它们构成了遗传算法具备强大搜索能力的核心,是模拟自然选择以及遗传过程中发生的繁殖、杂交和突变现象的主要载体。

遗传算法利用遗传算子产生新一代群体来实现群体进化,算子的设计是遗传策略的主要组成部分,也是调整和控制进化过程的基本工具。

1) 选择算子

选择算子的作用是从当前群体中选择出一些比较优良的个体,并将其复制到下一代群体中。选择算子有很多,轮盘赌法是最常用和最基本的比例选择方法,具体作法是:将所有染色体的适应值之和看做一个轮盘,每个染色根据其适应值的大小划分在轮盘中占据的范围。然后,旋转轮盘,当轮盘停下时,指针所对应的染色体即被选中,完成一次选种。不断旋转轮盘和选种,直到选择到所需要的染色体个数为止。

对于给定的规模为n 的群体12{,,,}n P v v v = ,个体k v 的适应度值为()k fit v ,则每个染色体的选择概率为:

1

()

1,2,,()k k n k

k fit v p k n fit v ===∑ (3.1) 每个染色体的累积概率为: 1

1,2,,n k j j q p k n ===∑ (3.2)

步骤1:在[0,1]区间内产生一个均匀分布的随机数r 。

步骤2:若r 1<q ,则选择1v ;否则,选择第k 染色体k v (2k n ≤≤),使得r k <q 成立。

2) 交叉算子

交叉操作模拟生物进化过程中的繁殖现象,通过两条染色体上的一个或几个基因相互交换位置,来产生新的优良品种。

交叉算子有多种,其中最简单的单点交叉算子的作用过程如下:首先,在匹配集中任

选两个染色体,这对染色体称为双亲染色体;然后,在[1,]l 区间产生随机数s 作为标定交

叉断点的位置(其中l 是染色体数字串的长度)

;最后,按交叉概率c p 交换双亲染色体交叉点右边的部分,生成后代染色体。当染色体长度为l 时,有1l ?个交叉位置,单点交叉可实现1l ?种不同的交叉结果。图3.2是交叉操作示例,字符串间的虚线表示交叉点的位置。

双亲 [001011100111100000001010][110100000110110001100110]

子代 [001011100110110001100110][110100000111100000001010]

图3.2 交叉操作示例

交叉运算是产生新个体的主要方法,它决定了遗传算法的全局搜索能力。

3) 变异算子

变异操作用来模拟生物在自然的遗传环境中由于各种偶然因素引起的基因突变,它以一个很小的变异概率m p 随机地改变遗传基因(表示染色体的符号串的某一位)的值。在染色体以二进制编码的系统中,它随机地将染色体的某一个基因由1变成0,或由0变成1。为了保证个体变异后不会与其父代产生太大的差异,变异概率一般取值较小,以保证种群发展的稳定性。

当交叉操作产生的后代个体的适应度值不再比它们的前代更好,但又未达到全局最优解时,就会发生成熟前收敛或早熟收敛 (premature convergence)。这时引入变异算子往往能产生很好的效果。一方面,变异算子可以使群体进化过程中丢失的等位基因信息得以恢复,以保持群体中的个体差异性,防止发生成熟前收敛;另一方面,当种群规模较大时,在交叉操作基础上引入适度的变异,也能够提高遗传算法的局部搜索效率。

(5) 控制参数的设定

在遗传算法的运行过程中,存在着对其性能产生重大影响的一组参数。这组参数在初始阶段或群体进化过程中需要合理的选择和控制,以使GA 以最佳的搜索轨迹达到最优解。主要参数包括染色体位串长度l 、群体规模n 、交叉概率c p 、变异概率m p 、终止代数T 等。许多学者进行了大量实验研究,给出了最优参数建议[45-46]。

1) 编码串长度l

使用二进制编码来表示个体时,编码串长度l 的选取与问题的求解精度有关。本文的个体为图象的灰度值,只要精确到1即可,另外灰度值范围为0~255。因此,编码串长度l 应选8。

2) 群体规模n

群体规模n 表示群体中所含个体的数量。当n 取值较小时,可提高遗传算法的运算速度,但降低了群体的多样性,有时可能会引起遗传算法的早熟现象;当n 取值较大时,又会使得遗传算法的运行效率降低。一般情况下20200n =~。

3) 交叉概率c p

交叉概率控制着交叉算子的应用频率,在每一代新的群体中,需要对c p n ×个个体的染色体结构进行交叉操作。交叉概率越高,群体中新结构的引入愈快,已获得的优良基因结构的丢失速度也相应加快。而交叉概率太低则可能导致搜索阻滞。一般0.6 1.0c p =~。

4) 变异概率m p

变异操作是保持群体多样性的有效手段,交叉结束后,交配池中的全部个体位串上的每位等位基因按变异概率m p 随机改变,因此每代中大约发生m p n l ××次变异。变异概率太小,可能使某些基因位过早丢失的信息无法恢复,而变异概率过高,则遗传搜索将变成随机搜索。一般取0.0050.01m p =~。

5) 终止代数T

终止代数T 是表示遗传算法运行结束条件的一个参数,它表示遗传算法运行到指定的进化代数之后就停止运行,并将当前群体中的最佳个体作为所求问题的最优解输出。

实际上,上述参数与问题的类型有着直接的关系。问题的目标函数越复杂,参数选择就越困难。从理论上讲,不存在一组适用于所有问题的最佳参数值,随着问题特征的变化,有效参数的差异往往非常显著。因此,如何设定遗传算法的控制参数以使遗传算法的性能得到改善,还需要结合实际问题深入研究,以及有赖于遗传算法理论研究的新进展。

3.3遗传算法的基本定理

遗传算法作为一种智能搜索算法,采用五大要素控制算法的搜索方向。它的理论基础是模式定理和积木假说。

[模式定理]:在遗传操作数选择、交叉和变异的作用下,具有低阶、短定义距以及平均适应度高于种群适应度的模式在子代中将得以指数级增长。

模式定理是遗传算法的理论基础。根据模式定理,那些低阶、短定义距、高平均适应度的模式越来越多,最后得到这些模式的组合,性能得到改善,最终趋向全局的最优解。

[积木块假设]:低阶、短定义距、高平均适应度的模式(积木块)在遗传操作数作用下,相互结合,能生成高阶、长距、高平均适应度的模式,最终生成全局最优解。

模式定理保证了较优模式的样本数呈指数级增长,从而满足了寻找最优解的必要条件。而积木块假设则指出了遗传算法具备寻找全局最优解的能力,有了以上两点保证,我们就可以利用遗传算法来求解任何可以表示为优化过程的问题。

3.4遗传算法的特点

遗传算法是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局概率搜索算法,与其它一些优化算法相比,它具有以下几个特点:

(1) 遗传算法作用于决策变量的编码,传统优化算法往往直接作用于决策变量的实际值上。

(2) 遗传算法直接以适应度函数作为搜索信息,传统优化算法往往需要其它辅助信息

来决定搜索方向。

(3) 遗传算法同时使用多个起始点的搜索信息,传统优化算法往往基于单个点进行迭代搜索。

(4) 遗传算法使用概率转移规则,传统优化算法一般使用确定性规则。

3.5遗传算法的理论及应用研究现状

3.5.1遗传算法的理论研究现状

遗传算法的理论研究是目前的难点和热点,主要有以下几点:

(1) 遗传算法的理论基础和数学模型

遗传算法的理论基础、数学模型主要集中于对算法的收敛性、复杂性、收敛速度的研究。

对于遗传算法的收敛条件不仅仅限于固定遗传代数,人们还提出了利用某些判别准则。如:连续几代的个体平均适应度差为极小值,种群适应度的方差小于一个阈值[47]等。在收敛性的问题中,为避免早熟、停滞,在设计算法时,一方面寻求加快收敛的搜索策略,另一方面,又要防止算法陷于局部极小、停滞状态。

近年来,在GA的全局收敛性分析方面取得了重大突破,一般是应用Markov链对GA 建模和分析。Rudolph证明了标准遗传算法(SGA)不能收敛至全局最佳值[48]。Grefenstette 提出的保留最佳个体法(EGA),最终以概率1收敛到全局最优[49]。Qi和Palmieri对以浮点数编码的GA的全局收敛性进行了严密的分析[50]。恽为民等[51]证明了SGA不是全局收敛的,具有比例复制和自适应交叉和变异的GA是全局收敛的,为GA提供了必要的理论指导,指出了造成一定概率不全局收敛的主要原因。

GA的收敛效率分析主要有两种:基于模式的效率分析和基于Markov链的效率分析。基于模式的分析主要是协调每次遗传操作产生的新模式并有效保留模式。Markov链能对GA进行严格的数学分析、文献[51]得出了“极限分布概率原则”,对GA应用中设计合适的操作策略提供了依据。

(2) 混合遗传算法的研究

遗传算法与其它优化方法结合形成各种混合遗传算法(HGA)。遗传算法的特点是只需问题的编码和对象函数,而不依赖于其它辅助信息。但是对于特定问题,GA就不如利用特定问题的独特信息解决问题的其它方法。因此如果将特殊问题信息与GA结合会使GA 得到改进。如与通用性较强的启发式搜索算法模拟退火法[52]、爬山法、列表寻优法结合构成的HGA。

(3) 并行遗传算法

GA的突出特点是易于并行化。但现有算法多采用串行算法,没有发挥GA的特点,因此GA并行化方法随着并行计算机的发展逐渐受到重视。目前,并行遗传算法(PGA)已经成为GA研究的主要内容之一。典型的PGA包括鼓捣模型、网络模型[53-54],分别应用于不同的硬件体系MIMD、SIMD并行机上。

孤岛模型的主要思想是令多个子种群同时进化,周期性地对个体进行迁徙交换,形成新的子群体。Petty等已经证明,综合考虑母本选择、交叉变异的效应,孤岛模型对染色体的搜索次数上限可用指数函数描述。大量的试验表明,孤岛模型只需较小的迁移率就可获得比全部个体随机操作的方法更好的性能,并已成功地用于MIMD和SIMD结构的并行机上。网络模型使用单一种群,将每一个体置于网格节点上,交叉只作用于邻域之上。该模型求解复杂问题比求解简单问题具有更高的效率。

(4) 新算法模型

从生物进化或自然界的各种现象中获得新的启发,提出新的方法,或对现有的算法进行改进。典型的例子如孤岛模型、二倍体显性技术、小生境技术等。

3.5.2遗传算法的应用研究现状

目前,遗传算法在很多科学、工程领域得到了广泛的应用。其典型应用领域如下:

(1) 复杂的非线性优化算法问题

对于具有多峰的非线性优化问题,普通优化算法一般很难达到全局最优解,而遗传算法可以克服这一缺点,在整个问题空间搜索,找到全局最优解。

(2) 复杂的组合优化问题

经典的组合优化问题如:背包问题(knapsack problem)、旅行商问题(TSP)、图划分等适于采用遗传算法解决。其中TSP问题已被广泛的应用于评价不同遗传操作及选择机制的性能。针对这些经典的寻优问题,提出了多种GA改进算法,效果接近模拟退火的最优解。

(3) 计算机科学

应用于图象处理、模式识别等方面。在科研领域中,大量的文献将GA应用于边缘检测[55]、图象分割[56]、阈值选取[57]、图象编码[58]、自动目标识别等领域。

(4) 神经网络

GA与神经网络的结合是目前发展的一个趋势,这一点可以从大量的文献中看到,如优化神经网络的权系数和网络的空间结构。GA在神经网络中的应用主要有用GA选择神经网络的学习规则与算法参数,利用GA分析神经网络的性能等。

(5) 工程应用

遗传算法广泛应用于工程领域。如通讯网络的优化设计,大规模集成电路的布线设计、飞机外形设计、管道控制等。

(6) 社会学领域

如应用于人口的迁移模型、运筹学等问题。

目前,遗传算法作为一种新的全局优化搜索算法以其简单、鲁棒性强、易于并行化、应用范围广等特点,已经成为一种解决复杂问题的新思路新方法,并广泛应用于函数优化、自动控制、图象识别、机器学习、优化调度等许多领域,是二十一世纪智能计算的关键技术之一。

图像分割方法综述

图像分割方法综述

图像分割方法综述 摘要:图像分割是计算计视觉研究中的经典难题,已成为图像理解领域关注的一个热点,本文对近年来图像分割方法的研究现状与新进展进行了系统的阐述。同时也对图像分割未来的发展趋势进行了展望。 关键词:图像分割;区域生长;活动边缘;聚类分析;遗传算法 Abstract:Image segmentation is a classic problem in computer vision,and become a hot topic in the field of image understanding. the research actuality and new progress about image segmentation in recent years are stated in this paper. And discussed the development trend about the image segmentation. Key words: image segmentation; regional growing; active contour; clustering

analysis genetic algorithm 1 引言 图像分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,同时也是图像处理中最困难的问题之一。所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内表现出一致性或相似性,而在不同区域间表现出明显的不同。简单的说就是在一副图像中,把目标从背景中分离出来。对于灰度图像来说,区域内部的像素一般具有灰度相似性,而在区域的边界上一般具有灰度不连续性。 关于图像分割技术,由于问题本身的重要性和困难性,从20世纪70年代起图像分割问题就吸引了很多研究人员为之付出了巨大的努力。虽然到目前为止,还不存在一个通用的完美的图像分割的方法,但是对于图像分割的一般性规律则基本上已经达成的共识,已经产生了相当多的研究成果和方法。本文根据图像发展的历程,从传统的图像分割方法、结合特定工具的图像分割方

两个matlab实现最大熵法图像分割程序

%两个程序,亲测可用 clear all a=imread('moon.tif'); figure,imshow(a) count=imhist(a); [m,n]=size(a); N=m*n; L=256; count=count/N;%%每一个像素的分布概率 count for i=1:L if count(i)~=0 st=i-1; break; end end st for i=L:-1:1 if count(i)~=0 nd=i-1; break; end end nd f=count(st+1:nd+1); %f是每个灰度出现的概率 size(f) E=[]; for Th=st:nd-1 %%%设定初始分割阈值为Th av1=0; av2=0; Pth=sum(count(1:Th+1)); %%%第一类的平均相对熵为 for i=0:Th av1=av1-count(i+1)/Pth*log(count(i+1)/Pth+0.00001); end %%%第二类的平均相对熵为 for i=Th+1:L-1 av2=av2-count(i+1)/(1-Pth)*log(count(i+1)/(1-Pth)+0.00001); end E(Th-st+1)=av1+av2; end position=find(E==(max(E))); th=st+position-1

for i=1:m for j=1:n if a(i,j)>th a(i,j)=255; else a(i,j)=0; end end end figure,imshow(a); %%%%%%%%%%%%%%%%%%%%%2-d 最大熵法(递推方法) %%%%%%%%%%% clear all; clc; tic a=imread('trial2_2.tiff'); figure,imshow(a); a0=double(a); [m,n]=size(a); h=1; a1=zeros(m,n); % 计算平均领域灰度的一维灰度直方图 for i=1:m for j=1:n for k=-h:h for w=-h:h; p=i+k; q=j+w; if (p<=0)|( p>m) p=i; end if (q<=0)|(q>n) q=j; end a1(i,j)=a0(p,q)+a1(i,j); end end a2(i,j)=uint8(1/9*a1(i,j)); end

基于纹理的图像分割方法.

基于纹理的图像分割方法 全部作者: 蔡振江王渝 第1作者单位: 河北农业大学机电工程学院 论文摘要: 采用平稳离散小波变换对纹理图像进行分解,利用各层小波系数中能量为特征相向量,采用模糊c-均值聚类(FCMC)对图像分割,并对分割方法进行了改进,提出先对图像进行粗分割,再对边缘部分进行细分的两步分割法。试验结果表明该方法大大提高了分割速度和精度。 关键词: 平稳小波;纹理;分割;模糊聚类 (浏览全文) 发表日期: 2006年11月28日 同行评议: 论文在前人基于小波变换的图像分割的基础上,进行了1下小的改进(主要是分割迭代速度的提高),结合模糊聚类方法FCM来进行图像分割。论文的理论创新不是明显,改进后的方法没有在分割质量上与前人方法进行对比,仅仅是时间上做了1些对比。因此,本文工作的科学意义不是很突出。建议作者进行如下方面的改进: (1)、纹理分割的方法很多,基于小波变换来进行分割的论文也不少,建议作者对前人的工作总结分析方面要充分些;(2)、论文工作在分割效果(精度)上要与前人工作做1些实验对比;否则,如何看出本文方法的分割精度比前人方法明显提高?(3)、实验数据能否更充分些?(因为图3所示的图片可能用许多传统方法也能得到不错的分割效果)。表1要做1点简单说明。(4)、为什么要采用FCM来进行聚类?聚类方法很多,例如用最基本的K-Means是否就可以取得不错的结果?(5)、英文摘要需要改写,个别词汇用法及语句表达不是很流畅。 综合评价: 修改稿:

注:同行评议是由特聘的同行专家给出的评审意见,综合评价是综合专家对论文各要素的评议得出的数值,以1至5颗星显示。

图像处理--采用最大熵方法进行图像分割

数字图象处理课程设计 题目:采用最大熵方法进行图像分割 班级:电信121 学号:3120412014 姓名:吴向荣 指导老师:王栋 起止时间:2016.1.4~2016.1.8 西安理工大学

源代码: clear,clc image=imread('C:\Users\Administrator\Desktop\图像课设\3.jpg'); subplot(2,2,1);imshow(image);title('原始彩图') %% %灰度图 imagegray=rgb2gray(image); %彩色图转换为灰度图 subplot(2,2,2);imshow(imagegray);title('灰度图') %计算灰度直方图分布counts和x分别为返回直方图数据向量和相应的彩色向量count=imhist(imagegray); subplot(2,2,3);imhist(imagegray);title('灰度直方图') [m,n]=size(imagegray); imagegray=fun_maxgray(count,imagegray,m,n); subplot(2,2,4);imshow(imagegray);title('最大熵处理后的图') %% 彩色图 % r=image(:,:,1);countr=imhist(r);r=fun_maxgray(countr,r,m,n); % subplot(2,2,1);imshow(r); % g=image(:,:,2);countg=imhist(g);g=fun_maxgray(countg,g,m,n); % subplot(2,2,2);imshow(g); % b=image(:,:,3);countb=imhist(b);b=fun_maxgray(countb,b,m,n); % subplot(2,2,3);imshow(b); b=0; for z=1:3 figure titleName = strcat('第',num2str(z),'通道灰度直方图'); titleName1 = strcat('第',num2str(z),'通道最大熵处理后图'); a=image(:,:,z);subplot(1,2,1);imhist(a);title(titleName) countr=imhist(a);a=fun_maxgray(countr,a,m,n); subplot(1,2,2);imshow(a);title(titleName1) b=b+a; end figure,imshow(b);title('彩色各通道处理后叠加图') 最大熵方法进行图像分割的子函数: function sample=fun_maxgray(count,sample,m,n) countp=count/(m*n); %每一个像素的分布概率 E=[]; E1=0; E2=0;

图像退化-图像复原

4记录和整理实验报告。图像降质的数学模型 图像复原处理的关键问题在于建立退化模型。输入图像f(x, y)经过某个退化系统后输出的是一幅退化的图像。为了讨论方便, 把噪声引起的退化即噪声对图像的影响一般作为加性噪声 考虑, 这也与许多实际应用情况一致,如图像数字化时的量化 噪声、 随机噪声等就可以作为加性噪声,即使不是加性噪声而 是乘性噪声, 也可以用对数方式将其转化为相加形式。 原始图像f(x, y) 经过一个退化算子或退化系统H(x, y) 的作 用, 再和噪声n(x,y)进行叠加,形成退化后的图像g(x, y)。图2-1表示退化过程的输入和输出的关系,其中H(x, y)概括了退化系统的物理过程,就是所要寻找的退化数学模型。 图2-1 图像的退化模型 数字图像的图像恢复问题可看作是: 根据退化图像g(x , y)和退化算子H(x , y)的形式,沿着反向过程去求解原始图像f(x , y), 或者说是逆向地寻找原始 图像的最佳近似估计。图像退化的过程可以用数学表达式写成如下的形式: g(x, y)=H [f(x, y)]+n(x, y) (2-1) 在这里,n(x, y)是一种统计性质的信息。在实际应用中, 往往假设噪声是白噪声,即它的频谱密度为常数,并且与图像不相关。 在图像复原处理中, 尽管非线性、 时变和空间变化的系统模型更具有普遍性和准确性,更与复杂的退化环境相接近,但它给实际处理工作带来了巨大的困难, 常常找不到解或者很难用计算机来处理。因此,在图像复原处理中, 往往用线性系统和空间不变系统模型来加以近似。这种近似的优点使得线性系统中的许多理论可直接用于解决图像复原问题,同时又不失可用性。 H (x , y )f (x , y )g (x , y ) n (x , y )

使用颜色、纹理图像分割超复数的Gabor分析

信号与图像处理:国际期刊(SIPIJ)第一卷,第2期,2010年12月 使用颜色、纹理图像分割超复数的Gabor分析 B.D.Venkatramana 1 Reddy和 Dr.T.Jayachandra 2 Prasad 电子与通信工程学院技术与科学系,Madanapalle-517325,印度安得拉邦 电子与通信工程学院RGM工程技术系,Nandyal-518501,印度安得拉邦 摘要 纹理分析,如分割和分类在计算机视觉和模式识别中起着重要作用,得到广泛认可,并应用到许多领域,如工业自动化生物医学图像处理和遥感。在本文中,我们第一次扩展了著名的Gabor过滤器对彩色图像使用特定形式的复数数字称为四元数,这些筛选器被构造作为窗口基础功能的四元数傅里叶变换也称为傅里叶变换的超复数。在此基础上扩展本文提出了利用这些新的四元数Gabor滤波器的彩色纹理图像的分割。两个颜色纹理图像实验结果,我们通过添加到纹理图像的高斯噪声测试这种技术用于分割的鲁棒性。实验结果表明,即使在强烈噪声的存在下,该方法具有更好的分割效果。 关键词 彩色纹理图像分割,Gabor滤波器,超复数,四元数,四元数傅里叶变换 1、序言 纹理是人类认识对象的一个基本的提示,研究纹理是一个在计算机视觉及其应用中非常重要的任务。在过去的三十

年,这是一个非常积极的话题。有几个研究主要集中在纹理分析领域,主要是包括纹理分类,纹理分割,纹理合成,纹理塑造等。图象纹理处理的任务是将给定的图像转换成均匀纹理区域。这个纹理分割问题是一般图像分割问题的一个分支,是许多计算机视觉任务的重要一步。关于全局化的灰度值或平均值超过一些邻阈的灰度值,是由于大多数情况下没有足够的正确的分割。 提出的问题是相当模糊的,因为长期对于纹理没有明确的界定,并没有表征纹理的局部灰度值变化的数学表征作为人类观察员,出于这个重要原因采取了不同的纹理分割方法。由于局部纹理统计特性的表征和局部几何构造块已被使用,在纹理分割另一个分支研究的是,基于局部空间频率为特征的纹理。Gabor滤波器在局部频率分析中发挥特殊作用,一方面基于Gabor滤波器纹理分析方法是通过心理研究的动机,一方面因为二维Gabor滤波器已被证明是纹理的接受域配置文件,另一方面好的模型的物理学研究动机是Gabor滤波器纹理分析的方法,他们支持全领域的纹理引起了定期的灰度值结构的观察[1]。 在本文中,我们制定了Gabor滤波器为基础的方法和介绍以四元数Gabor滤波器为基础的彩色纹理分割,实验结果已经证明该方法的作用。本文的其余部分如下,第2节简要讨论了主要的相关工作,第3节介绍了四元数,第4节讨论

图像分割阈值选取技术综述

图像分割阈值选取技术综述 中科院成都计算所刘平2004-2-26 摘要 图像分割是图像处理与计算机视觉领域低层次视觉中最为基础和重要地领域之一,它是对图像进行视觉分析和模式识别地基本前提.阈值法是一种传统地图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛地分割技术.已被应用于很多地领域.本文是在阅读大量国内外相关文献地基础上,对阈值分割技术稍做总结,分三个大类综述阈值选取方法,然后对阈值化算法地评估做简要介绍. 关键词 图像分割阈值选取全局阈值局部阈值直方图二值化 1.引言 所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交地区域,使得这些特征在同一区域内,表现出一致性或相似性,而在不同区域间表现出明显地不同[37].简单地讲,就是在一幅图像中,把目标从背景中分离出来,以便于进一步处理.图像分割是图像处理与计算机视觉领域低层次视觉中最为基础和重要地领域之一,它是对图像进行视觉分析和模式识别地基本前提.同时它也是一个经典难题,到目前为止既不存在一种通用地图像分割方法,也不存在一种判断是否分割成功地客观标准. 阈值法是一种传统地图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛地分割技术.已被应用于很多地领域,例如,在红外技术应用中,红外无损检测中红外热图像地分割,红外成像跟踪系统中目标地分割;在遥感应用中,合成孔径雷达图像中目标地分割等;在医学应用中,血液细胞图像地分割,磁共振图像地分割;在农业项目应用中,水果品质无损检测过程中水果图像与背景地分割.在工业生产中,机器视觉运用于产品质量检测等等.在这些应用中,分割是对图像进一步分析、识别地前提,分割地准确性将直接影响后续任务地有效性,其中阈值地选取是图像阈值分割方法中地关键技术. 2.阈值分割地基本概念 图像阈值化分割是一种最常用,同时也是最简单地图像分割方法,它特别适用于目标和背景占据不同灰度级范围地图像[1].它不仅可以极大地压缩数据量,而且也大大简化了分析和处理步骤,因此在很多情况下,是进行图像分析、特征提取与模式识别之前地必要地图像预处理过程.图像阈值化地目地是要按照灰度级,对像素集合进行一个划分,得到地每个子集形成一个与现实景物相对应地区域,各个区域内部具有一致地属性,而相邻区域布局有这种一致属性.这样地划分可以通过从灰度级出发选取一个或多个阈值来实现. 阈值分割法是一种基于区域地图像分割技术,其基本原理是:通过设定不同地特征阈值,把图像像素点分为若干类.常用地特征包括:直接来自原始图像地灰度或彩色特征;由原始灰度或彩色值变换得到地特征.设原始图像为f(x,y>,按照一定地准则在f(x,y>中找到特征值T,将图像分割为两个部分,分割后地图像为 若取:b0=0<黑),b1=1<白),即为我们通常所说地图像二值化. <原始图像)<阈值分割后地二值化图像) 一般意义下,阈值运算可以看作是对图像中某点地灰度、该点地某种局部特性以及该点在图像中地位置地一种函数,这种阈值函数可记作 T(x,y,N(x,y>,f(x,y>> 式中,f(x,y>是点(x,y>地灰度值;N(x,y>是点(x,y>地局部邻域特性.根据对T地不同约束,可以得到3种不同类型地阈值[37],即 点相关地全局阈值T=T(f(x,y>> (只与点地灰度值有关> 区域相关地全局阈值T=T(N(x,y>,f(x,y>> (与点地灰度值和该点地局部邻域特征有关> 局部阈值或动态阈值T=T(x,y,N(x,y>,f(x,y>> (与点地位置、该点地灰度值和该点邻域特征有关> 图像阈值化这个看似简单地问题,在过去地四十年里受到国内外学者地广泛关注,产生了数以百计地阈值选取方法[2-9],但是遗憾地是,如同其他图像分割算法一样,没有一个现有方法对各种各样地图像都能得到令人满意地结果,甚至也没有一个理论指导我们选择特定方法处理特定图像. 所有这些阈值化方法,根据使用地是图像地局部信息还是整体信息,可以分为上下文无关(non-

图像分割方法综述

图像分割方法综述 摘要:图像分割是计算计视觉研究中的经典难题,已成为图像理解领域关注的一个热点, 本文对近年来图像分割方法的研究现状与新进展进行了系统的阐述。同时也对图像分割未来的发展趋势进行了展望。 关键词:图像分割;区域生长;活动边缘;聚类分析;遗传算法 Abstract: Image segmentation is a classic problem in computer vision,and become a hot topic in the field of image understanding. the research actuality and new progress about image segmentation in recent years are stated in this paper. And discussed the development trend about the image segmentation. Key words: image segmentation; regional growing; active contour; clustering analysis genetic algorithm 1 引言 图像分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,同时也是图像处理中最困难的问题之一。所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内表现出一致性或相似性,而在不同区域间表现出明显的不同。简单的说就是在一副图像中,把目标从背景中分离出来。对于灰度图像来说,区域内部的像素一般具有灰度相似性,而在区域的边界上一般具有灰度不连续性。 关于图像分割技术,由于问题本身的重要性和困难性,从20世纪70年代起图像分割问题就吸引了很多研究人员为之付出了巨大的努力。虽然到目前为止,还不存在一个通用的完美的图像分割的方法,但是对于图像分割的一般性规律则基本上已经达成的共识,已经产生了相当多的研究成果和方法。本文根据图像发展的历程,从传统的图像分割方法、结合特定工具的图像分割方法、基于人工智能的图像分割方法三个由低到高的阶段对图像分割进行全面的论述。 2 传统的图像分割方法 2.1 基于阀值的图像分割方法 阀值分割法是一种传统的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术。阀值分割法的基本原理是通过设定不同的特征阀值,把图像像素点分为具有不同灰度级的目标区域和背景区域的若干类。它特别适用于目标和背景占据不同灰度级范围的图,目前在图像处理领域被广泛应用,其中阀值的选取是图像阀值分割中的关键技术。 灰度阀值分割方法是一种最常用的并行区域技术,是图像分割中应用数量最多的一类。图像若只用目标和背景两大类,那么只需要选取一个阀值,此分割方法称为单阀值分割。单阀值分割实际上是输入图像f到输出图像g的如下变换:

模糊聚类法在图像分割中的应用

模糊聚类法在图像分割中的应用 摘要:模糊聚类算法是模糊理论中的一个重要的分支,是现今模糊理论中应用最广泛的领域之一,并取得了丰富的成果。由于图像所具有的模糊性,近年来一些学者将模糊理论引入到图像处理中,应用模糊理论进行图像分割,图像增强以及边缘检测。本文在研究模糊理论的基础上,对模糊聚类算法在图像分割中的应用进行了一定的探讨。 关键词:模糊理论,图像分割,模糊聚类 0.引言: 随着计算机技术的飞速发展,数字图像分割技术触及工业检测、环境监测、军事和宇宙探索等多诸多学科领域。从统计学的观点上看,图像分割可以分为基于概率统计的硬分割和基于模糊数学的软分割。在实际应用中,图像分割结果受到图像许多方面特征的制约,例如:图像的灰度、纹理或颜色等硬分割方法在综合考虑这些因素时往往顾此失彼,因而分割结果并不理想但若将上述因素用模糊集合来表示,利用隶属度综合考虑各因素对图像分割结果的影响,则能准确反映图像的特征。因此,基于模糊数学的模式分类在图像分割中得到了广泛应用基于模糊聚类的软分割具有以下几个鲜明的特点:1)模糊聚类分割算法不使用训练样本,这使得非监督图像分割成为可能。2) 在进行模糊聚类分割算法构建时,只需建立模糊优化函数,仅有隶属度聚类中心和核

函数带宽这个未知参数传统的图像聚类分割方法是一种硬划分,将每个像素划分到某一类中,在现实中,像素的归属伴随着不确定性,而隶属度是描述不确定性的强有力工具。随着模式识别、人工智能和逼近理论的不断发展,特别是非参数密度估计方法的发展,为模糊聚类核函数的选取提供理论依据,从而将图像分割问题转化为确定最优超平面的分类函数。3) 采用进化算法,如遗传算法、免疫算法和模拟退火等,优化目标函数获得对数据的最佳分类。 1.图像分割技术简介及聚类分析法 图像分割是一种关键的图像分析技术,是从图像处理进行到图像分析的关键步骤,也是进一步图像理解的基础。图像分割按照不同的特性,如灰度、颜色、纹理等,将图像分成若干个各具相似特性的区域,以便能提取出所需要的目标。在图像分割前,对图像的加工主要处于图像处理的层次,图像分割后,对图像的分析才成为可能。图像分割在实际中也已得到广泛的应用,例如在工业自动化,在线产品检验,以及军事、体育、农业工程等方面。概括来说,在各种图像应用中,只要需对图像目标进行提取,测量等都离不开图像分割。每当有新的数学工具或方法提出来,人们就试着将其用于图像分割,基于聚类分析的图像分割方法是图像分割领域中一类极其重要和应用相当广泛的算法,其在应用领域取得的巨大成功引起了广大关注。 2.聚类分析算法的分类

图像分割阈值选取技术综述

图像分割阈值选取技术综述 摘要 图像分割是图像处理与计算机视觉领域低层次视觉中最为基础和重要的领域之一,它是对图像进行视觉分析和模式识别的基本前提.阈值法是一种传统的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术.已被应用于很多的领域。本文是在阅读大量国内外相关文献的基础上,对阈值分割技术稍做总结,分三个大类综述阈值选取方法,然后对阈值化算法的评估做简要介绍。 关键词 图像分割阈值选取全局阈值局部阈值直方图二值化 1.引言 所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内,表现出一致性或相似性,而在不同区域间表现出明显的不同[37].简单的讲,就是在一幅图像中,把目标从背景中分离出来,以便于进一步处理。图像分割是图像处理与计算机视觉领域低层次视觉中最为基础和重要的领域之一,它是对图像进行视觉分析和模式识别的基本前提.同时它也是一个经典难题,到目前为止既不存在一种通用的图像分割方法,也不存在一种判断是否分割成功的客观标准。 阈值法是一种传统的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术.已被应用于很多的领域,例如,在红外技术应用中,红外无损检测中红外热图像的分割,红外成像跟踪系统中目标的分割;在遥感应用中,合成孔径雷达图像中目标的分割等;在医学应用中,血液细胞图像的分割,磁共振图像的分割;在农业工程应用中,水果品质无损检测过程中水果图像与背景的分割。在工业生产中,机器视觉运用于产品质量检测等等。在这些应用中,分割是对图像进一步分析、识别的前提,分割的准确性将直接影响后续任务的有效性,其中阈值的选取是图像阈值分割方法中的关键技术。 2.阈值分割的基本概念 图像阈值化分割是一种最常用,同时也是最简单的图像分割方法,它特别适用于目标和背景占据不同灰度级范围的图像[1]。它不仅可以极大的压缩数据量,而且也大大简化了分析和处理步骤,因此在很多情况下,是进行图像分析、特征提取与模式识别之前的必要的图像预处理过程。图像阈值化的目的是要按照灰度级,对像素集合进行一个划分,得到的每个子集形成一个与现实景物相对应的区域,各个区域内部具有一致的属性,而相邻区域布局有这种一致属性。这样的划分可以通过从灰度级出发选取一个或多个阈值来实现。 阈值分割法是一种基于区域的图像分割技术,其基本原理是:通过设定不同的特征阈值,把图像像素点分为若干类.常用的特征包括:直接来自原始图像的灰度或彩色特征;由原始

图像分割常用方法综述[文献综述]

文献综述 通信工程 图像分割常用方法综述 摘要:本文首先介绍了图像分割的定义,再介绍了几种图像分割常用方法:基于阈值的分割方法、基于轮廓的分割方法、基于区域的分割方法,并对其优缺点进行了比较,最后介绍了图像分割的研究现状及发展前景。 关键词:图像分割;数字图像处理;阈值;边缘;区域 一、图像分割文献分析 在中国知网搜索关键词“图像分割”,且包含关键词“基于”共有12070条记录。在结果中检索,并将词频设置为2次以上,得:且包含“阈值”的有1731条记录,且包含“边缘”的有1780条记录,且包含“区域”的有3048条记录。分析结果如下表1所示: 表1 图像分割常用方法所占的研究比例 从表1可以看出,图像分割的几种经典方法的研究依旧占据了大半,尤其是基于区域的研究方法,更是研究的重点之一。当然对于新方法的研究也很热门。 在中国知网搜索关键词“图像分割”,且包含关键词“应用”共有6326条记录。在结果中检索,并将词频设置为2次以上,得:且包含“阈值”的有791条记录,且包含“边缘”的有957条记录,且包含“区域”的有1432条记录。分析结果如下表2所示: 表2 图像分割常用方法所占的应用比例 表2的数据与表1接近,说明现在的数字图像分割的研究成果应用到实际的比例相当之高,可谓硕果累累。在中国知网搜索关键词“图像分割”,并将时间限定为2007年到2011年,共有9313条记录,其中在计算机软件及计算机应用领域的记录就有7209条,占了总量

的77%,说明计算机技术与图像分割技术相结合对双方都有着巨大的促进作用。就以此为例,对图像分割近年来的应用趋势进行分析。 图1 图像分割在计算机软件及计算机应用领域的年度分析 从图1可以看出,近年来图像分割在实际应用上的研究保持着较为平稳的势头。由于2011年的数据是不完全统计,但现有数量也已相当庞大,依照这个趋势,图像分割将在计算机领域长期占据着一个极其重要的地位,当然随着研究的深入,相信在其他各个领域,图像分割都将发挥自己独特的作用。 二、图像分割的定义 视觉是人类最高级的感知系统,图像在其中有着极其重要的意义。然而人类的感知仅限于电磁波谱的视觉波段,成像机器则可覆盖几乎所有电磁波谱,从伽马射线到无线电波。成像机器可以对很多图像源进行加工,而非仅仅人们生活中所熟悉或者常见的,比如超声波、电子显微镜及计算机产生的图像等[1],所以随着计算机技术的不断发展,数字图像技术的应用领域将越来越广泛,而图像分割又是数字图像处理中的关键技术之一。 图像分割是进行视觉分析和模式识别的前提,其根据图像的某些特性,将图像分成若干有意义的区域,使这些特征在某一区域内表现出相似性,不同区域则有显著不同。分割产生的区域是图像内容的一种表示,其质量直接影响分析、识别等后续操作[2]。图像分割的结果一般用数字、文字、符号、几何图形或其组合表示的内容和特征,用以对图像进行详尽的描述和解释。

最佳熵自动阀值法图像分割

DIP上机报告 题目:数字图像处理上机报告(第5次) 学校:中国地质大学(武汉) 指导老师:傅华明 姓名:龙勋 学号: 20111000681 班级: 071112-06

目录 1最佳熵自动阀值法图像分割........................... 错误!未定义书签。2上机小结 (5)

最佳熵自动阀值法 题目要求: 采用最佳熵自动阈值法对下图实施分割。 算法设计: 1.导入图像 2.通过图像的直方图计算每个像素点的概率 3.统计每个灰度值出现的概率 4.分别计算图像的背景熵和目标熵 5.计算图像熵的最大值,并且将其作为图像分割的阀值 6.进行图像的分割和分割图像的显示

程序代码: clear all a = imread('p5-09.tif'); figure,imshow(a) count = imhist(a); %图像的直方图 [m,n] = size(a); N = m*n; L = 256; count = count/N; %每一个像素的分布概率 for i = 1:L if count(i) ~= 0 st = i-1; break; end end for i = L:-1:1 if count(i) ~= 0 nd = i-1; break; end end f = count(st+1:nd+1); %f是每个灰度出现的概率 size(f); E=[]; for Th = st:nd+1 Hbt = 0; Hwt = 0; Pth = sum(count(1:Th+1)); for i = 0:Th %计算图像背景的熵 Hbt = Hbt-count(i+1)/Pth*log(count(i+1)/Pth+0.01); end for i = Th+1:L-1; %计算图像目标的熵 Hwt = Hwt-count(i+1)/(1-Pth)*log(count(i+1)/(1-Pth)+0.01); end E(Th-st+1) = Hbt+Hwt; end position = find(E==(max(E)));

相关文档