文档库 最新最全的文档下载
当前位置:文档库 › 轮廓特征和拓扑关系的图像检索方法

轮廓特征和拓扑关系的图像检索方法

轮廓特征和拓扑关系的图像检索方法
轮廓特征和拓扑关系的图像检索方法

902008,44(5)Computer-EngineeringandApplications计算机工程与应用

一种基于轮廓特征和拓扑关系的图像检索方法

曾接贤,毕东格

ZENGJie-xian,BIDong-ge

南昌航空大学无损检测技术教育部重点实验室,南昌330063

KeyLaboratoryofNondestructiveTest,MinistryofEducation,NanchangHangkongUniversity,Nanchang330063,China

E-mail:zengjx58@163.com

ZENGJie-xian,BIDong-ge.Imageretrievalmethodbasedoncontourcharacterandspatialtopology.ComputerEngi-neeringandApplications,2008。44(5):90-92.

Abstract:AnewmethodforCBIRbasedonshapeFourierdescriptorispresented.Thefirststepofthismethodispre-processingtheimage,thencarryingtheimagesegmentationbasedontopologyrelationship,andthenusecontourtrackingmethodtoobtainthecontourfeaturewhichlaterdescribedbyFourierdescriptorusingFFT,atlast,usingblockdistancetomeasurethesimilaritybetweentheoriginalpictureandtargetpicture.Inordertoverifytheeffectivenessofthemethod,weexperimentedunderMATLABandVC++environment.Byseveralexperiments,theresultsshowthatthismethodiseffectiveandalsobyalgorithmanalysis,weconcludethatthemethodisrationalforimageretrieval.

Keywords:shapedescribing;Fourierdescriptor;spatialtopology;comparability

摘要:提出了一种利用轮廓特征和拓扑关系的图像检索方法。首先对图像进行预处理,然后根据空间拓扑关系进行区域分割,再对各个区域进行轮廓跟踪,并用傅立叶描述子对所提取区域的轮廓进行描述,最后用街区距离进行相似度的判定。为了验证该算法的有效性,在MATL^.B和VC++环境下进行了实验,通过实验结果和算法分析,证明了该方法的合理性和有效性。

关键词:形状描述;傅立叶描述子;空间拓扑关系;相似度

文章编号:1002—8331(2008)05—0090—03文献标识码:A中图分类号:TP391.3

1引言

在计算机视觉中,形状特征属于图像的中间层特征。形状特征作为刻画图像中物体和区域特点的重要特征,是描述高层视觉特征(如目标、对象等)的重要手段,而目标、对象对获取图像语义尤为重要。利用形状特征进行检索可提高检索的准确性和效率fl】。但是基于形状特征的图像检索,主要存在有四个问题:一是图像分割算法还不能做到自适应;二是形状描述子难于提取[21。三是特征空间的相似性与人视觉系统感受到的相似性也有差别,四是由于视点的变化可能会产生各种失真。所以,基于形状的图像检索还缺乏比较完善的数学模型,目标变形时检索结果也不可靠;另外,要全面描述形状对计算和存储都有较高的要求。

基于空间关系的查询,其主要优点是能比较完整地表达图像各部分的信息,并能比较方便地无示例或用自然语言查询。空间位置关系的特征还可加强对图像内容的描述区分能力t3]。空间关系是图像内部目标的重要特征131,但是如果单独用空间关系描述物体的特征就显得模糊,常常很难用一个确定的表达式描述清楚,它们常由一组互相联系又有矛盾的条件所限定,每个条件在具体情况下得到不同程度的满足。常用的空间关系一般包括朝向关系和拓扑关系,它们都可以通过自然语言来描述。由于空间关系的模糊性,根据空间关系来确定检索对象的相似性是一个复杂的工作。

物体的形状及其空间关系既是图像中的核心内容,也是人们识别图像、分类图像的重要依据。但是目前基于形状和空间关系的图像检索还仅处于研究二值商标图像。在文献【1]提出了.利用小波分解技术的形状和空间关系的图像检索方法,但是小波分解的多分辨率和小波分解的方向性,使得该描述子不具有旋转和尺度变换的不变性。如果检索的图像内容包括运动的物体,则不能得到好的检索结果。

鉴于此,提出了一种基于轮廓特征和拓扑关系的图像检索方法。首先利用空间拓扑关系进行图像分割;然后提取区域轮廓特征,并用傅立叶描述子进行描述;最后再把该描述子应用于基于形状的图像检索中。通过实验验证了该算法的有效性和合理性。

基金项目:国家自然科学基金(theNational‘NaturalScienceFoundationofChinaunderGrantNo.60675022);江西省自然科学基金(theNaturalScienceFoundationofJiangxiProvinceofChinaunderGrantNo.0311019);江西省教育厅资助科研课题(theResearchPmjectofDe一

partment

ofEducationofJiangxiProvince)。

作者简介:曾接贤(1958一),男,教授,主要从事工程图学、计算机图形学和计算机视觉等方面的研究;毕东格(1981一),女,硕士研究生,主要研究方向为计算机视觉与图像处理。

收稿日期:2007-06—27修回13期:2007—09—07

曾接贤,毕东格:一种基于轮廓特征和拓扑关系的图像检索方法、2008,44(5)91

2基于轮廓特征和拓扑关系的图像检索方法本文提出的基于轮廓特征和拓扑关系的图像检索方法,其具体实现步骤是:①获取图像及预处理;②边缘检测;③基于拓扑关系的区域分割;④轮廓跟踪;⑤傅立叶描述子描述边界;⑥相似性度量。

2.1获取图像及预处理

2.1.1获取图像

.图像资源大多数都是由CCD摄像机生成的Bmp或Jpeg格式的图像,因此,为了后面实验算法的需要,使用CCD摄像机采集了200幅实物图像,实物对象包括动物,桌椅,水果,花草,山峰等五类。图l所示是其中的4幅图像。

图1获取的图像示例

2.1.2图像预处理

实际图像一般都存在有噪声,为了能够得到好的边缘提取效果,必须进行去噪声处理,从而提高边缘检测算法的鲁棒性。边缘提取效果对脉冲噪声比较敏感,因此,本文采用3x3中值滤波进行去噪处理。中值滤波作为一种非线性方法,在保护图像细节的同时能够有效滤除脉冲噪声,滤波结果如图2所示。2.2图像锐化及边缘检测

2.2.1图像锐化

图像锐化主要是为了加强图像边缘特征,使边缘易于识别和提取。本文主要采用拉普拉斯卷积核的锐化方法。其锐化卷积核模板如图3所示。

图2预处理后的图像图3拉普拉斯锐化卷积核模板

2.2.2图像分割

为了取得更好的边缘检测效果,在边缘检测之前,需进行图像分割,把目标与背景分离出来。经过实验对比,采用灰度直方图选择两谷峰之间的谷底值作为分割阈值。本文使用该阈值对图像进行分割,得到较好的效果。

2.2.3边缘检测

边缘是图像最基本的特征。为了检测出边缘信息,通常是利用其周围像素灰度或颜色有阶跃性变化或屋顶变化的特性判断该像素是否为边缘点。到目前为止,边缘检测最通用的方法是检测亮度值的不连续性,这样的不连续性可用一阶或二阶导数进行检测。常用的边缘检测算子有Roberts算子、Sobel算子、Prewitt算子、拉普拉斯高斯(LoG)算子、Canny算子等。以上算子都有各自不同的特性,对不同的图像或不同的边缘检测要求他们的检测效果是不尽相同的。基于形状特征的图像检索主要是使用图像中目标对象的轮廓作为检索特征,经过比较,本文采用Roberts算子作为边缘检测算子,并获得了较好的边缘检测效果,实验结果如图4所示。

2.3基于拓扑关系的区域分割

区域分割的目的是把目标分割成不同的区域,以便于边界描述和相似性匹配。区域分割是根据空间关系中的拓扑关系来完成的。空间拓扑关系主要采用空间点集拓扑关系表示。Egerflxfer根据两个空间对象关系的9元交模型中的512种可能关系,提出用8种面面关系来描述图像中对象之间的空间拓扑关系[41。8种面面关系分别为分离、包含、包含于、覆盖、覆盖于、等价、相交和相接关系,并分别用符号fdt,ct,in,CO,cb,eel,0V,to}表示。图像对象之间拓扑关系的形式化表达如图5所示。

分离

等价

图4边缘提取图像图5

回日

包含覆盖

包含于覆盖于

黾[b

相交相接

图像对象之间拓扑关系针对上述边缘提取图进行分割,把月分为n个子区域月。,尺:,…,R。,各子区域的处理满足以下关系:

(1)URFR;

i:1

(2)R。是一个连通的区域;

(3)R。n碍却,对扛l,2,…,凡;

(4)P(足)=TRUE,对i=1,2,…,n;

(5)P(咒u尺,)=FLASE,对任何区域R;和尺。

其中,P(R;)是定义在集合兄中的点上的逻辑谓词,咖表示空集。

按同一种标准对图像进行分割,如果分割区域不一样就可以判定图像不同,即如果中的n不同,则待检索图像与图像库中的图像不相似。

将图2所示经过3x3中值滤波去噪处理后的图像,采用Roberts算子作边缘检测,得到如图4所示的外形轮廓。若把脸部特征(其他内部边界特征暂不考虑)作为一个整体,并假设为区域1,把整个外围轮廓假设为区域2,则二者的关系为包含或者包含于。脸部的器官:眼睛、鼻子、嘴巴为分离的关系。根据这种关系把每一个区域划分开来。为便于计算,图像库中的每一幅图像的不同区域x,y轴点的坐标分别列于同一个行向量中,则可以写成如下矩阵形式(x,y)7,其中

其中扛1,2,…,n表示由拓扑关系分割出来的区域的个数J=1,2,…,mi,f表示第i个区域中提取的轮廓点的个数。

2.4轮廓跟踪

轮廓是基于形状检索的依据。轮廓跟踪的原理是利用图像形态学中的腐蚀处理方法,首先用一个9个点的结构元素对图像进行腐蚀四,然后再利用原图像减去腐蚀图像得到的轮廓图;最后再用边缘提取图像减去轮廓即可得到内部闭合区域。

轮廓跟踪是根据某种严格的“探测准则”找出目标物体轮廓上的像素,再根据这些像素的某些特征,用一定的“跟踪准则”找出目标物体上的其他像素。

本文进行轮廓跟踪采用的“探测准则”原则是“八邻域”查询法,即首先按照从左到右,从下到上的顺序搜索,找到的第一个不同于背景的点就是最左下方的点,并记为A;然后从该点开始,按右、右上、上、左上四个邻点中至少有一个边界点事实,

找出该边界点并记为曰;再从曰点开始找起,按右、右上、上、左

922008,44(5)ComputerEngineeringandApplwmions计算机工程与应用

上、左下、下、右下的顺序找相邻的边界点C;如果c就是A,则

表明已经全部搜索完毕。

2.5边界信息描述

对形状的描述,常见的有本征方程、几何常量、Fourier描述子、矩描述子、力矩、多边形顶点数、孔径数、曲率和P描述子旧等。基于区域的特征提取关键在于图像分割的研究,然后把

提取的轮廓特征作为目标区域的特征量进行图像匹配。由于

MPEG一7MDS没有规定具体的特征提取算法,而现有文献中,针对形状轮廓这种底层特征的提取方法较少[51,因此,提出了一种针对形状轮廓的特征提取算法,并用傅立叶描述子加以描述,最后再把该描述子应用于基于形状的图像检索中。

由于傅立叶描述子具有与起始点无关、旋转不变性和平移

不变性的特点,因而本文采用傅立叶描述子来描述各个区域形状轮廓特征向量。傅立叶描述子是关于信号的傅立叶变换的复

系数的集合,它的高频系数代表了轮廓的细节,低频系数代表了一般的轮廓属性。本文采用对所有的轮廓像素点进行二维陕速傅立叶变换,其公式为:

肛-lN-I一,,。f!生.兰、

只u,"):∑∑xye。肼”(2):i丽

这里M,Ⅳ代表了图像的宽度和高度,艽,Y分别为轮廓点的坐标和图像宽度与高度的比例,(n,”)是傅立叶变换的频率。

由于频率(/t,”)的高频代表了轮廓的细节,而低频代表了

轮廓的整体属性,如果值取得较大,则角点信息不能完全描述,并且内部信息对轮廓会有干扰形成;如果值取得较小,平滑部分会丢失轮廓信息。为了把特征描述完整,并通过多次实验证明,取M=f1,V,15),”={1,V,151时可以获得较好的效果。2.6相似性匹配

相似图像检索或形状匹配的一个基本问题在于特征向量的距离量度。常用的空间距离相似度度量方法有欧氏距离、马氏距离、明氏距离、街区距离等。由于街区距离计算简单(只有加减运算),特征匹配速度陕,因此本文采用街区距离来度量两幅图像的相似性。街区距离定义如下:

三n,

d(P,F)=艺圻。(u,口)i。(u,”)l(3)j=l

其中,I"t是傅立叶描述的复系数的个数。厂。(“,口)和,‘(u,”)分

别是示例图像和数据库图像的傅立叶描述子。

3实验结果

为了验证算法的有效性,选取200幅图像进行了实验(包

括玩具,水果,山脉,花草,图案共五类,每类包含40幅图像,分别从其中选取10幅进行实验)。

图6为针对一幅图像的检索结果:左边第1幅为待检索的

图像,后面4幅图像为检索到的结果。

图6待检索图像与检索结果

3.1时间复杂度分析

根据算法的各步骤分析,该算法的时问复杂度由图像分

割、图像锐化、图像分割、轮廓跟踪和提取、形状轮廓的傅立叶描述子和相似性测量的时间复杂度组成。除了形状轮廓的傅立叶描述子的时间复杂度为O(mrnlog(mn))外,其余均为mlz,m和n分别为图像的宽度和高度。因此,综合分析得出,算法的时间复杂度总体应是O(n2logn)。

3.2查准率比较曲线图

查准率定义为检索出的有效图像数与检索出的图像总数的比率。在图7和图8中:水平轴是查询相关图像的个数,垂直轴是图像检索的查准率大小。

玩具查准率对比曲线

1.0

0.9

0.8

0.7

0.6

0.5

0.4

O.3

0.2

1.O

0.9

O.8

0.7

O.6

0.5

0.4

0.3

0.2

鲜花查准率对比曲线

图8鲜花检索查准率比较

通过实验对比可得出,利用空间信息和轮廓作为检索特征,其查准率较高。

4总结

基于形状检索的研究是目前研究的热点也是难点。对目标的形状进行分析有很多的方法,主要分两类:基于边界方法和基于区域的方法,前者只利用形状的外部边缘,而后者利用形状的全部区域171。基于边界的形状特征提取关键在于边缘检测的研究,在提取边缘的基础上,定义边缘的特征描述。

本文提出了一种利用轮廓特征和拓扑关系的图像检索方法,并对形状轮廓特征的提取过程、空间拓扑关系的运用和相似性匹配的过程进行了详细阐述并编程实现,最后对算法进行分析。通过算法分析,得到该算法的算法复杂度为O(n%gn),从而证明了该算法的合理性,并通过实验证明,该算法对图像检索的性能良好。

参考文献:

【1]DongWei-jHa,ZhouMing-quan,GengGuo-hua.Imageretrievaltechniquebasedonshapeandspatialrelationship【J】.ComputerEngineering,2005,31(20):170-172.

[2]XuDan,ZhangYujin.Optimalmatchingbasedonspatialrelation—shipinlocalregionsJUoumalofElectronicsandInformationTech—nology,2005,27(8):1177-1181.

【3】WangYH.Aspatialrelationshipmethodsupportsimageindexingandsimilaringretrieval【C]//DebSed.MultimediaSystemsandContent_BasedImageRetrieval.Hershey,London,Melbourne,Singa-pore:IdeaGroupPublishing,2004:277—301.

(下转95页)

廖开阳,张学东,章明珠:一种新的指纹图像快速细化算法2008,44(5)95

4实验结果

实验在奔腾3.2G的CPU、516M内存的计算机上进行,用MATLAB7.0编程实现上述算法。在FVC、NIST库中选取了多幅有代表性的指纹图像,在二值化以后,使用细化新算法进行处理的结果如图5所示。算法和另外几种算法的对比实验结果如图6所示。

图5本文算法对不同指纹的细化结果

图6不同算法结果的对比图

5结论

从图5、图6的实验结果可看出,新细化算法的细化效果比原来几种细化算法有明显提高。快速细化算法细化不彻底,细化后的纹线不是单像素宽。改进的OPTA算法在分叉点处细化也不彻底,并且纹线上会出现很多毛刺。新细化算法满足了细化的基本要求,细化彻底,既保证了纹线的单像素宽,又没有破坏纹线的连通性(只要原二值化图像没有断线,细化后就不会产生断线),同时纹线的细节特征没有丢失,细化后的骨架也接近原始纹线的中心,没有毛刺出现,没有纹线吞噬,细化速度快。另外,本文新算法还能够消除孤立点和不太长的短线,具有一定的消除伪细节特征点的功能,能在很大程度上减少后继提取工作中的伪细节特征点数。新算法中也成在一些不足,我们对不同质量的指纹图进行了细化处理,发现在处理有孔洞的二值指纹图时,细化后的指纹图也出现孔洞。因此本算法对被处理的图像要求比较高,须要在前期处理的过程中消除孔洞,不过现在的前期预处理已经能很好地处理图像得到高质量的二值图像了。

提出了一种新的快速细化算法和消除毛刺的思想,经实践证明是很有效的,该算法是一种较为理想的指纹细化方法。

参考文献:

【1】1尹义龙,宁新宝,张晓梅.改进的指纹细节特征提取算法【J】_中国图象图形学报,2002,7(12):1302—1306.

[2]冯星奎,李林艳,颜组泉.一种新的指纹图像细化算法叨.中国图象图形学报,1999,4A(10):835—838.

【3】卢昀,陶刚.一种新的指纹图像细化算法【J】.现代计算机,2002.【4】王业琳,宁新宝.指纹图像细化算法的研究[J】.南京大学学报:自然科学版,2003,39(4):468—475.

[5】JainA,LinHong,BollER.On-linefingerprintverification[J].IEEETransonPatternAnalysisandchineIntelligence,1997,19(4):302—313.

【6】1LinHong,WanY,JainAK.Fingerprintimageenhancement:algo-rithmandperformanceevaluation[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,1998,20(8):777--.789.

f7】DattaA,ParniSK.Arobustparallelthinningalgorithmforbinaryimages[J].PatternRecognition,1994,27(9):1181-1192.

[8]HeYu,ChenLihui.Anovelnonparametricclusteringalgorithmfordiscoveringarbitraryshapedclusters[C]HProceedingsofthe2003J04ntConferenceoftheFourthInternationalConferenceOH15—18Dec.2003,20103:1826-一1830.

(上接8l页)

[9】魏迎梅.虚拟环境中碰撞检测问题的研究【D】.长沙:国防科技大学,2000.

【lfflGottsehalkS,LinM,ManochaD.OBBTree:AHierarchicalStruc—tureforRapidInterferenceDetection[C]//ProceedingsofSIG—GRAPH96,1996:171—180.

[11]GotsehalkS,LjnM,ManochaD.OBBTree:Ahierarchicalstructure

forrapidinterferencedetection[C]//ProceedingsofSIGGRAPH’96,1996:171—180.

【12】涂超.虚拟空间中的碰撞检测咖.武汉理工大学学报,2001(11).[13]贺怀清,岳军红,杨国庆.OBB层次结构及其应用加速算法的研究【J】.计算机工程,2005(7).

[14】魏迎梅,王勇.碰撞检测中的层次包围盒方法们[J】.计算机应用,2000(8).

(上接84页)

【10】P0LM,MaWC.Anovelfour-stepsearchalgorithmforfastblockmatehingrJ]l[EEETransCircuitsSystVideoTechnol,1996,6(3).【l1]KimSE,HanJK,KimJG.Anefficientschemeformotionesti-

marion

usingmuhireferenee

framesinH.264/AVC[J].IEEETransMultimtedi,日。2006,8(3).【1Z】HuangYW,HsiehBY,ChienSY,eta1.Analysisandcomplexi—tyreductionofmultiplereference

framesmotionestimationinH.264/AVC[J]JEEETransCircuitsSystVideoTeehnol,2006,16(4).【13】丁贵广,计文平,郭宝龙Nisualc++6.0数字图像编码[MI.北京:机械工业出版社,2004.

[14]毕厚杰.新一代视频压缩编码标准一H.264/AVC[M].北京:人民邮电出版社,2005.

(上接92页)

【4】EgenhoferMJ.Point-settopologicalspatialrelations们.Int’JGIS,1991。5(2):161—174..

【5]CaiFei,CaiXun;ShiTongguang,etal,.Animageretrievalmethodbasedonshapefeature[J].ComputerApplicationsandSoftware,2005。22(12):98一-99.

【6】KaupA,HeuerJ.Polygonalshapedescriptors-anefficientsolution

for

image

retrievalandobjectlocalization[C]//Proc34thAsilomarConferenceonSignals,Systems,andComputem,PacificGrove,CA,2000.

【7】RulYong.ModifiedFourierdescriptorsforshaperepresentation-apracticalapproach[C]//ProcofFirstInternationalWorkshoponira-age

DatabasesandMultiMedia

Search,1996.

一种基于轮廓特征和拓扑关系的图像检索方法

作者:曾接贤, 毕东格, ZENG Jie-xian, BI Dong-ge

作者单位:南昌航空大学,无损检测技术教育部重点实验室,南昌,330063

刊名:

计算机工程与应用

英文刊名:COMPUTER ENGINEERING AND APPLICATIONS

年,卷(期):2008,44(5)

引用次数:0次

参考文献(7条)

1.基于形状-空间关系的图像检索技术[期刊论文]-计算机工程 2005(20)

2.徐丹.章毓晋基于空间关系的子区域最佳匹配算法[期刊论文]-电子与信息学报 2005(8)

3.Wang Y H A spatial relationship method supports image indexing and similaring retrieval 2004

4.Egenhofer M J Point-set topological spatial relations 1991(2)

5.蔡菲.蔡珣.史同广.王京卫一种基于形状特征的图像检索方法[期刊论文]-计算机应用与软件 2005(12)

6.Kaup A.Heuer J Polygonal shape descriptors-an efficient solutionfor image retrieval and object localization 2000

7.Rui Yong Modified Fourier descriptors for shape representation-a practical approach 1996

相似文献(10条)

1.期刊论文贾磊.徐燕凌.JIA Lei.XU Yan-Ling一种基于形状特征的图像检索方法-电脑知识与技术2008,1(7)

基于内容的图像检索技术中,形状特征是最重要的图像特征部分.傅立叶描述子(FD),因为它高效性,稳定性,低计算复杂度和少量参数运行的优点而被广泛应用.目前已经存在的大多数傅立叶描述子往往直接使用它的傅立叶系数,本文我们应用主成分分析Principal Component Analysis(PCA)方法在傅立叶描述子中,从而提出基于PCA的傅立叶描述子的形状描述和检索方法.本论文的实验采用MPEG-7标准图像数据库来比较检索性能.实验结果表明PCA-FD的方法实现了更短时间内的更好检索精确率.

2.学位论文王斌形状分析的新方法及其应用2006

形状分析是计算机视觉领域的一个重要的研究问题,已经在科学研究领域和工程技术方面有着非常广泛的应用,如目标识别、基于内容的图像检索、文字识别、医疗诊断等。本文通过对现有的形状分析方法的研究,提出了一些新的形状分析方法并分别在遥感图像识别和植物叶形检索中进行了应用。本文的主要工作有三个:(1)提出了一种组合拆分与合并技术的混合遗传算法求解两类多边形近似问题。(2)提出了一种不变的形状描述方法:内角链。(3)提出了一种用于形状检索的基于多级弦长函数的傅立叶描述子。 多边形近似是一种重要的形状描述方法,但边界轮廓线的多边形近似的获取是一个非常复杂的问题。有两类多边形近似问题吸引大量研究者的关注,一个是在给定边数的情况下,求解近似误差最小的多边形,另一个是在给定容忍近似误差的情况下,求边数最少的多边形。传统的方法大多基于局部优化方法来进行求解,尽管求解速度很快,但求解质量严重依赖于始点或给定的初始解。一些基于全局优化的方法,如遗传算法、蚁群算法等虽然在一定程度上提高了求解的质量,但求解速度太慢,求解的质量也不太理想而且只能只能求解一类多边形近似问题。本文提出了一种新的能求解两类多边形近似问题的混合遗传算法。该方法针对现有的遗传算法全局优化能力强,但局部搜索能力差,以及在处理不可行解上的困难,采用染色体修复策略处理遗传操作所产生的不可行解,并将传统的拆分与合并技术应用于染色体的修复过程。采用这种方法,一个不可行解不仅能得到快速的修复而且在被修复的同时还能被推进到解空间中一个局部较优的位置。大量的实验结果和与近几年来的相关工作的比较证明了本文提出的方法的优越性。本文还将该方法应用于湖泊地图的多边形近似,并且与其他方法也进行了比较,实验结果表明本文提出的方法具有更好的近似效果和效率,具有实用价值。 第二个主要的工作是提出了一种不变的形状描述方法:内角链(IAC)。其主要的思想是首先用一个等边多边形近似一个二维目标的轮廓线,然后用等边多边形的内角构成的内角链作为形状的描述子。两个形状的相似性通过比较他们的内角链来进行度量。本文给出了计算等边多边形近似和其内角链的方法。其主要贡献在于:(1)给出了一种不变的形状描述子,其不变性通过理论和实验都得到了证明。而且这种不变性不需要额外的归一操作来完成。通过对轮廓线的等边多边形近似和用内角链来表示等边多边形,IAC将一般的基于多边形近似这种本质上是二维的描述降维成了一维的描述。也就说一般需要两类特征如角度和边长来表示多边形,现在只需要单一的特征—内角来描述形状。其优点在于使我们摆脱了在计算形状相似度时,要考虑怎样去选择一个合适的权重来平衡不同类特征的贡献所带来的困扰。实验结果证明了IAC的优良的性能。我们还将IAC实际用于湖泊SAR图像的识别,取得了好的识别效果。 第三个主要的工作是提出了一种新的傅立叶描述子:基于多级弦长函数的傅立叶描述子(MCLFD)。傅立叶描述子(FD)是一种非常重要的形状描述方法并有着广泛的应用。FD首先对一维轮廓线函数的进行傅立叶变换,用归一化的傅立叶系数作为形状的描述子。其主要优点在于(1)能消除形状信息中的噪声成份,(2)是一种紧致的描述子,(3)易于进行归一化。但由于傅立叶描述子是通过一维轮廓线函数的傅立叶变换得到的,所以其性能与导出它的轮廓线函数密切相关。现有的轮廓线函数存在的主要问题是:(1)要么能刻划形状的整体特征,但对形状的细节信息刻划不足。要么能刻划形状的细节信息,但对形状的整体特征描述不足。(2)一些轮廓线函数计算的复杂度较高而且很不稳定,不太适合实际应用。针对上述问题本文提出了一种新的轮廓线函数:多级弦长函数。多级弦长函数是通过等弧长的分割轮廓线获得的。它对形状的整体特征和细节信息都能进行很好的描述,而且计算非常简单。将多级弦长函数进行傅立叶变换所得到的傅立叶描述子(MCLFD)不仅对目标的平移、缩放、旋转不敏感,而且不依赖轮廓线的起始点。将该方法用1400个形状的测试集进行测试并与其它的傅立叶描述子进行比较。实验结果表明MCLFD要比其他性能最好的傅立叶描述子的平均查准率还要高出10﹪。本文还将基于多级弦长函数的傅立叶描述子应用于植物叶形的检索,所用的实例有100种植物叶形共1200个叶片,取得了较好的检索性能,而且性能要明显优于其它的傅立叶描述子。从而证明了我们提出的方法具有较高的实际应用价值。

3.学位论文付洋基于特征对象体识别的主动布防研究2008

随着现代网络技术、信息技术的发展,视频监控技术也同时经历由模拟监控到数字监控、本地单机监控到基于Internet的网络智能监控的发展历程。发展历程主要体现为以下四个阶段:本地模拟视频监控系统、基于单机的视频监控系统、基于DVR/DVS的网络视频监控系统以及本文所研究的智能视频监控系统。 @@ 在智能视频监控系统中,主要包含五个关键技术:数字视频/音频的压缩技术、数字视频/音频的传输技术、高效大量的视频存储及内容检索技术、监控场景中的运动检测与报警技术以及监控场景中目标识别技术。 @@ 本文主要围绕数字图像的处理及处理结果后期的分析技术与运动检测及报警技术两个关键技术为研究主线。文中对典型的图像处理与图像分析算法进行比较分析,并根据图像识别过程中图像预处理技术、运动目标检测技术及图像分析技术进行相关的实验。最后,结合储备粮智能视频监控的散装粮仓实物数量识别场景的要求,通过构建图像色调、亮度及其梯度

行表述,并通过其傅立叶描述子和色调参数与先验知识多维特征函数的比对实现对象体的精确分割与高可靠判别,实现特征目标体的识别;在运动检测及报警实现方面,本文采用基于背景减法和时间差分相结合的帧差分的算法来实现远程监控端的运动检测及报警,并按照视频监控与图像分析系统的系统调查、系统需求分析、系统实施的软件标准开发流程,开发出以嵌入式DVR/DVS为核心的基于客户机/服务器(Client/Server)结构的储备粮智能监控系统,实现视频的压缩、存储、传输、GIS视频调度以及监控设备的控制等重要功能。由于采用嵌入式DVR/DVS,整个系统的规模可以根据实际应用要求动态改变、功能强大、组网方式灵活、具有很强的适应性。 @@关键词:傅立叶描述子;感兴趣区域;运动目标检测;目标识别技术

4.期刊论文赵发勇.Zhao Fayong矩傅立叶描述子矩阵及其在模式识别中的应用-阜阳师范学院学报(自然科学版

)2002,19(2)

通过对基于形状的模式识别问题研究现状的探讨,在以前人们研究成果的基础上,提出了一种新的形状描述子--矩傅立叶描述子矩阵(Moment Fourier Descriptor Matrix:MFDM),它能够描述一些由非闭合区域组成的复杂形状物体,且表现为相对与图像的平移、尺度变化和旋转的不变量,因此可以用于一些复杂形状物体的识别,如文字.

5.期刊论文黄晶.倪林.曹荣.Huang Jing.Ni Lin.Cao Rong基于半径和角度直方图的形状检索-数据采集与处理

2007,22(4)

考虑到当给定了形状的中心点,人眼在辨别形状时是从径向和周向进行比较,本文提出基于半径和角度直方图的形状描述子(Radius and angle histograms descriptor,RAHD).RAHD具有平移、尺度、旋转不变性,并且由于它能有效地捕捉到形状空间上的径向和周向特征,因此其检索得到的形状很符合人眼的感性识别.为了评价RAHD的检索性能,本文将RAHD和目前形状检索领域最为有效的通用傅立叶描述子(Generic Fourier descriptor,GFD)进行比较.实验表明,RAHD优点有:(1)它的检索性能与GFD相当,并且描述精简;(2)它的特征提取要比GFD简单,其速度约为GFD的5.8倍.

6.期刊论文高华.王雅琴基于计算机视觉的农产品形状分级研究-计算机工程与应用2004,40(14)

计算机视觉在农产品分级和品质检测领域中的应用越来越广.但由于水果等农副产品的形状不规则,如何准确地用较少的特征值定量描述农产品形状,是目前研究的重要课题之一.该文在分析了现有农产品形状描述方法的基础上,提出了采用傅立叶半径描述子对农产品图像轮廓进行描述和分类的方法.并给出了利用半径描述子计算图像区域面积以及利用欧几里德距离判定边界相似度的方法.

7.学位论文周苏婷基于对称特征的三维模型检索技术研究与应用2008

近年来,由于计算机图形扫描设备和几何造型软件的普及,以及图形处理硬件性价比的提高,越来越多的三维模型在各个领域中得到了广泛地应用。三维模型数据成为继图像、声音和视频后的又一种新的多媒体数据类型。同时,互联网技术的发展增强了人们获取三维模型的能力,并为三维模型资源的传播和共享创造了条件。三维模型作为新一代的多媒体数据,用户对三维模型的需求提出了以模型特征为基础的三维模型检索问题。而研究和开发三维模型检索系统帮助用户快速、准确地找到自己所需的三维模型,是一个重要课题。 三维模型检索的关键问题是如何有效地提取三维模型的特征。本文在调研国内外相关研究成果的基础上,对三维模型的特征提取方法进行了研究,着重研究基于对称特征的三维模型特征提取方法,通过理论分析和实验结果验证该方法的可行性和有效性。论文的主要创新点如下: 一、本文提出了增强的反射对称描述符。我们将反射对称的计算方法引入三维模型的投影图像中,使得增强的反射对称描述符不仅适用于三维模型检索,而且适用于二维图像检索,是本文的一个创新点。 二、本文提出了旋转对称描述符。在旋转对称描述符的驱动下,结合统计特征进行分步检索。该方法大大提高了只采用统计特征单独检索的效率,是本文的第二个创新点。 本文的主要内容如下: (1)介绍了三维模型检索的研究背景,同时回顾了现有的基于形状的三维模型特征提取技术,对典型的三维模型检索系统框架进行分析,并对现有的模型预处理技术以及相似性匹配方法和性能评价指标等方面的研究进展进行综述。 (2)形状描述是形状匹配的基础,它直接影响目标识别匹配结果的正确性。本章提出了一种基于反射对称特征的三维模型描述方法。该方法主要从不同的视点投影模型得到其视图特征,然后计算图像的反射对称描述符以及傅立叶描述子,最后把这两种描述符相结合得到增强的反射对称描述符,进而利用增强的反射对称特征之间的L2距离度量任意三维模型之间的相似性。该描述方法不仅适用三维模型检索,而且适用于二维图像的检索,特别是目前的三维模型检索系统中常见的二维草图的查询接口。(3)提出了基于旋转对称信息的三维模型描述方法。针对统计特征只是适合粗分类的不足之处,利用旋转对称特征与统计特征相组合方法进行分步检索。首先分别计算模型的k-重旋转对称特征及统计特征,然后根据模型的旋转对称特征检索出M个最相似模型,最后根据模型的统计特征从M个模型中检索出N个最相似模型作为最后的检索结果,M>>N。

8.学位论文桂江生二维水果形状检测与分类算法研究2007

在水果品质检测和分级中,形状是一个非常重要的指标,在国家标准中有严格的规定。本文在大量实验研究的基础上,通过对多种算法的对比分析,设计了具有统一架构的水果形状检测算法;从数学角度提出了形状的定义,并针对正常果形、轻度畸形、严重畸形三种类别研究了不同的形状描述方法;讨论了常用的分类器对形状分类结果的影响;最后针对基于形状描述的分类精度不是很高的情况,定义了新的测度并建立了基于配准技术的形状分类框架,达到了预期的研究目标。主要研究内容和研究结果如下: 1.解决了如何从众多的去噪方法中选择适合水果形状检测的方法的难题。对于高斯噪声和随机噪声类型图像,在原始图像信噪比大于8时,选择全变差(Total Variation,TV)方法恢复可以达到最好效果;信噪比小于8时,选择维纳滤波才可以达到最好的恢复效果;而对于椒盐噪声类型图像,选用中值滤波时恢复效果最好。 2.提出了运用矩阵广义逆和奇异值分解的方法恢复运动模糊图像,并用已知大小的标准球做实验,检测恢复后图像中球的大小,实验结果表明,提出的方法恢复后的图像质量要高于传统的盲去卷积等方法,速度要比差分递推法快6倍,比投影迭代方法快60倍。 3.提出了多尺度水平集形状检测方法,解决了传统的方法无论是检测算子还是梯度向量流无法检测表面含有丰富颜色特征的水果形状的问题。实验结果表明该方法具有一系列的优点:无需任何形状预处理操作;具有一定的光照适应性

;能够平滑地检测表面含有丰富颜色特征的水果,非常适合水果形状检测。 4.提出了多尺度能量分布形状描述方法,将形状轮廓序列看作一周期信号,从多分辨率分析角度来说,代表形状全局信息的主要能量分布在粗尺度上,而表示形状局部信息的次要能量分布在细尺度上,该方法对严重畸形的水果分类比较有效,实验结果表明其分类精度可以达到81.20%。该方法中基于最大期望方法确定起始点的方法,可以唯一确定起始点,这对解决形状描述中旋转不变性问题非常有效。 5.系统地分析和比较了目前常用形状描述方法,提出了将小波矩方法用于水果形状描述,得出结论:在水果形状分类中,用具有对称性的小波基(如Morlet小波)和最近邻法分类准则时,正常果形、轻度畸形及严重畸形的分类准确率可以达到69.42%、80.47%及72.62%。 6.分析了分类器对水果形状分类结果的影响,集中研究了线性判别函数、聚类分析、BP神经网络和支持向量机等四种分类器分别对三种不同的输入特征模式(傅立叶描述子特征、Zernike矩特征和小波矩特征)时的分类性能。得出结论:无论用什么分类器,小波矩特征模式作为输入模式时,都能得到最好的分类结果;其次对小波矩特征模式而言,三个聚类中心的聚类分析方法和支持向量机作为分类器都能得到尚为满意的分类精度。采用三个聚类中心的聚类分析方法时,正常果形、轻度畸形及严重畸形的分类正确率为86.21%、65.78%和85.71%;而采用支持向量机作为分类器时,分类正确率分别为:70%、83.569,0和75%。 7.建立了基于配准技术的水果形状分类框架。定义了新的测度,该测度基于面积差水平集表示原理,将待分类的形状与已知类别的形状进行配准以使得它们的不重合面积最小。并从基于最小测度配准和运动估计配准两个方面进行实验,实验结果表明基于配准的方法能达到更高的分类精度和令人满意的结果,正常果形的分类正确率91.20%,轻度畸形的分类正确率为85.88%,严重畸形分类正确率为83.34%,

9.学位论文斯钦基于内容的图像检索技术的应用研究2005

在数据库系统和计算机视觉两大研究领域的推动下,基于内容的图像检索技术已经成为当前的一个研究热点.本文针对这一课题,分别在基于颜色、纹理和形状的检索技术方面进行深入研究和探讨,归纳和总结了各种特征提取和相似性匹配的诸多算法,给出了各算法之间的比较并选择部分基于颜色和形状特征的特征提取算法进行了实验.针对基于颜色的图像检索方法,本文给出了一种根据图像颜色变化剧烈程度而动态确定量化级数的方法,而后再采用图像相关图的方法进行特征提取.针对基于形状的图像检索,在本文中,首先利用Log算子对图像进行边缘提取,再采用基于二维极坐标的傅立叶描述子进行形状特征描述,进而利用特征向量内积的方法进行相似性度量.该方法不仅可以提取到图像的轮廓特征,还能捕捉到轮廓所包围的区域特征,具有通用性.针对基于纹理的图像检索,本文只给出了部分常用的纹理特征提取算法的比较和介绍.从实验结果看,本文所采用的算法折中考虑了计算量和检索效率,具有较好的检索性能.

10.期刊论文侯漠.李保共.高立群.Hou Mo.Li Baogong.Gao Liqun足迹拇指图像识别系统的研究-计算机应用与

软件2007,24(6)

综述了图像形状描述的常用方法,提出了采用归一化傅立叶描述子对足迹拇指轮廓进行描述的方法.介绍了归一化傅立叶描述子离散化算法和实现的关键步骤即边缘跟踪算法和等间隔边缘取点算法.构造了自适应能力强的三层前馈神经网络作为分类器.最后给出了实现过程和结论.

本文链接:https://www.wendangku.net/doc/a418811333.html,/Periodical_jsjgcyyy200805029.aspx

下载时间:2010年1月7日

关于图像特征提取

关于图像特征提取 特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。 特征的定义 至今为止特征没有万能和精确的定义。特征的精确定义往往由问题或者应用类型决定。特征是一个数字图像中“有趣”的部分,它是许多计算机图像分析算法的起点。因此一个算法是否成功往往由它使用和定义的特征决定。因此特征提取最重要的一个特性是“可重复性”:同一场景的不同图像所提取的特征应该是相同的。 特征提取是图象处理中的一个初级运算,也就是说它是对一个图像进行的第一个运算处理。它检查每个像素来确定该像素是否代表一个特征。假如它是一个更大的算法的一部分,那么这个算法一般只检查图像的特征区域。作为特征提取的一个前提运算,输入图像一般通过高斯模糊核在尺度空间中被平滑。此后通过局部导数运算来计算图像的一个或多个特征。 有时,假如特征提取需要许多的计算时间,而可以使用的时间有限制,一个高层次算法可以用来控制特征提取阶层,这样仅图像的部分被用来寻找特征。 由于许多计算机图像算法使用特征提取作为其初级计算步骤,因此有大量特征提取算法被发展,其提取的特征各种各样,它们的计算复杂性和可重复性也非常不同。 边缘 边缘是组成两个图像区域之间边界(或边缘)的像素。一般一个边缘的形状可以是任意的,还可能包括交叉点。在实践中边缘一般被定义为图像中拥有大的梯度的点组成的子集。一些常用的算法还会把梯度高的点联系起来来构成一个更完善的边缘的描写。这些算法也可能对边缘提出一些限制。 局部地看边缘是一维结构。 角 角是图像中点似的特征,在局部它有两维结构。早期的算法首先进行边缘检测,然后分析边缘的走向来寻找边缘突然转向(角)。后来发展的算法不再需要边缘检测这个步骤,而是可以直接在图像梯度中寻找高度曲率。后来发现这样有时可以在图像中本来没有角的地方发现具有同角一样的特征的区域。 区域 与角不同的是区域描写一个图像中的一个区域性的结构,但是区域也可能仅由一个像素组成,因此许多区域检测也可以用来监测角。一个区域监测器检测图像中一个对于角监测器来说太平滑的区域。区域检测可以被想象为把一张图像缩小,然后在缩小的图像上进行角检测。 脊 长条形的物体被称为脊。在实践中脊可以被看作是代表对称轴的一维曲线,此外局部针对于每个脊像素有一个脊宽度。从灰梯度图像中提取脊要比提取边缘、角和区域困难。在空中摄影中往往使用脊检测来分辨道路,在医学图像中它被用来分辨血管。 特征抽取 特征被检测后它可以从图像中被抽取出来。这个过程可能需要许多图像处理的计算机。其结果被称为特征描述或者特征向量。 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 一颜色特征 (一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特

4-基于内容的图像检索

研究生课程 数字图像处理Digital Image Processing 彭宇新 北京大学计算机科学技术研究所E_mail:pengyuxin@https://www.wendangku.net/doc/a418811333.html,

基于内容的图像检索 ●为什么需要基于内容的图像检索? ●查询方式,查询demo,现有系统简介●具体内容 ?特征提取 ?相似度匹配 ?相关反馈 ?索引结构 ●MPEG-7介绍:性能评价等 ●思考的几个问题?

为什么需要基于内容的图像检索? ●当前图像内容的特征 ?海量的图像内容出现 人类已有的:历史、地理、军事、医学… 每天新增的:数码相机、互联网?图像内容的特征:没有索引、目录或摘要 ?怎样找到需要的图像?

●基于文字描述的图像检索 ?丰富的图像内容很难用文字来全面描述 ?文字的选取因人而异,带有很大的主观性 ?耗费大量的人力和时间 ●结论:对于海量的图像,基于人工标注文字的检索已不可能 ●问题:目前搜索引擎提供的基于文字的图像检索,能够解决问题吗?解决得好吗?为什么需要基于内容的图像检索?

●为什么需要基于内容的图像检索(CBIR)? ?提供图像的检索功能 ?不需要人手工标注,计算机自动分析和检索,节省人力和时间 ?使海量图像的管理和索引成为可能 ?存在的问题: 人类高级语义特征与计算机底层特征表示的矛盾 查询方式问题 为什么需要基于内容的图像检索?

基于内容的图像检索 ●为什么需要基于内容的图像检索? ●查询方式,查询demo,现有系统简介●具体内容 ?特征提取 ?相似度匹配 ?相关反馈 ?索引结构 ●MPEG-7介绍:性能评价等 ●思考的几个问题?

基于深度监督哈希的快速图像检索

1 研究背景 随着互联网的蓬勃发展,每天有数以万计的图像在网络中产生,但很难根据不同用户的要求对相关图像进行准确查找。假设数据库中的图像和待查询图像都是由实值特征来表示,查找相似图像最直接的方法就是根据数据库中的图像在特征空间中与待查询图像之间的距离对数据库中的图像进行排名,然后返回其中距离最接近的图像。但是,对于现如今拥有数千万甚至数亿张图像的数据库来说,通过线性搜索整个数据库会花费大量的时间和内存。 受到CNN(卷积神经网络)功能鲁棒性的启发,作者通过利用CNN结构提出了一种二值码学习框架(称为深度监督哈希(DSH))。在此方法中,作者首先设计一个CNN模型,该模型不再是使用单张图片进行训练,而是将图像对或三元图像组以及指示相似程度的标签作为训练输入,并生成二值码作为输出。设计损失函数用于将相似图像的网络输出拉到一起,并将不相似图像的输出推送到很远的位置,以使得学习到的汉明空间可以很好地逼近图像的语义结构。 2 国内外研究现状 最近邻居搜索的问题旨在从数据库中找到一个最接近查询的项目,在数据库很大或距离度量的计算成本很高的情况下,精确的最近邻居搜索的计算开销会过高。作为一种更实用的选择,近似最近邻搜索方法由于其高效性而受到越来越多的关注,其代表性算法为LSH(局部敏感哈希)。 为了产生更紧凑的二值码,提出了与数据相关的哈希方法,试图从训练集中学习保留相似性的哈希函数。这些方法又可以进一步分为非监督方法和监督(或半监督)方法。无监督方法仅利用未标记的训练数据来学习哈希函数。例如,SH(谱哈希)、ITQ(迭代量化哈希)等。为了更好地处理更复杂的语义相似性,提出了监督学习方法,以利用诸如类别、标签之类的信息。例如,DGH(离散图哈希)、SDH(监督离散哈希)等。 上述哈希方法在一定程度上确实取得了成功,但这些功能无法很好地捕获现实世界数据中出现的剧烈变化下的复杂语义信息,从而限制了学习的二进制代值码的检索精度。为了解决这个问题,又出现了一些基于CNN的哈希方法。 2.1 LSH(Locality Sensitive Hashing,局部敏感哈希) 局部敏感哈希是最初的用来做图像哈希索引的算法,其基本思想是使用一组哈希函数使用随机投影来生成哈希位将数据散列到不同的桶中,令相近的数据落在同一个哈希

图像特征提取总结

图像常见特征提取方法简介 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 一、颜色特征 (一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布的信息。 (二)常用的特征提取与匹配方法 (1)颜色直方图 其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。 最常用的颜色空间:RGB颜色空间、HSV颜色空间。 颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。 (2)颜色集 颜色直方图法是一种全局颜色特征提取与匹配方法,无法区分局部颜色信息。颜色集是对颜色直方图的一种近似首先将图像从RGB颜色空间转化成视觉均衡的颜色空间(如HSV 空间),并将颜色空间量化成若干个柄。然后,用色彩自动分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一个二进制的颜色索引集。在图像匹配中,比较不同图像颜色集之间的距离和色彩区域的空间关系 (3)颜色矩 这种方法的数学基础在于:图像中任何的颜色分布均可以用它的矩来表示。此外,由于颜色分布信息主要集中在低阶矩中,因此,仅采用颜色的一阶矩(mean)、二阶矩(variance)和三阶矩(skewness)就足以表达图像的颜色分布。 (4)颜色聚合向量 其核心思想是:将属于直方图每一个柄的像素分成两部分,如果该柄内的某些像素所占据的连续区域的面积大于给定的阈值,则该区域内的像素作为聚合像素,否则作为非聚合像素。(5)颜色相关图 二纹理特征 (一)特点:纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局部的偏差而无法匹配成功。作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力。但是,纹理特征也有其缺点,一个很明显的缺点是当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。另外,由于有可能受到光照、反射情况的影响,从2-D图像中反映出来的纹理不一定是3-D物体表面真实

图像特征特点及其常用的特征提取与匹配方法

图像特征特点及其常用的特征提取与匹配方法 [ 2006-9-22 15:53:00 | By: 天若有情 ] 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 一颜色特征 (一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布的信息。 (二)常用的特征提取与匹配方法 (1)颜色直方图 其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。 最常用的颜色空间:RGB颜色空间、HSV颜色空间。 颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。 (2)颜色集 颜色直方图法是一种全局颜色特征提取与匹配方法,无法区分局部颜色信息。颜色集是对颜色直方图的一种近似首先将图像从RGB颜色空间转化成视觉均衡的颜色空间(如HSV 空间),并将颜色空间量化成若干个柄。然后,用色彩自动分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一个二进制的颜色索引集。在图像匹配中,比较不同图像颜色集之间的距离和色彩区域的空间关系 (3)颜色矩 这种方法的数学基础在于:图像中任何的颜色分布均可以用它的矩来表示。此外,由于颜色分布信息主要集中在低阶矩中,因此,仅采用颜色的一阶矩(m ean)、二阶矩(variance)和三阶矩(skewness)就足以表达图像的颜色分布。(4)颜色聚合向量 其核心思想是:将属于直方图每一个柄的像素分成两部分,如果该柄内的某些像素所占据的连续区域的面积大于给定的阈值,则该区域内的像素作为聚合像素,否则作为非聚合像素。 (5)颜色相关图 二纹理特征 (一)特点:纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局

图像特征提取方法

图像特征提取方法 摘要 特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。 至今为止特征没有万能和精确的图像特征定义。特征的精确定义往往由问题或者应用类型决定。特征是一个数字图像中“有趣”的部分,它是许多计算机图像分析算法的起点。因此一个算法是否成功往往由它使用和定义的特征决定。因此特征提取最重要的一个特性是“可重复性”:同一场景的不同图像所提取的特征应该是相同的。 特征提取是图象处理中的一个初级运算,也就是说它是对一个图像进行的第一个运算处理。它检查每个像素来确定该像素是否代表一个特征。假如它是一个更大的算法的一部分,那么这个算法一般只检查图像的特征区域。作为特征提取的一个前提运算,输入图像一般通过高斯模糊核在尺度空间中被平滑。此后通过局部导数运算来计算图像的一个或多个特征。 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。当光差图像时,常 常看到的是连续的纹理与灰度级相似的区域,他们相结合形成物体。但如果物体的尺寸很小 或者对比度不高,通常要采用较高的分辨率观察:如果物体的尺寸很大或对比度很强,只需 要降低分辨率。如果物体尺寸有大有小,或对比有强有弱的情况下同事存在,这时提取图像 的特征对进行图像研究有优势。 常用的特征提取方法有:Fourier变换法、窗口Fourier变换(Gabor)、小波变换法、最 小二乘法、边界方向直方图法、基于Tamura纹理特征的纹理特征提取等。

设计内容 课程设计的内容与要求(包括原始数据、技术参数、条件、设计要求等):一、课程设计的内容 本设计采用边界方向直方图法、基于PCA的图像数据特征提取、基于Tamura纹理特征的纹理特征提取、颜色直方图提取颜色特征等等四种方法设计。 (1)边界方向直方图法 由于单一特征不足以准确地描述图像特征,提出了一种结合颜色特征和边界方向特征的图像检索方法.针对传统颜色直方图中图像对所有像素具有相同重要性的问题进行了改进,提出了像素加权的改进颜色直方图方法;然后采用非分割图像的边界方向直方图方法提取图像的形状特征,该方法相对分割方法具有简单、有效等特点,并对图像的缩放、旋转以及视角具有不变性.为进一步提高图像检索的质量引入相关反馈机制,动态调整两幅图像相似度中颜色特征和方向特征的权值系数,并给出了相应的权值调整算法.实验结果表明,上述方法明显地优于其它方法.小波理论和几个其他课题相关。所有小波变换可以视为时域频域的形式,所以和调和分析相关。所有实际有用的离散小波变换使用包含有限脉冲响应滤波器的滤波器段(filterbank)。构成CWT的小波受海森堡的测不准原理制约,或者说,离散小波基可以在测不准原理的其他形式的上下文中考虑。 通过边缘检测,把图像分为边缘区域和非边缘区域,然后在边缘区域内进行边缘定位.根据局部区域内边缘的直线特性,求得小邻域内直线段的高精度位置;再根据边缘区域内边缘的全局直线特性,用线段的中点来拟合整个直线边缘,得到亚像素精度的图像边缘.在拟合的过程中,根据直线段转角的变化剔除了噪声点,提高了定位精度.并且,根据角度和距离区分出不同直线和它们的交点,给出了图像精确的矢量化结果 图像的边界是指其周围像素灰度有阶跃变化或屋顶变化的那些像素的集合,边界广泛的存在于物体和背 景之间、物体和物体之间,它是图像分割所依赖的重要特征.边界方向直方图具有尺度不变性,能够比较好的 描述图像的大体形状.边界直方图一般是通过边界算子提取边界,得到边界信息后,需要表征这些图像的边 界,对于每一个边界点,根据图像中该点的梯度方向计算出该边界点处法向量的方向角,将空间量化为M级, 计算每个边界点处法向量的方向角落在M级中的频率,这样便得到了边界方向直方图. 图像中像素的梯度向量可以表示为[ ( ,),),( ,),)] ,其中Gx( ,),),G ( ,),)可以用下面的

基于内容的图像检索系统报告

第六届浙江省大学生电子商务竞赛 作品名称:基于内容的网络商品图像检 索系统 作品类别:技术类 2011年3月13日

目录 第1章项目背景 (3) 第2章关键技术介绍 (6) 第3章系统分析与设计 (8) 3.1需求分析 (8) 3.1.1功能性需求分析 (8) 3.1.2非功能性需求分析 (8) 3.2系统设计 (10) 3.2.1 总体结构设计 (10) 3.2.2 功能模块设计 (11) 3.2.3 检索流程设计 (12) 3.2.4数据存储设计 (14) 3.2.5 算法设计 (17) 第4章系统实现 (25) 4.1 数据采集模块 (25) 4.2 数据检索模块 (28) 4.3 数据显示模块 (29) 4.4 数据推送模块 (34) 第5章盈利模式与市场营销推广策略 (36) 5.1目标市场 (36) 5.2盈利模式 (36) 5.3 系统推广策略 (37) 第6章财务分析 (41) 6.1搜索系统建设成本 (41) 6.2搜索引擎运行维护成本 (41) 6.3搜索系统宣传推广成本 (42) 第7章风险及对策 (43)

7.1市场风险及对策 (43) 7.2技术风险及对策 (43) 7.3项目风险及对策 (44) 7.4竞争风险及对策 (44) 第8章创新点 (45) 第9章总结 (46) 【参考文献】 (47)

第1章项目背景 随着计算机软硬件和互联网技术的飞速发展,多媒体数据的数量以惊人的速度增长。各行各业有越来越多的信息通过图像的形式进行表达,这些图像中包含了大量有用的信息。但是这些图像松散的分布在世界各地,缺少有效的组织,难以达到资源共享的目的。因此如何利用如此众多的图像信息并从中定位感兴趣的图像,是对图像信息的查询技术提出的重大挑战。 早在1951年,信息检索(Information Retrieval)这一术语就被Calvin M oores描述为使用户的信息需求能够变为最终的有用信息的过程。当然,他当时指的是文本格式的文件检索。但他的描述却揭示了信息检索系统的实质:帮助用户具体定位相关信息。 在1970年以后,随着数据库管理和计算机视觉两个领域的飞速发展,图像检索技术(Image Retrieval)的研究成为热点。由于图像检索在这两个领域的不同应用,所以它们采用的研究方法也各自有所侧重。数据库管理领域的研究采用基于文本的图像检索方法,而计算机视觉领域则偏重于基于视觉的图像检索。 基于文本的图像检索(text-based image retrieval),主要在数据库领域中进行研究,它的一个典型框架是,首先对图像用文本进行注解(关键字),然后用基于文本的数据库管理系统(DBMS)来进行图像关键字检索,诸如数据模型、多维度索引、查询评价等的研究进展均是沿着这一领域所作的。但是,基于文本的图像检索存在很大困难,尤其是图像的数据量非常大的时候,其一,手工对图像进行注释所需的工作量太大;其二,许多图像很难用文字的方式进行描述;其三,不同的人对同一幅图像的理解不一样,即使同一个人对同一幅图像在不同环境下理解也不完全相同,这样使得对图像的描述不唯一,造成检索结果的千差万别;其四,由于世界上存在许多语种,采用不同的语言文字对图像进行描述而建立的索引在应用中造成了一定的阻碍。因此基于文本方式的图像检索存在很大的局限性。 90年代初期,随着大规模数字图像库的出现,上述的问题变得越来越尖锐。为克服这些问题,基于内容的图像检索技术(content-based image retrieval)应运而生。区别于原有系统中对图像进行人工标注的做法,基于内容的检索技术

基于颜色特征的图像检索算法的实现

目录 摘要 (1) 关键字 (1) 1绪论 (1) 1.1 基于内容的图像检索的概念 (1) 1.2 基于内容的图像检索的发展历史 (1) 1.3 基于内容的图像检索的特点和主要应用 (1) 1.4 基于内容的图像检索的关键技术 (2) 1.5 国内外研究现状 (3) 1.5.1 国外研究现状 (3) 1.5.2 国内研究现状 (4) 2 基于颜色特征的图像检索方法 (4) 2.1 颜色度量体系 (4) 2.2 颜色空间 (5) 2.2.1 RGB颜色空间 (5) 2.2.2 HSV颜色空间 (5) 2.2.3 CMY颜色空间 (6) 3 颜色特征的表达 (7) 3.1 颜色直方图 (7) 3.2 累加直方图 (8) 4 图像特征的相似性匹配 (9) 4.1 距离度量方法 (9) 4.2直方图的交集的方法 (9) 4.3 欧式距离法 (9) 5 图像检索算法实现 (10) 5.1程序开发运行环境 (10) 5.2 程序检索逻辑 (10) 5.3 算法具体实现 (11) 5.4 实例演示 (14) 6 全文总结与展望 (15) 6.1 全文总结 (15) 6.2 展望 (15) 致谢 (15) 参考文献 (16) 英文摘要 (16)

基于颜色特征的图像检索算法的实现 摘要:文章介绍了一种基于颜色特征的图像检索技术的算法并给出了程序实现。首先介绍了基于内容的图像检索技术、发展历史及基于内容的图像检索技术的特点和主要应用,并在此基础上探讨了该领域所用到的一些关键技术。文章着重探讨了图像的颜色空间、图像特征提取及图像相似性度量等内容,并利用matlab技术实现了一个简单图像检索的程序。文章最后则对当前基于内容图像检索技术研究热点和今后的发展方向进行简单的阐述。 关键字:基于内容的图像检索;颜色特征;颜色直方图;相似度度量方法 1 绪论 1.1 基于内容的图像检索的概念 基于内容的图像检索[1](Content Based Image Retrieval, CBIR)是一项从图像数据库中找出与检索式内容相似的图像的检索技术。它利用从图像中自动抽取出来的底层特征,如颜色、纹理、轮廓和形状等特征,进行计算和比较,检索出符合用户需求的结果图像集。目前图像检索系统技术实现的基础是对底层特征信息的计算和比较,也即是“视觉相似”。 1.2 基于内容的图像检索的发展历史 图像检索技术的发展[2]可以分为两个阶段,第一阶段始于70年代,当时的图像检索是通过人工的标注来实现的,随着计算机技术和通信网技术的发展,特别是因特网的快速发展,图像数据的容量越来越大了,这种“以关键字找图”的方法越来越不适应检索技术的发展了。由于图像内容的丰富内涵以及人们对图像内容进行抽象时的主观性不同的人对同一幅图像有不同的理解,这就引入了主观多义,不利于检索。为了克服文本标注检索的弊端,90年代研究者提出了基于内容的图像检索,其方法是:根据图像的颜色特征、纹理特征、形状特征以及空间关系等作为索引,计算查询图像和目标图像之间的相似距离,然后按相似度匹配进行检索,这种技术很大程度地利用了人们的视觉客观特性,避免不同人对图像主观理解的不同而达不到理想的搜索效果。从研究方向的层面来看,基于内容的图像检索可分为三层:第一层是根据图像的底层特性来进行检索,如颜色、纹理,形状等等,涉及图像信息处理、图像分析和相似性匹配技术;第二层是基于图像对象语义,如图像中实体及实体之间的拓扑关系的检索,对象级检索技术建立在下层特征基础上,并引入了对象模型库、对象识别和人工智能等图像理解技术;第三层是基于图像的抽象属性如行为语义,情感语义和场景语义的推理学习来进行检索。需要用到知识库和更加有效的人工智能和神经网络技术。这三个层次由低到高,与人的认知接近,下一个层次通常包含了比上一个层次更高级的语义,更高层的语义往往通过较低层的语义推理获得。尽管经过了多年的研究,较为成熟的基于内容的图像检索技术目前仍处于底层水平,由于底层研究是上层研究的基础,为了给上层建立准确、有效的图像特征提取方法,底层的研究仍在不断的发展。 1.3 基于内容的图像检索的特点和主要应用 基于内容的图像检索技术有以下特点[3]: 一是它突破了传统的基于表达式检索的局限,从媒体内容中提取信息线索。

CCD图像的轮廓特征点提取算法

第33卷第4期电子科技大学学报V ol.33 No.4 2004年8月Journal of UEST of China Aug. 2004 CCD图像的轮廓特征点提取算法 侯学智,杨平,赵云松 (电子科技大学机械电子工程学院成都 610054) 采用最大方差法将图像二值化,用图像形态学的梯度细化和修剪算法来提取边缘轮廓,利用十一【摘要】﹑ 点曲率法得到轮廓的角点和切点的大致位置。提出了一种基于最小二乘拟合的改进算法,来进一步确定角点和切点,并对轮廓分段识别。该算法应用在基于图像处理的刀具测量系统中,实际结果表明具有良好的抗噪声性能,能准确提取出图像的特征点。 关键词刀具测量; 细化; 曲率; 最小二乘拟合; 角点 中图分类号TP391 文献标识码 A Contour Feature Point Detection Algorithm of CCD Image Hou Xuezhi,Yang Ping,Zhao Yunsong (School of Mechatronic Engineering, UEST of China Chengdu 610054) Abstract The image is segmented to Bi-value image with max variance algorithm, and then the edge is detected by a series of image morphology algorithm including grads, thinning and cutting. The eleven point curvature-computing method is used to locate the area of corner and point of tangency. An improved algorithm based on least square fitting is given to search corner and point of tangency. This algorithm is applied to the cutting tools measurement system based on image processing and the actual result proves it has a good noise-resisted performance and can detect feature points accurately. Key words cutting tools measurement; thinning; curvature; least square fitting; corner 目前数控加工精度已达到微米级,对刀精度要求愈来愈高。传统的刀具测量方式采用人眼瞄准,容易带来主观误差,使对刀精度降低。在基于图像处理的刀具测量系统中,CCD数码相机将对刀状态的图像摄入,通过USB接口输入计算机。首先提取出刀具轮廓的特征点,再对轮廓曲线进行分段,从而测量刀具的长度﹑半径﹑角度等参数。通常利用曲率信息来提取轮廓特征点,三点曲率法对噪声较敏感,十一点曲率法能较好地估算出轮廓的曲率,并能简单提取出轮廓的角点与切点区域[1, 2]。本文提出利用最小二乘法拟合角点和切点区域的曲线,根据计算的斜率和曲率的特点能有效确定角点和切点。 1 图像预处理 被测刀具的图像如图1所示。CCD相机采集到刀具的彩色图像,将其转化为256色的灰度图像,如图1a 所示,采用最大方差阈值法将图像二值化。由于刀具表面存在油污,光线散射等原因,图像二值化后,在刀具部分有颗粒状噪声,而刀具以外有细小孔洞存在,所以在提取轮廓前,采用形态学算子滤波。在图像形态学中,最基本的运算是腐蚀和膨胀运算,通过腐蚀和膨胀可以构成开运算与闭运算。开闭运算都能够平滑边缘,其中开运算能够消除细小物体,闭运算能够填充物体孔洞。本文采用方形结构元素,对图像先闭运算后开运算,有效地滤除了图像的细小孔洞和噪声,而刀具的结构和面积基本保持不变。图1b所示为 收稿日期:2003 ? 07 ? 24 作者简介:侯学智(1980 ? ),男,硕士生,主要从事工业测控技术方面的研究.

图像检索系统

摘要 基于文本的图像检索技术存在两个缺点。首先,标注每个图像是比较困难的;再次主观性和图像注释的不精确性在检索过程中可能引起适应性问题。基于内容的图像检索技术克服了传统的图像检索技术的缺点。基于内容的图像检索技术分为特征提取和查询两个部分。本文主要介绍基于颜色特征的图像检索技术颜色特征是图像的基本特征也是最为直观的特征之一。着重探讨了颜色空间的选取颜色特征的提取和表达颜色的相似度以及现有的图像的检索系统和存在的问题。在这里颜色空间的选取有RGB颜色模式HSV颜色模型。颜色提取的基本思想是用颜色直方图来统计每种颜色出现的概率。目前相关的系统有QBIC系统、Photo book系统、CORE系统等等。 关键词:基于内容的图像检索技术;特征提取;特征表达;颜色直方图; Abstract Traditional text-based image retrieval techniques have two shortcomings: First, it has been difficulties to note each image. Second, the subjectivity and no precision of image anno-tation may lead to the adaptation in the retrieval process. CBIR overcome the shortcomings of the traditional text-based image retrieval .Content-based image retrieval can divide into two parts, that is feature extraction and query. In this paper, based Color Image Retrieval is mainly introduced. Color features are the basic characteristics of the image as well as are one of the most intuitive features. Here we focused on the selection of color space, color feature extrac-tion and expression, color similarity, and the existing image retrieval systems and problems. There are many color models to express color such as the RGB color model, the HSV color model. The basic idea to extract color is to use color histogram to calculate the probability statistics of each color .Currently there are some related systems QBIC system related system, Photo book system, CORE system and so on. Keywords: Content-based image retrieval; Feather extraction; Feather presentation; color histogram;

静态图像人体轮廓提取方法的研究

静态图像人体轮廓提取方法的研究 静态图像人体轮廓提取是指从静态图像中将人体轮廓分割出来,它在计算机视觉中的人体行为识别、背景分割与替换等多个方面都有着广泛的应用。静态图像人体轮廓提取面临着巨大的挑战,包括人体姿态的多样性,衣着的各异性,光线的变化以及复杂的背景等多个方面。 近年来,随着深度学习的快速发展,图像处理领域中基于传统特征提取的方法逐渐被深度学习所取代,而卷积神经网络在图像特征提取方面体现出了很大的优势。因此,采用卷积神经网络进行人体轮廓提取具有重要意义。 本文的主要研究内容如下:1.针对传统特征提取无法精准分割人体轮廓的问题,采用一种基于深度学习的人体轮廓提取方法。该方法设计了特定的卷积神经网络结构,在模型中引入了全卷积神经网络,反卷积与网络中网络的相关技术,实现了对静态图像在像素级别的人体轮廓提取。 2.为了提高模型的性能,在本文所构建卷积神经网络的基础上提出了一种改进方法,将原始图像经过Gabor滤波器进行预处理后再传入卷积神经网络,利用Gabor特征与卷积神经网络相结合实现了更精确的人体轮廓提取。 3.分别借助VOC2012数据集和百度人体分割数据集来验证本文所提出方法的有效性。 并将改进后的模型应用于具有隐私保护功能的视频监控系统,选择CAVIAR 视频监控数据集中的视频进行测试,并对结果进行分析。实验结果表明:(1)基于卷积神经网络的人体轮廓提取方法实现了对人体轮廓的快速有效分割,体现了利用深度学习进行实验的可行性;(2)改进后的模型在VOC2012数据集上的吻合度测试结果比原始模型提高了 10.96%;(3)在百度数据集上的测试结果表明该改进方法相比于其他现有方法,在准确度和处理速度等方面都能体现出合理性和有效

基于颜色特征的图像检索

基于颜色特征的图像检索

摘要 随着多媒体及网络技术的发展,互联网中的图像等多媒体信息的数量在迅速增加。如何在庞大的多媒体数据资源海洋中搜索到自己所需要的图像,随之成为一个函待解决的问题。近年来基于内容的图像检索技术己经成为了研究的热点,该技术具有传统文本检索方式所无法比拟的优越性,目前已被应用于多媒体通信、生物识别、知识产权保护等方面,具有广阔的发展前景。 本课题设计了基于颜色特征的图像检索系统,该系统主要包括两个关键步骤:颜色特征的提取和相似度匹配。本文中首先采用应用广泛的HSV颜色空间来表示图像的颜色特征,对颜色分量进行非等间隔量化形成特征矢量;然后用欧式距离度量函数进行图像的相似性匹配;最后在MATLAB平台下编程实现了基于颜色特征的检索系统。根据用户输入的样本图像与图像库中的图像进行特征匹配,找出与样本图像距离比较小的若干幅图像,并按照图像之间的距离由小到大的顺序显示给用户。 关键词:图像检索;直方图;颜色特征;MATLAB I

ABSTRACT With the development of multimedia technology, In Internet the number of images and other multimedia information in the rapidly increasing. How to locate the useful image in the vast multi-media is a great technology problem. In recent years, Content-based image retrieval has become a research focus, the technology has the superiority which the traditional text retrieval methods can not match.It has been widely used in multimedia communications, biometrics, intellectual property protection and so on, and has broad prospeets for development. This topic is designed based Color Image Retrieval System, which includes two key steps: color feature extraction and similarity matching. In this article was first used widely HSV color space to represent color feature image. We carried out color components quantification of non-interval to form feature vector; Then use the Euclidean distance metric function to match the similarity function of the image. Finally, this system should be implemented under the platform of the MATLAB by programming. Under user input sample image to conduct feature matching with image which in library images. In this system, It also can identify the images that have a short distance to the sample images, And in accordance with the distance between the images displayed to the user in the order from small to big. Keywords:Image Retrieval;Histogram Algorithm;Color Features;MATLAB II

(完整版)图像特征特点及常用的特征提取与匹配方法

图像特征特点及常用的特征提取与匹配方法 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 一颜色特征 (一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布的信息。 (二)常用的特征提取与匹配方法 (1) 颜色直方图 其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。 最常用的颜色空间:RGB颜色空间、HSV颜色空间。 颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。 (2) 颜色集 颜色直方图法是一种全局颜色特征提取与匹配方法,无法区分局部颜色信息。颜色集是对颜色直方图的一种近似首先将图像从RGB颜色空间转化成视觉均衡 的颜色空间(如HSV 空间),并将颜色空间量化成若干个柄。然后,用色彩自动分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一个二进制的颜色索引集。在图像匹配中,比较不同图像颜色集之间的距离和色彩区域的空间关系 (3) 颜色矩

基于内容的图像检索技术

第二部分 基于内容的图像检索技术 近年来,随着多媒体技术和计算机网络的飞速发展,全世界的数字图像的容量正以惊人的速度增长。无论是军用还是民用设备,每天都会产生容量相当于数千兆字节的图像。这些数字图像中包含了大量有用的信息。然而,由于这些图像是无序地分布在世界各地,图像中包含的信息无法被有效地访问和利用。这就要求有一种能够快速而且准确地查找访问图像的技术,也就是所谓的图像检索技术。自从20世纪70年代以来,在数据库系统和计算机视觉两大研究领域的共同推动下,图像检索技术已逐渐成为一个非常活跃的研究领域。数据库和计算机视觉两大领域是从不同的角度来研究图像检索技术的,前者基于文本的,而后者是基于视觉的。 基于文本的图像检索技术(text-based image retrieval)的历史可以追溯到20世纪70年代末期。当时流行的图像检索系统是将图像作为数据库中存储的一个对象,用关键字或自由文本对其进行描述。查询操作是基于该图像的文本描述进行精确匹配或概率匹配,有些系统的检索模型还是有词典支持的。另外,图像数据模型、多维索引、查询评价等技术都在这样一个框架之下发展起来。然而,完全基于文本的图像检索技术存在着严重的问题。首先,目前的计算机视觉和人工智能技术都无法自动对图像进行标注,而必须依赖于人工对图像做出标注。这项工作不但费时费力,而且手工的标注往往是不准确或不完整的,还不可避免地带有主观偏差。也就是说,不同的人对同一幅图像有不同的理解方法,这种主观理解的差异将导致图像检索中的失配错误。此外,图像中所包含的丰富的视觉特征(颜色或纹理等)往往无法用文本进行客观地描述的。 90年代初期,随着大规模数字图像库的出现,上述的问题变得越来越尖锐。为克服这些问题,基于内容的图像检索技术(content-based image retrieval)应运而生。区别于原有系统中对图像进行人工标注的做法,基于内容的检索技术自动提取每幅图像的视觉内容特征作为其索引,如色彩、纹理、形状等。此后几年中,这个研究领域中的许多技术发展起来,一大批研究性的或商用的图像检索系统被建立起来。这个领域的发展主要来归功于计算机视觉技术的进步,在文献[]中有对这一领域的详细介绍。 应该认识到,基于内容的图像检索系统具有与传统基于文本的检索系统完全不同的构架。首先,由于图像依赖其视觉特征而非文本描述进行索引,查询将根据图像视觉特征的相似度进行。用户通过选择具有代表性的一幅或多幅例子图像来构造查询,然后由系统查找与例子图像在视觉内容上比较相似的图像,按相似度大小排列返回给用户。这就是所谓的通过例子图像的检索(query by image example)。另外,基于内容的检索系统一般通过可视化界面和用户进行频繁的交互,以便于用户能够方便地构造查询、评估检索结果和改进检索结果。 下图表示了基于内容的图像检索系统的体系结构。系统的核心是图像特征数据库。图像特征既可以从图像本身提取得到,又可以通过用户交互获得,并用于计算图像之间的相似度。用户和系统之间的关系是双向的:用户可以向系统提出查询要求,系统根据查询要求返回查询结果,用户还通过对查询结果的相关反馈来改进查询结果。图中还标出了基于内容的图像检索中的一些关键环节: 1) 选择、提取和索引能够充分表达图像的视觉特征。

相关文档
相关文档 最新文档