文档库 最新最全的文档下载
当前位置:文档库 › 图像识别实验报告

图像识别实验报告

图像识别实验报告
图像识别实验报告

图像识别实验报告

学院:信息工程学院

专业:信号与信息处理姓名:唐雄辉

学号:2009124022

授课教师:陈柘

2010年7 月5 日

一 实验内容:

采用基于二值数据的Bayes 分类方法,基于最小错误率的Bayes 分类方法和基于最小风险的Bayes 分类方法三种算法,完成字符(0-9,A-Z )的识别:

二 实验方法

1、 Bayes 公式

若已知总共有M 类物体,以及各类在这d 维特征空间的统计分布,具体说来是已知各类别w i =1,2,…,M 的先验概率P (w i )及类条件概率密度函数P (X| w i )。对于待测样品,Bayes 公式可以计算出该样品分属各类别的概率,叫做后验概率,看X 属于哪个类的可能性最大,就把X 归于可能性最大的那个类,后验概率作为识别对象归属的依据。Bayes 公式如下:

∑==

n

j j j

i i i P X P P X P X P 1

)

()|()

()|()|(ωω

ωωω

类别的状态是一个随机变量,而某种状态出现的概率是可以估计的Bayes 公式体现了先验概率、类概率密度函数、后验概率三者之间的关系。

(1)先验概率P (w i )

先验概率P (w i )针对M 个事件出现的可能性而言,不考虑其他任何条件。例如由统计资料表明总药品数为n ,其中正常药品数为n 1 异常药品数为n 2 则

2

1

1)(n n p =

ω

n

n P 22)(=

ω

称P (w i )及P(w 2 )为先验概率。显然在一般情况下正常药品占比例大,即P(w i )> P(w 2 ),仅按先验概率来决策,就会把所有药品都划归为正常药品,并没有达到将正常药品与异常药品区分开的目的。这表明由先验概率所提供的信息太少。

(2)类条件概率密度函数P (X| w i )

类条件概率密度函数P (X| w i )是指在已知某类别的特征空间中,出现特征值X 的概率密度。即第w i 类样品它的属性X 是如何分布的。假定只有其一个特征进行分类,即d=1,并已知这两类的类条件概率密度函数分布,如图1所示,概率密度函数P (X| w i )是正常药品的属性分布,概率密度函数P (X| w 2)是

异常药品的属性分布。

图1、类条件概率

(3) 后验概率

后验概率是指呈现状态X 时,该样品分属各类别的概率,这个概率值可以作为识别对象归属的依据。由于属于不同类的待识别对象存在着呈现相同观察值的可能,即所观察到的某一样品的特征向量为X ,而在M 类中又有不止一类可能呈现这一X 值,它属于各类的概率又是多少呢?这种可能性可用P (X| w i )表示。可以利用Bayes 公式来计算这种条件概率,称之为状态的后验概率P (w i |X )。

∑==

n

j j j

i i i P X P P X P X P 1

)

()|()

()|()|(ωω

ωωω

P (w i |X )是表示在X 出现条件下,样品为w i 类的概率。 2、 基于最小错误率的Bayes 决策

假定得到一个待识别量的特征X 后,每个样品X 有N 个特征,即X=(x 1,x 2,…,x N )通过样品库,计算先验概率P (w i )及类条件概率密度函数P (w i |X ),得到呈现状态X 时,该样品分属各类别的概率,显然这个概率值可以作为识别对象判属的依据。从后验概率分布图可见,在X 值小时,药品被判为正常是比较合理的,判断错误的可能性小。基于最小错误概率的贝叶斯决策就是按后验概率的大小做判决的。这个规则又可以根据判别数目,写成不同的几种等价形式。

两类问题

若每个样品属于w i ,w 2 类中的一类,已知两类的先验概率分别为 P (w i )和P (w 2 )两类的类条件概率密度分别为P (X| w i )和P (X| w 2)。则任给一X ,判断X 的类别。由Bayes 公式可知:

)(/)()|()|(X P P X P X P j j j ωωω=

由全概率公式可知:

)()|()(1

j M

j j P X P X P ωω∑==

其中M 为类别。 对于两类问题

)()|()()|()(2211ωωωωP X P P X P X P +=

所以用后验概率来判别为:

判别函数还有另外两种形式,即似然比形式:

其中L (x )在统计学中称为似然比,而 P (w i )/ P (w 2 )称为似然比阈值,其对数形式:

3、 基于最小风险的Bayes 决策

上面讨论了使错误率最小的Bayes 决策规则。然而当接触到实际问题是,可以发现使错误率最小并不一定是一个普遍适用的最佳选择,如图2所示:

图2、 基于最小错误率和基于最小风险分类比较

直线B 的划分把正常药品误判为异常药品,这样会扩大总错误率,给企业带来一些损失:直线A 的划分将异常药品误判为正常药品,虽然是错误分类最小,但会使病人因失去正确的治疗而遭受极大地损失。可见使错误率最小并不一定是最佳选择。

实践中,从根据不同性质的错误会引起不同程度的损失考虑出发,宁肯扩大一些总的错误率,但也要使总的损失减少。这时直线B 的划分为最实用。这会引进一个与损失有关联的概念——风险,在做出决策时,要考虑所承担的风险。基于最小风险的Bayes 决策规则正是为了体现这一点而产生的。

基于最小错误率,在分类时取决于观测值X 对各类的后验概率中之最大值,因而也就无法估计做出错误决策所带来的损失。为此不妨将做出判决的依据,从单纯

考虑后验概率最大值,改为对该观测值X 条件下各状态后验概率要求加权和的方式,表示成:

)|(),()(1

X P j a x R j M

j i i ωλ∑==

其中a i 代表将X 判为w i 类的决策; 观测样品X 实属于w j ,由于采用a i 决策而被判为w i 时所造成的损失。R i 则表示了观测值X 被判为i 类时损失的均值。

4、基于二值数据的Bayes 分类方法

所谓二值数据,即各样品的每一特征只取数值“1”或“0”。对于数字的分类问题,在每一个数字图像提取特征时,定义了N*N 模板,在本程序中N=5,将每个样品的长度和宽度5等份,构成一个5*5模板,相当于将模板笼罩在对应的样品上,对于每一份内的像素个数进行累加统计,除以该模板每一份的面积总数。设置阈值T=0.1,模板所对应的元素黑像素占有率大于T ,则特征值取数值“1”;负责取“0”。

三 实验步骤

1、基于二值数据的Bayes 分类方法的实验步骤:

(1)计算先验概率P (w i ),先验概率可由各类的样品数和样品总数近似计算,得

P (w i )=N i /N, i=0,1,2,…,9

其中P (w i )为类别为数字i 的先验概率,N i 位数字i 的样品数,N 为样品总数

(2)计算P j (w i ),再计算类条件概率P (X|w i )得

)2/()1()(1

++=∑∈=i N x k kj i j N x P i

ωω

i=0,1,2,…,9,j=0,1,2…,24

P j (w i )表示样品X (x 0,x 1,x 2,…,x 24)属于w i 类条件下,X 的第j 个分量为1(x j =1)的概率估计值。由此可以计算 P (x j =1|X ∈w i )= P j (w i )

P (x j =0| X ∈w i )=1- P j (w i ) i=0,1,2,…,9,j=0,1,2,…,24 样品X 的类条件概率为:

P (X| w i )=P{ X=(x 0,x 1,x 2,…,x 24)| X ∈w i }=∏j=024P(x j =a| X ∈w i ) i=0,1,2,…,9 其中a=0或1。

(3)应用Bayes 公式求后验概率,得

)

|()(...)|()()|()()

|()()|(991100ωωωωωωωωωX P P X P P X P P X P P X P i i i +++=

i=0,1,2,…,9

后验概率的最大值的类别(0~9)就是所要识别数字所属的类别。 算法实现代码:

/****************************************************************** * 函数名称:BayesErzhishuju() * 函数类型:int

* 函数功能:基于二值数据的Bayes 分类器 ,返回所要识别的数字的类别 ******************************************************************/ int Classification::BayesErzhishuju() { double Pw[10];//先验概率P(wj)=Nj/N

double P[10][25];//Pj(wi)wi:wi 类,j:第j 个特征 double PXw[10];//类条件概率P(X|wj) double PwX[10];//后验概率P(wj|X) int i,j;//求先验概率 int n[10];//各类样品数 int N=0;//样品总数 for(i=0;i<10;i++) { //各数字类别样品数 n[i]=pattern[i].number; N+=n[i];//样品总数

}

for(i=0;i<10;i++)

Pw[i]=(double)n[i]/(double)N;//先验概率 for(i=0;i<10;i++) { for(j=0;j<25;j++) { int numof1=0;//二值数据中1的个数 for(int k=0;k

numof1+=pattern[i].feature[k][j]>0.1?1:0;

P[i][j]=(double)(numof1+1)/(double)(n[i]+2);

}

}

for(i=0;i<10;i++)

{

double p=1;

for(int j=0;j<25;j++)

{

p*=(testsample[j]>0.1)?P[i][j]:1-P[i][j];

}

PXw[i]=p;

}

double PX=0.0,maxP=0.0;

int number;

for(i=0;i<10;i++)

{

PX+=Pw[i]*PXw[i];

}

for(i=0;i<10;i++)

{

PwX[i]=Pw[i]*PXw[i]/PX;

if(PwX[i]>maxP)

{

maxP=PwX[i];

number=i;

}

}

return number;

}

(4)实验效果图

基于二值数据的Bayes分类实现效果如图3所示:

2、 基于最小错误率的Bayes 分类实现的实验步骤 数字识别属于多类情况,每类样品呈正态分布。 (1) 求出每一类样品的均值

9,....2,1,0,),...,,(1211

===

∑=i x x x X

N X T im i i N j ij

i

i i

N i 代表w i 类的样品个数,n 代表特征数目。 (2) 求每一类的协方差矩阵

n k j x x x x N i k lk N l j lj

i

i jk

i

S

,...,2,1,),)(1

1

=---=

∑=

L 代表样品在w i 类的第l 个样品,第j 个特征值。 X l j 代表w i 类的第l 个样品,第j 个特征值。 X j 代表w i 类的N i 个样品第j 个特征的平均值。 X l k 代表w i 类的第l 个样品,第k 个特征值。 X K 代表w i 类的N i 个样品第k 个特征的平均值。 w i 类的协方差矩阵为:

(3)计算出出每一类的协方差矩阵的逆矩阵S i -1 以及协方差矩阵的行列式{S i }。

(4)求出每一类的先验概率

P (w i )≈N 1 /N ,i=0,1,2,…,9

其中P (w i )为类别为数字i 的先验概率,N 1 为数字i 的样品数,N 为样品总数。

(5) 将各个数值代入判别函数

||ln 2

1)(ln )()(21)(1

i i i i T i i S P X X X X X h S -+---=-ω

(6) 判别函数最大值所对应类别就是数字的类别。 算法实现代码:

/****************************************************************** * 函数名称:BayesLeasterror() * 函数类型:int

* 函数功能:最小错误概率的Bayes 分类器 ,返回所要识别的数字的类别 ******************************************************************/ int Classification::BayesLeasterror() { double X[25];//待测样品 double Xmeans[25];//样品的均值 double S[25][25];//协方差矩阵 double S_[25][25];//S 的逆矩阵 double Pw;//先验概率 double hx[10];//判别函数 int i,j,k,n;

for(n=0;n<10;n++)//循环类别0~9 { int num=pattern[n].number;//样品个数 for(i=0;i<25;i++) Xmeans[i]=0.0; for(k=0;k

Xmeans[i]+=pattern[n].feature[k][i]>0.10?1.0:0.0;

}

for(i=0;i<25;i++)

Xmeans[i]/=(double)num; double mode[200][25];

for(i=0;i

for(j=0;j<25;j++)

mode[i][j]=pattern[n].feature[i][j]>0.10?1.0:0.0; for(i=0;i<25;i++)

for(j=0;j<25;j++)

{

double s=0.0;

for(k=0;k

s=s+(mode[k][i]-Xmeans[i])*(mode[k][j]-Xmeans[j]);

s=s/(double)(num-1);

S[i][j]=s;

}

int total=0;

for(i=0;i<10;i++)

total+=pattern[i].number;

Pw=(double)num/(double)total;

for(i=0;i<25;i++)

for(j=0;j<25;j++)

S_[i][j]=S[i][j];

double(*p)[25]=S_;

brinv(*p,25);//S的逆矩阵

double (*pp)[25]=S;

double DetS;

DetS=bsdet(*pp,25);//S的行列式

for(i=0;i<25;i++)

X[i]=testsample[i]>0.10?1.0:0.0;

for(i=0;i<25;i++)

X[i]-=Xmeans[i];

double t[25];

for(i=0;i<25;i++)

t[i]=0;

brmul(X,S_,25,t);

double t1=brmul(t,X,25);

double t2=log(Pw);

double t3=log(DetS+1);

hx[n]=-t1/2+t2-t3/2;

}

double maxval=hx[0];

int number=0; for(n=1;n<10;n++)

{ if(hx[n]>maxval) { maxval=hx[n]; number=n;

}

}

return number;

}

(7)实验效果图

基于最小错误概率的Bayes 分类实现效果如图4所示

3、 基于最小风险的Bayes 分类器实现步骤 (1) 求出每一类样品的均值。

i

i N X 1=

9,...,2,1,0,),...,,(211

==∑=i x x x X

T im i i N j ij

i

N i 代表w i 类的样品个数,n 代表特征数目。 (2) 求每一类的协方差矩阵。

n k j x x N k lk k N l lj i i

jk x x s i

,...,2,1,),)(111

(=---=∑= L 代表样品在w i 类的第l 个样品,第j 个特征值。 X l j 代表w i 类的第l 个样品,第j 个特征值。 X j 代表w i 类的N i 个样品第j 个特征的平均值。 X l k 代表w i 类的第l 个样品,第k 个特征值。 X K 代表w i 类的N i 个样品第k 个特征的平均值。 w i 类的协方差矩阵为:

(3)计算出出每一类的协方差矩阵的逆矩阵S i -1 以及协方差矩阵的行列式{S i }。

(4)求出每一类的先验概率

P (w i )≈N 1 /N ,i=0,1,2,…,9

其中P (w i )为类别为数字i 的先验概率,N 1 为数字i 的样品数,N 为样品总数。

(5)计算后验概率P[i],i=0,1, (9)

P[i]=-||ln 21)(ln )()(211

S S i i i i T P X X X X -+----ω

(6)定义损失数组为loss[10][10],设初值为

??

?≠==j

i j

i j i loss ,1,0]][[ 如图5所示,ai 代表将要判别为w i 类的决策,wi 代表自然类。这样的计算结果与基于最小错误率的Bayes 分类器相同。

图5、风险对话框

(7) 计算每一类的损失risk[i];

risk[i]=∑=9

0j loss[i][j]P[j]

如图6所示可见第8个总风险值为最小。

(8)找出最小损失所对应的类,该类即是待测样本所属的类别。

图6、基于最小风险的Bayes结果显示

算法实现代码

/****************************************************************** * 函数名称:BayesLeastRisk(double loss[10][10])

* 函数类型:double*

* 参数说明:double loss[10][10]:损失

* 函数功能:最小风险的Bayes分类器,返回各类的风险值

******************************************************************/ double* Classification::BayesLeastRisk(double loss[10][10])

{

double X[25];//待测样品

double Xmeans[25];//样品的均值

double S[25][25];//协方差矩阵S

double S_[25][25];//S的逆矩阵

double P[10];//后验概率

double Pw;//先验概率

double hx[10];//判别函数

int i,j,k,n;

for(n=0;n<10;n++)//

{

int num=pattern[n].number;//样品个数

//求样品均值

for(i=0;i<25;i++)

Xmeans[i]=0.0;

for(k=0;k

{

for(i=0;i<25;i++)

Xmeans[i]+=pattern[n].feature[k][i]>0.2?1.0:0.0;

}

for(i=0;i<25;i++)

Xmeans[i]/=(double)num;

//求协方差矩阵

double mode[200][25];

for(i=0;i

for(j=0;j<25;j++)

mode[i][j]=pattern[n].feature[i][j]>0.2?1.0:0.0;

for(i=0;i<25;i++)

for(j=0;j<25;j++)

{

double s=0.0;

for(k=0;k

s=s+(mode[k][i]-Xmeans[i])*(mode[k][j]-Xmeans[j]);

s=s/(double)(num-1);

S[i][j]=s;

}

//求先验概率

int total=0;//样品总数

for(i=0;i<10;i++)

total+=pattern[i].number;

Pw=(double)num/(double)total;

//求S的逆矩阵

for(i=0;i<25;i++)

for(j=0;j<25;j++)

S_[i][j]=S[i][j];

double(*p)[25]=S_;

brinv(*p,25);//S的逆矩阵

//求S的行列式

double (*pp)[25]=S;

double DetS;

DetS=bsdet(*pp,25);//S的行列式

//求判别函数

for(i=0;i<25;i++)

X[i]=testsample[i]>0.2?1.0:0.0;

for(i=0;i<25;i++)

X[i]-=Xmeans[i];

double t[25];

for(i=0;i<25;i++)

t[i]=0;

brmul(X,S_,25,t);

double t1=brmul(t,X,25);

double t2=log(Pw);

double t3=log(DetS+1);

P[n]=-t1/2+t2-t3/2;

}

for(n=0;n<10;n++)

{

double t=0.0;

for(i=0;i<10;i++)

t+=loss[n][i]*P[i];

hx[n]=t;

}

return (double*)hx;

}

四实验结果:

利用Bayes分类器,本文对于需要识别的400个数字图像进行了识别测试,所测试的数字图像几乎包含了各种噪声,采用基于二值数据的Bayes分类法能正确识别的数字图像有80副,采用最小错误率的Bayes分类器能正确识别的数字图像有60副,采用最小风险的Bayes分类器能正确识别的数字图像有50副,其中识别错误的图像主要集中在‘0’和‘8’以及‘1’和‘7’。

贝叶斯决策理论是图像识别中的一个基本方法,最小错误率的Bayes分类法是以错误分类最小为依据进行分类,而最小风险的Bayes分类法是以风险最小为依据进行分类的,因为在实践中,根据不同性质的错误会引起不同程度的损失考虑出发,宁肯扩大一些总的错误率,但也要使总的损失减少。从实验结果可以看出,基于二值数据的Bayes分类器的识别效果较好,因为基于二值数据的Bayes 分类器是以后验概率最大作为分类的依据,也就是具有该特征的图像是某一类的概率最大,就认为该图像应该分到哪一个类,最小错误率的Bayes分类器是以判别函数最大值所对应的类别作为待识别的数字所在的类。也就是使平均错误率最小,最小风险的Bayes分类器是以最小损失所对应的类作为待识别数字所在的类。

数字图像处理毕业论文

毕业论文声明 本人郑重声明: 1.此毕业论文是本人在指导教师指导下独立进行研究取得的成果。除了特别加以标注地方外,本文不包含他人或其它机构已经发表或撰写过的研究成果。对本文研究做出重要贡献的个人与集体均已在文中作了明确标明。本人完全意识到本声明的法律结果由本人承担。 2.本人完全了解学校、学院有关保留、使用学位论文的规定,同意学校与学院保留并向国家有关部门或机构送交此论文的复印件和电子版,允许此文被查阅和借阅。本人授权大学学院可以将此文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本文。 3.若在大学学院毕业论文审查小组复审中,发现本文有抄袭,一切后果均由本人承担,与毕业论文指导老师无关。 4.本人所呈交的毕业论文,是在指导老师的指导下独立进行研究所取得的成果。论文中凡引用他人已经发布或未发表的成果、数据、观点等,均已明确注明出处。论文中已经注明引用的内容外,不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究成果做出重要贡献的个人和集体,均已在论文中已明确的方式标明。 学位论文作者(签名): 年月

关于毕业论文使用授权的声明 本人在指导老师的指导下所完成的论文及相关的资料(包括图纸、实验记录、原始数据、实物照片、图片、录音带、设计手稿等),知识产权归属华北电力大学。本人完全了解大学有关保存,使用毕业论文的规定。同意学校保存或向国家有关部门或机构送交论文的纸质版或电子版,允许论文被查阅或借阅。本人授权大学可以将本毕业论文的全部或部分内容编入有关数据库进行检索,可以采用任何复制手段保存或编汇本毕业论文。如果发表相关成果,一定征得指导教师同意,且第一署名单位为大学。本人毕业后使用毕业论文或与该论文直接相关的学术论文或成果时,第一署名单位仍然为大学。本人完全了解大学关于收集、保存、使用学位论文的规定,同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存或汇编本学位论文;学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权大学可以将本学位论文的全部或部分内容编入学校有关数据库和收录到《中国学位论文全文数据库》进行信息服务。在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。 论文作者签名:日期: 指导教师签名:日期:

图像边缘检测毕业设计论文

摘要 随着计算机技术的飞速发展,图像边缘检测已成为图像处理的重要内容,它是图像分析的基本问题,是图像分割、特征提取和图像识别的前提。本文的主要内容如下。 首先,介绍了数字图像处理的概念及其应用领域、边缘检测研究的背景意义,历史现状,以及边缘检测的一些基本概念。 然后,分别介绍了经典的图像边缘检测算子,如Robert算子、Sobel算子、Prewitt算子等的基本原理,接着概述了几种新的边缘检测方法,如小波理论、数学形态学、模糊理论等。并通过理论分析和仿真计算比较了经典边缘检测算子各自的优缺点及适用性。 最后,通过matlab-GUI编程,设计出一个图形界面,整合了canny算子和log算子等的边缘检测,增加了整个程序的实用性。 关键词: 边缘检测;Canny算法;log算法;Robert算法; I

ABSTRACT The image edge detection has become one of the most important parts of image processing with the development of computer technology. Image edge detection is the first step of image analysis, also the basis of image segmentation, feature extraction and image recognition. The main content of this dissertation is described as follows. Firstly, digital image processing and its applications are introduced. Then, the background, the significance and also the development status of the image edge detection technique are introduced, next to this, some basic knowledge of the image edge detection are discussed. Secondly, introduced the classical edge detection operator, such as the Robert operator, Sobel operator, Prewitt operator, etc. The basic principle, then outlined several new edge detection methods, such as wavelet theory, mathematical morphology, fuzzy theories. And through theoretical analysis and simulation comparison of classical edge detection operator and the applicability of their advantages and disadvantages. Finally, use matlab-GUI programming, design a graphical interface, integrated operator log and canny edge detection operator, increasing the practicality of the whole process. Key words: edge detection; Canny algorithm; log algorithm;Robert algorithm II

仪表显示的图像识别算法研究

仪表显示的图像识别算法研究 摘要:随着社会的逐渐发展,人类的生活越来越趋于智能化。本文根据当今社会对于图像识别研究的发展现状,针对目前人们生活中人工读表的弊端,提出了通过采集仪表显示的图像并进行图像识别算法处理来达到智能自动读表的方法。 为了能快速获得采集数据,减少人们生活中繁复的人工作业。本文通过多样的图像处理来代替人眼识别图像。只需要得到采集到的图像,就可以利用计算机来进行计算和识别,得出最后的数字。本文采用了一系列的图像处理方法,包括图像的去噪,二值化分割,边缘检测和基于数学形态学的膨胀腐蚀操作等。同时通过多种尝试和比较各种方法的优缺点得到了一套简易而又完善,快速的图像识别算法。 在进行多次测试试验后,本文采用数码相机来进行图像的采集,同时经过图像预处理、图像分割、图像识别等一系列流程得出了较为完善的图像采集和识别系统,为未来信息传递智能化提供了基础,对于促进工业发展或是改善生活水平都有重要的意义。 关键词:图像预处理、二值化、边缘检测、形态学、去噪、图像分割、图像匹配 The research of image recognition displayed by the instrument Abstract: With the continuous development of society, people's lives become more and more intelligent. Based on the current development in today's society for the study of image recognition, according to the present disadvantages of manual meter reading in peop le’s lives, this page proposed the way by collecting the instruments display image and then deals it with image recognizing algorithms to achieve intelligent automatic meter. In order to quickly gather data, reducing manual work in people’s lives complicated. The page uses a series of image processing to replace human eye image recognition. Just need the collected images, we can use a computer to calculate and identify, then we will arrive at a final figure. We used a variety of image processing methods, including image denoising, thresholding segmentation, expansion of edge-detection based on mathematical morphology and corrosion and so on. And

(完整版)基于数字图像处理的车牌识别本科毕业论文

本科生毕业论文(设计) 题目: 基于数字图像处理的车牌识别设 计 姓 名: 周金鑫 学 院: 数理与信息工程学院 专 业: 电子信息工程 班 级: 111 学

号: 指导教师: 刘纯利职称: 教授 2014 年 12 月 24 日 安徽科技学院教务处制 目录 摘要 ....................................................................关键词 .................................................................. 1、设计目的 ............................................................. 2、设计原理: ............................................................ 3、设计步骤: ............................................................ 4、实行方案 ............................................................. 4.1. 总体实行方案:................................................... 4.2. 各模块的实现:................................................... 4.2.1输入待处理的原始图像: ....................................... 4.2.2图像的灰度化并绘制直方图: ...................................

车辆牌照图像识别算法研究与实现本科毕设论文

Q260046902 专业做论文 西南科技大学 毕业设计(论文)题目名称:车辆牌照图像识别算法研究与实现

车辆牌照图像识别算法研究与实现 摘要:近年来随着国民经济的蓬勃发展,国内高速公路、城市道路、停车场建设越来越多,对交通控制、安全管理的要求也日益提高。因此,汽车牌照识别技术在公共安全及交通管理中具有特别重要的实际应用意义。本文对车牌识别系统中的车牌定位、字符分割和字符识别进行了初步研究。对车牌定位,本文采用投影法对车牌进行定位;在字符分割方面,本文使用阈值规则进行字符分割;针对车牌图像中数字字符识别的问题,本文采用了基于BP神经网络的识别方法。在学习并掌握了数字图像处理和模式识别的一些基本原理后,使用VC++6.0软件利用以上原理针对车牌识别任务进行编程。实现了对车牌的定位和车牌中数字字符的识别。 关键词:车牌定位;字符分割;BP神经网络;车牌识别;VC++

Research and Realization of License Plate Recognition Algorithm Abstract:In recent years, with the vigorous development of the national economy,there are more and more construct in the domestic expressway, urban road, and parking area. The requisition on the traffic control, safety management improves day by day. Therefore, license plate recognition technology has the particularly important practical application value in the public security and the traffic control. In the paper, a preliminary research was made on the license location, characters segment and characters recognition of the license plate recognition. On the license location,the projection was used to locate the license plate; On the characters segmentation, the liminal rule was used to divide the characters; In order to solve the problem of the digital characters recognition in the plate, BP nerve network was used to recognize the digital characters. After studying and mastering some basic principles of the digital image processing and pattern recognition, the task of license plate recognition was programmed with VC++ 6.0 using above principles. The license location and the digital characters recognition in the license plate were implemented. Keywords: license location, characters segmentation, BP nerve network, license plate recognition, VC++

森林防火系统中图像识别算法的研究

哈尔滨工业大学工学硕士学位论文 摘要 森林是陆地生态的主体,具有很高的生态效益和经济效益。鉴于目前我国森林防火的严峻形势,必须开发有效技术解决森林火灾的监测问题。传统火灾探测器多采用单一时刻的火灾参量作为判断标准,在外界干扰下易引起频繁误报或漏报。近年来提出的基于机器视觉的火灾报警系统,利用数字图像处理技术来实现火灾自动报警。 基于火焰和烟雾的图像特征,本文研究了一种识别自然环境下火灾的机器视觉方法。火灾发生过程中,主要的图像信息是燃烧时产生的烟雾和火焰,通过对烟雾和火焰的图像信息研究发现,烟雾和火焰本身具有一定的规律性,以此为依据设计有针对性的算法,从图像中识别出烟雾和火焰,判断火灾是否发生。 首先,论文阐述了森林防火技术及图像型火灾检测技术的发展和现状,并对图像分割和滤波方法中的关键技术进行了详细介绍,在此基础上,本文分别讨论了火焰和烟雾的分割与识别。 然后,对于火焰分割,针对不同情况下的火焰研究了三种不同的分割技术,实现了火焰区域的准确分割。对于火焰的特征检测,主要进行颜色和动态特征的分析,通过建立火焰颜色模型进行颜色识别,再进一步进行火焰的四个动态特征的识别。对于烟雾分割,由于烟雾颜色的复杂性,采取颜色提取法进行分割,并运用视觉一致性的聚类算法对其进行了改进。对于烟雾的特征检测,主要进行小波特征及动态特征的分析,通过对比烟雾图像与背景图像小波系数进行小波特征识别,再对识别结果进一步进行动态特征识别,包括烟雾的不规则性和扩散性,最终确定视频中是否存在烟雾。 最后,综合以上分析,给出了森林防火系统中火灾的识别的整体流程以及火焰和烟雾分别的识别流程。 实验证明,综合火焰和烟雾的静态特征及动态特征的火灾识别方法,识别率高。在火灾检测技术中,具有较好的发展前景。 关键词火焰识别;烟雾识别;图像分割;动态特征 - I -

计算机视觉和图像理解毕业论文

计算机视觉和图像理解毕业论文 1.导言 在社会机器人的新兴领域,人类–机器人相互作用通过手势是一个重要的研究课题。人类进行交际的手势中,指向手势的互动与机器人特别有趣。他们开放的直观指示对象和位置的可能性,是特别有用的机器人的命令。指向手势也可结合语音识别指定的口头述和位置参数,还提供了一个明确的输入语音识别时发生歧义。这种类型的一个例子的情况是指向手势引导机器人到一个特定的对象或使用地点。机器人必须能够检测的指向手势和估计目标位置,从而指出,主要的问题出现,有关最近在这一领域的研究视野[1–4,8]。一些最重要的挑战是相关的实时计算,得到的精度和运行在困难的杂乱环境可能遮挡,光照和不同的背景。另一个共同的要求是,指向手势必须认识到,无论规模大小,大指向手势是指进行全臂延伸而小的指向手势只减少前臂和手的运动[ 3,4 ]。 基于这一事实,对于大多数应用程序,它是指目标而不是实际的指向,这是非常重要的,我们制定了一个新的方法,与现有的指向手势识别的方法,也考虑到可能指出目标位置的先验信息。假设的指示语的手势,最常见的类型例如,一个涉及食指指向对象的利益和用户的目光指向同一目标[ 5,6 ] 我们制定我们的方法使用单眼设置高精度跟踪下飞机头部旋转,同时识别手指的手势。这两种输入流被组合在一起推导出指向目标使用的配方是基于Dempster-Shafer理论的证据[7]。一种区别我们的方法来自使用相机基本的方法,多数使用立体声或多摄像机设置。然而,本文的主要容在于基于Dempster-Shafer理论输入端的组合,让该方法在一种或两种输入数据流丢失的情况下能妥善处理(例如手指向的来自遮挡了的可见光);也就是,使用的输入的信号缺乏,实现了令人印象深刻的结果,这是当代概率融合方法不可能得到的来源[1,8]。此外,本文所提出的制定的信念被分配到设置尖锐的目标而不是个人提出的目标。Dempster的组合规则有助于这些信念相结合,而不需要将他们的个人目标的分别观测指出,假如没有明确的建议。在下面的章节中对相关工作(第2节)和提出的方法(第3节)进行了论述。手指的手势识别的简要讨论在第4节而人脸姿势识别在第5节进行了阐述。人脸姿态和手指的融合,是本文的重点,在第6节进行了分析。在模拟环境下的实验结果及其使用的地面真实数据的结果在第7节。本文的结论与讨论在第8节。 2相关的工作 手势识别的研究近年来受到越来越多的关注,也超越了人类–机器人互动的区域,例如在情感计算和身临其境的游戏技术。第一次尝试解决手势解读导致的机械装置,直接测量手或手臂的关节角度和空间位置,所谓的手套设备[ 9 ]。随着计算机视觉技术及快速处理器可用性的最新研究进展,在基于视觉的非接触式接口增加了可穿戴设备,克服阻碍缓解作用的弊端。最近基于视觉的手势识别技术作了较全面的介绍[ 11 ]而且大部分的努力都集中在手势识别[12,6]以及手语翻译[ 13,14 ]。

基于bp神经网络的字符识别算法的实现毕业(设计)论文正文

一、原始依据(包括设计或论文的工作基础、研究条件、应用环境、工作目 的等。) 工作基础:了解C++的基本概念和语法,熟练使用Visual C++6.0软件。 研究条件:BP神经网络的基本原理以及图像处理的基本常识。 应用环境:基于BP神经网络的图片图像文件中的字符识别。 工作目的:掌握基于Visual C++6.0应用程序的开发。 了解人工智能的基本概念并掌握神经网络算法的基本原理。 掌握Visual C++6.0中的图片处理的基本过程。 二、参考文献 [1]人工智能原理及其应用,王万森,电子工业出版社,2007. [2]VC++深入详解,孙鑫,电子工业出版社,2006. [3]人工神经网络原理, 马锐,机械工业出版社,2010. [4]Visual C++数字图像处理典型案例详解,沈晶,机械工业出版社,2012. [5]Application of Image Processing to the Characterization of Nanostructures Manuel F. M. Costa,Reviews on Advanced Materials Science,2004. 三、设计(研究)内容和要求(包括设计或研究内容、主要指标与技术参数,并根据课题性质对学生提出具体要求。) 1、掌握C++的基本概念和语法。 2、掌握二维神经网络的基本原理。了解BP神经网络的基本概念。 3、完成Visual C++中对于图像的灰度、二值化等预处理。 4、完成基于样本的神经网络的训练以及图像中数字的识别,并对其性能进 行统计和总结,分析其中的不足。 指导教师(签字) 年月日 审题小组组长(签字) 年月日

图像处理毕业设计(论文)

河南理工大学 毕业设计(论文) 题目基于插值方法的数字图像几何变换的研究与实现 院(系、部) 计算机科学与技术学院 专业及班级软件 Java11-01 姓名 学号 311109060123 指导教师王静 日期 2015年5月15日

河南理工大学毕业设计(论文)说明书 摘要 随着数字图像技术的发展,数字图像处理广泛应用于几乎所有与图像处理有关的领域。图像的几何变换是数字图像处理中一个基本的、非常重要的变换,而图像的平移、图像的镜像变换、图像的转置、图像的缩放、图像的旋转、图像的剪取等等是几何变换中最复杂的变换。 本文中主要分析了图像的几种几何原理,首先对图像变换中用到的插值处理方法,即:最近邻法、双线性插值法和三次内插值法,进行了比较。其次详细阐述了每种算法的原理及特点;最后运用Matlab软件对图片进行仿真处理,通过分析仿真结果得出各种算法的优缺点及适用的场所。 关键词:MATLAB;图像缩放;图像旋转;图像剪取最近邻;双线性;三次内插值法 Abstract With the development of digital image technology, digital image processing is widely used in almost all image processing and related fields. Images of geometric transformation in digital image processing is a basic and very important transformation and translation of images, image transform, image transpose, image zoom, image of image rotation, clipping and so on is geometric transformation is one of the most complicated transformation. I

(完整版)图像识别毕业设计

图像识别毕业设计 篇一:毕业设计人脸识别系统的研究与实现 人脸识别系统的研究与实现 目录 第一章绪论 第一节课题背景 一课题的--------------------------------------------------- ---------------------------1 二人脸识别技术的研究意义--------------------------------------------------- ---------1 第二节人脸识别技术的国内外发展概况--------------------------------------------------- 3 一国外发展概况---------------------- --------------------------------------------------2 二国内发展概况--------------------------------------------------- ------------------------4 第二章系统的需求分析和方案选择---------------------------------------------------

------5 第一节可行性分析------------------------------------------------------------------------------5 一技术可行性分析------------------------------------------------------------------------5 二操作可行性分析------------------------------------------------------------------------5 第二节需求分析---------------------------------------------------------------------------------6 一应用程序的功能需求分析------------------------------------------------------------6 二开发环境的需求分析------------------------------------------------------------------7 三运行环境的需求分析------------------------------------------------------------------7

相关文档