文档库 最新最全的文档下载
当前位置:文档库 › 语音信号线性预测分析仿真

语音信号线性预测分析仿真

语音信号线性预测分析仿真
语音信号线性预测分析仿真

专业课设

2013年1月

语音信号线性预测分析仿真

院(系、部): 信 息 工 程 学 院 姓 名: 熊 洁

班 级: 通 092 学 号: 090935 指导教师签名: 王 嵩

摘要

作为最有效的语音分析技术之一,线性预测是一种基于全极点模型假定和均方预测误差最小准则下的波形逼近技术,通过对音频信号的时域和频域分析对声道参数进行估值,以少量低信息率的时变参数精确地描述语音波形及其频谱的性质,能够在尽量保持原音质的基础上合成出高质量的语音。

本文重点研究了线性预测(LPC)的原理、Levinson-Durbin算法,基于MATLAB进行语音线性预测仿真,并对参数的选取做了比较分析。

关键词语音信号LPC Levinson-Durbin算法MATLAB仿真

Abstract

As one of the most effective speech analysis technique, linear prediction is a kind of based on the pole model assumption and minimum mean square error criterion of wave approximation technique, based on the audio signal of time domain and frequency domain analysis of track parameters valuations, with a few low information rate of time-varying parameters accurately describe the nature of the speech waveform and spectrum, to be able to try to keep the original sound quality on the basis of the synthesis of high quality speech.

This paper mainly studies the linear prediction (LPC), Levinson - from the principle of the algorithm, based on MATLAB speech linear prediction simulation, and the selection of parameters to do a comparative analysis.

Keywords voice signal LPC Levinson - Durbin algorithm MATLAB simulation

目录

第1章绪论 (1)

1.1 语音信号LPC分析技术的基本概念 (1)

第2章线性预测编码的基本原理 (2)

2.1 语音信号的产生 (2)

2.2 线性预测的概念与原理 (2)

2.2.1 线性预测分析的概念 (2)

2.2.2 LPC和语音信号模型的关系 (4)

2.3 解线性预测参数方程组的算法 (5)

2.3.1 Levinson-Durbin自相关解法 (5)

2.3.2 利用格型法求解线性预测系数 (6)

第3章simulink仿真的分析合成系统 (10)

3.1 仿真内容 (10)

3.2 仿真系统模型 (10)

3.3 仿真工作过程 (11)

3.3.1 语音信号采样 (11)

3.3.2 预加重 (11)

3.3.3 叠接窗分析 (13)

3.3.4 汉明窗 (14)

3.3.5 自相关算法 (14)

3.3.6 数字滤波器 (16)

3.4 仿真结果分析 (18)

参考文献 (18)

第1章绪论

1.1 语音信号LPC分析技术的基本概念

语音是人们交流思想和进行社会活动的最基本手段, 我们要对语音信号进行测定并将其转变为另一种形式, 以提高我们的通信能力。

线性预测(Linear Prediction)这一术语是维纳1947年首次提出的,此后,线性预测应用于许多领域中。1967年,板仓等人最先将线性预测技术直接应用到语音分析和合成中。

线性预测作为一种工具,几乎普遍地应用于语音信号处理的各个方面。这种方法是最有效和最流行的语音分析技术之一。在各种语音分析技术中,它是第一个真正得到实际应用的技术。线性预测技术产生至今,语音处理又有许多突破,但这种技术目前仍然是唯一的最重要的分析技术基础。

在估计基本的语音参数(例如基音、共振蜂、谱、声道面积函数,以及用低速率传输或储存语音等)方面,线性预测是一种主要的技术。其重要性在于它能够极为精确地估计语音参数,用极少的参数有效而又正确地表现语音波形及其频谱的性质,而且可以用比较简单的计算和比较快的速度求得参数。

线性预测分析是最有效的语音分析技术之一,在语音编码、语音合成、语音识别和说话人识别等语音处理领域中得到了广泛的应用。语音线性预测的基本思想是:一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近。通过使实际语音抽样值与线性预测抽样值的均方误差达到最小,可以确定唯一的一组线性预测系数。

采用线性预测分析不仅能够得到语音信号的预测波形,而且能够提供一个非常好的声道模型。如果将语音模型看作激励源通过一个线性时不变系统产生的输出,那么可以利用LPC 分析对声道参数进行估值,以少量低信息率的时变参数精确地描述语音波形及其频谱的性质。此外,LPC分析还能够对共振峰、功率谱等语音参数进行精确估计,LPC分析得到的参数可以作为语音识别的重要参数之一。

第2章 线性预测的基本原理

2.1 语音的产生

为了用数字信号处理的方法对语音信号进行处理,首先要建立语音信号产生的数字模型,因此,我们必须在对人的发声器官和机理上进行研究的基础上,才能建立精确的模型。

空气由肺部排入喉部,经过声带进入声道,最后由嘴辐射出声波,这就形成了语音。在声门以左,称为“声门子系统”,它负责产生激励振动;右边是“声道系统”和“辐射系统”。当发出不同的语音,激励和声道的情况是不同的,它们对应的模型也不同。

空气经过声带时,如果声带是紧绷的,则声带将周期性地开启和闭合。声带启开时,空气流从声门喷出,形成一个脉冲,声带闭合时相应于脉冲序列的间隙期。因此,这种情况下在声门处产生一个准周期脉冲的空气流。该空气流经过声道流入声道后从嘴唇辐射出来,从而产生浊音。如果声带是完全舒展的,则空气流将不受影响的通过声门并进入声道。这时,如果声道有某部位收缩成一个狭窄的通道,则空气流到达此处时将被迫高速冲过此收缩区,并在附近形成湍流,这种空气湍流激励声道后便形成清音或摩擦音。这时,如果声道有部位完全闭合,则当空气流到达时将在此处形成空气压力,一旦闭合处突然开启便会让空气压力快速释放,激励声道后便会形成爆破音。

语音信号是一种典型的非平稳信号。但是由于语音的形成过程与发音器官的运动密切相关,这种物理运动比起声音振动速度来讲要缓慢得多,因此语音信号常常可假定为短时平稳的,即在10~20ms 这样的时间段内,其频谱特性和某些物理特征参量可以近似看做不变。这样,我们就可以采用平稳过程的分析处理方法。一般是用一个长度有限的窗序列截取语音信号进行分析,并让这个窗滑动以便分析任一时刻附近的信号。

2.2 线性预测的概念与原理

2.2.1 线性预测分析的概念

线性预测编码原理:利用过去的样值对新样值进行预测,然后将样值的实际值与其预测值相减得到一个误差信号,显然误差信号的动态范围远小于原始语音信号的动态范围,对误差信号进行量化编码,可大大减少量化所需的比特数,使编码速率降低。

线性预测分析又称LPC 分析,对()S n 分析就是用过去P 个取样值()()

(){}

1,2,

S n S n S n p ---的加

权之和来预测信号当前取样值()S n ,如果利用P 个取样值来进行预测,则称为P 阶线性预测。预测信号

()

S n ∧

为:

(2.2.1)

()()∑=-=p

i i i n s a n s

1?

,称为预测系数,由于语音信号性质变化缓慢,所以对于所分析的帧来说,预测系数是一组恒定的参数。预测误差为:

(2.2.2)

预测误差e (n )是信号s (n )通过如下系统的输出,A (z )称为LPC 误差滤波器

.

图2.2

该方程可以求出预测误差滤波器的传输函数为 将(2.2.2)改写成下列形式

现在输入信号是()n e ,输出信号是)(n s ,传输函数为

()

111∑=--=

p

i i

i z a z H

这是一个全极点滤波器,称为LPC 的语音合成模型。

系统A (z )为LPC 误差滤波器,设计预测误差滤波器就是求解预测系数,使得预测误差e(n)在某个预定的准则下最小,这个过程就是LPC 分析。

线性预测的基本问题就是由语音信号直接求出一组线性预数 ,这组预测误差滤波器就被看做语音产生模型中系统函数H (z )的参数,使得在一短段语音波形中均方预

测误差最小。将 对各个系数求偏导,并令其结果为零,即 (2.2.3)

由式(2.2.2)可知 (2.2.4)

将式(2.2.4)代入(2.2.3)可得

(2.2.5)

式(2.2.5)表明预测误差与信号的过去p 的取样值是正交的,称为正交方程。 将式(2.2.2)代入(2.2.5)得

(2.2.6)

令s (n )的自相关序列为

(2.2.7) 由于自相关序列为偶对称,因此

(2.2.8)

这表明式(2.2.8)与一般的自相关序列的定义是一样的。这样式(2.2.7)进一步表示为 p a a a 、、 21()()() )(?)(1

∑=--=-=p

i i i n s a n s n s

n s n e p

a a a 、、 21)]([2n e E 2 1 0])

()([2)]([2p k a n e n e E a n e E k

k 、、、, ==??=?? 2 1 )()

(p k k n s a n e k

、、、, =--=??

2 1 0)]()([2p k k n s n e E 、、、, ==--p

k k n s i n s a k n s n s E k n s n e E p

i i 、、、, 2 1 0)]()()()([)]()([1

==----=-∑=)]

()([)(k n s n s E k R -=)]

()([)()(k n s n s E k R k R +=-=p

k i k R a k R p

i i 、、、, 2 1 0)()(1

==--∑=()

11

i p

i i z a z A -=∑-=()()

)(1

n e i n s a n s p i i +-=∑=

(2.2.9)

上式称为标准方程式,它表明只要语音信号是已知的,则p 个预测系数 通过求解该方程即可得到。

(2.2.10)

上式矩阵形式为 或者 (2.2.11) 通过求解上式即可求得p 个线性预测系数

2.2.2 LPC 和语音信号模型的关系

如图1所示,为描述语音产生过程的离散时间信号模型。

图中,准周期性脉冲序列发生器产生浊音的激励源,浊音的基音频率由脉冲重复的周期决定;随机噪声发生器产生清音的激励源,模拟湍空气湍流;清浊音开关控制清音和浊音的产生;嘴唇的辐射特性可以用一个一阶极点数字滤波器来实现;增益控制来控制语音的强度。模型中所有参数(基音频率,随即噪声的方差,清浊音开关的位置,模型的参数)都是随着时间改变的。

声门激励、声道调制和嘴唇辐射的合成贡献,可用如下数字时变滤波器表示

上式既有极点又有零点。按其有理式的不同,有如下三种信号模型: (1)自回归滑动平均模型(ARMA 模型); (2)自回归信号模型(AR 模型); (3)滑动平均模型(MA 模型)。

一般都用AR 模型作为语音信号处理的常用模型。此时H (z )写为

???

???

????????=p p a a a A 21?

???????????----=

)0( )2(

)1( )2( )0( )1( )1( )1(

)0( R p R p R p R R R p R R R R p ?????

?

???

???=)( )2()1(p R R R R p α0=-

p p p A R R αα

p p p R R A 1-=

图2-1 语音产生的数字模型简化图

()()() 111

1

∑∑=-=---==i i

i q

l l l z

a z

b G z U z S z H )(()()()

11∑=--=

=

p

i i

i z a G z U z S z H

式中,增益G 以及数字滤波器系数都可以随时间而变化,p 为预测器阶数。当p 足够大时,上式几乎可以模拟所有语音信号的声道系统。采用简化模型的主要优点:可以用线性预测分析法对增益G 和滤波器系数进行直接而高效的计算。

在语音产生的数字模型中,语音抽样信号s (n )和激励信号之间的关系可用下列差分方程来表示:

可见,如果语音信号准确服从上式的模型,则 ,所以预测误差滤波器A (z )

是H (z )的逆滤波器,故有下式成立:

2.3 线性预测的概念与原理

2.3.1 Levinson-Durbin 自相关解法

由于语音是一种短时平稳信号,因此只能利用一段语音来估计模型参数。将长的语音序列加窗,然后对加窗语音进行LPC 分析,只要限定窗的长度就可以保证分析的短时性,这种方案称为自相关法。

根据线性预测分析的原理可知,求解p 个线性预测系数的依据,是预测误差滤波器的输出方均值或输出功率最小。称这一最小方均误差为正向预测误差功率p E ,即

(2.3.1)

由式(2.2.5)正交方程知上式第二项为0。再将式(2.2.2)代入可得

以上两式组合起来得

称为尤勒-沃尔克(Yule-Walker )方程。方程的系数矩阵为托普利兹(Toeplitz )矩阵 可见,为了解得线性预测系数,必须首先计算出自相关序列R (k ) ,为了简化计算,可根据语音信号的短时平稳特性将语音信号分帧,这样自相关序列R (k )可用下式估计

(2.3.2)

∑∑===--==p

i i p

i i p i R a R i n s n s E a n s n s E n s n e E E 1

1

)

(-(0) )]()([)]()([)]()([0

=-p p p A R R α????

???

?????????=????????????????---?????????????

???

---0 0 0 1 )0( )1( )(

)2( )1( )2( )1( )0( )1( )( )1( )0( 21 p p E a a a R p R p R p R R R p R R R p R R R ∑-=

-=n

k n s n s n k n s n s E k R )()(1

)]()([)(()()()

1n Gu i n s a n s p

i i +-=∑=)()(n Gu n e =()()

z A G z H =

)] ( ) ( [ )] ( ) ( [ ) ( ) ( ) ( )] ( [ 1

1 min

2 ∑ ∑ = = - - = ?

? ? ? ? ? ? ? ? ? ? ? - - = = p

i i

p i i p i n s n e E a n s n e E i n s a n s n e E n e E E

如果将预测误差功率Ep 理解为预测误差的能量,则上式中的系数n

1

对线性预测方程的求解没有影响,因此可以忽略。

利用对称托普利兹(Toeplitz)矩阵的性质,自相关法求解可用Levinson-Durbin (莱文逊-杜宾)递推算法求解。

该方法是目前广泛采用的一种方法。利用Levinson-Durbin 算法递推时,从最低阶预测器开始,由低阶到高阶进行逐阶递推计算。 自相关法递推过程如下

联立上面5式可对i =1、2…、p 进行递推求解,其最终解为

(2.3.3)

2.3.2 利用格型法求解线性预测系数

在Levinson-Durbin 递推算法中,如果计算出第i 阶的线性预测系数为(()i j a ,j =l ,2,…,i),利用这些系数可以计算第i 阶逆滤波器(或称为预测误差滤波器)的系统函数为

()

()1

1()1i

i i j j A z a z -==-∑ (2.3.4)

这个滤波器的输人信号是s(n),输出信号为预测误差()()i e n ,它们之间的关系为

()()1()()()

i

i i j j e n s n a s n j ==--∑ (2.3.5)

经过推导,可知第i 阶线性预测逆滤波器输出可分解为两个部分,第一部分足(i —1)阶滤波器的输出()()i e n ;第二部分是与(i —1)阶有关的输出信号(1)()i b n -,经过单位移序和i k 加权后的信号。下面讨论这两部分信号的物理意义。将这两部分信号定义为正向预测误差信号()()i e n 和反向预测误差信号()()i b n

()

()1

()()()

i

i i j j e n s n a s n j ==--∑ (2.3.6)

()

()1

()()()

i i i j j b n s n i a s n i j ==---+∑ (2.3.7)

p

i E j i r a i r k i i j i j i ≤≤?????

?

-=-∑= 1 )(-)( )

1(1-11)-(,()() 0 0r E =)1(2)1(--=i i i E k E ()11

- 1)1()(-≤≤=---i j a k a a i j i i i j i j ,() 1

p j j a a j p =≤≤, ) ( i

i i -k a =

式(2.3.6)中的()()i e n 即是通常的线性预测误差,它是用i 个过去的样本值:s(n —1)、s(n —2)、...、s(n-i)来预测s(n)时的误差;而式(2.3.7)中的()()i b n 可看成是用时间上延迟时刻的样本值s(n-i+1),s(n-i+2),…,s(n)预测s(n-i)样本的误差,所以整个误差称为反向预测误差。这个预测过程称为反向预测过程。在建立了正向预测和反向预测的概念后.就可以推出线性预测分析用的格型滤波器结构。

根据式(2.3.6)和(2.3.7),当i=0时,有

(0)(0)

()()()e n b n s n == (2.3.8)

而i=p 时

()

()()p e n e n = (2.3.9)

这里()e n 是P 价线性预测逆滤波器所输出的预测误差信号,如果改用符号()

()i f n 表示正向预测误差

()

()p e n ,则可写成如下递推形式 ()

(1)

(1)

21

()(1)(1)

(0)(0)

()()(1)()()(1)()()()()n

i i i i i i i i i i f

n f

n k b

n X X b n b n k f n f n b n s n --=--?

=---?

??=--?

?==?

??∑ (2.3.10)

)

(1n f )

(2n f 1n -)

(n

图2-2

这个滤波器输入为s(n),输出为正向预测误差

()

()p f n ,亦即预测误差e(n)。另一方面,在图2—2所示语音信号模型化的框图中,模型即合成波器的H (z )亦可采用格型结构。如果将模型中的增益因子G 考虑到输入信号中,则该滤波器输入是Gu(n),输出是合成的语音s(n)。通过线性预测分析求得的A (z )是H (z )的逆滤波器,Gu(n)则由e(n)来逼近,因此合成滤波器H(z)的结构形式应该满足输入e(n)时输出语音信号s(n)。将式(2.3.10)进行整理,可得

(1)()(1)()(1)(1)()()(1)()(1)()i i i i i i i i f n f n k b n b n b n k f n ----?=+-??

=--?? (2.3.11)

)

)(n u

图2-3

反射系数是语音处理中至关重要的参数,它的计算是一个重要问题。在自相关法和协方差法中,用预测误差最小为条件求出线性预测系数。格型法的特点之一是能够在格型的每一级进行合适的本级反射系数计算。

显然,格型法的结构与前面讨论的自相关法和协方差法的结构之间存在若干差异。格型滤波器的优点为:

①反射系数可被直接用于计算预测系数,格型滤波器的级数等于预测系数的个数。 ②格型滤波器的稳定性可由其反射系数的值来判定。可以证明,格型滤波器稳定的充要条件是:

i

k <1。

下面,我们进行格型法的求解 式(2.3.6)的Z 变换可以表示为

()()()()()i i E z A z S z = (2.3.12)

()(1)(1)

,(11

)i i i j j i i j a a k a j i ---=-≤≤-代入到(2.3.4)式,可以从

(1)

()i A z -递推求解()()i A z ,()(1)(1)1()()()i i i i i A z A z k z A z ----=-式可得

()(1)(1)1()()()()()i i i i i E z A z S z k z A z S z ----=- (2.3.13)

取(2.3.7)式的Z 变换得

()()1()()()i i i B z z A z S z --= (2.3.14)

利用(2.3.14)式球得(2.3.45)式的Z 反变换形式为

()(1)(1)()()(1)i i i i e n e n k b n --=-- (2.3.15)

同理可推得

()(1)(1)()(1)()i i i i b n b n k e n --=-- (2.3.16)

伯格(Burg )提出了一种算法,它是基于使正反向预测误差的平方和()i E ∧

为最小,()

i E ∧可以表示为

1

()

()2()20(())(())N i i i n E

e n b n ∧

-=??=+??∑ (2.3.17) 将(2.3.15)式和(2.3.16)式代入(2.3.17)式,可得

1

()

(1)(1)2(1)(1)20(()(1))((1)())N i i i i i i i n E

e n k b n b n k e n ∧-----=??=--+--??∑ (2.3.18)

()

0i i

E

k ∧?=?

(2.3.19)

可求出i k 为

1

(1)(1)

()0

1

1

2

2

(1)(1)0

2()(1)()(1)N i i i n i i N N i i n n e n b n k a e n b n ---=----==??-??=

=????+-????∑∑∑ (2.3.20)

上式说明,i k 将正向与反向预测误差联系起来了,它表示正向与反向预测误差的相关度,故称参数i k 为部分相关系数(PARCOR 系数)。i k 的取值范围为

11i k -≤≤ (2.3.21)

格型算法的步骤可以归纳如下:

(1) 确定初始值:

(0)(0)()()()e n b n s n == (2) 由(2.3.20)式可以求得

1

(0)(0)

(1)0

111

1

2

2

(0)(0)0

2()(1)()(1)N n N N n n e n b n k a e n b n -=--==??-??==

????+-????∑∑∑

(3) 由(2.3.15)式和(2.3.16)式计算正向和反向预测误差:

()(1)(1)()()(1)i i i i e n e n k b n --=--

()(1)(1)()(1)()i i i i b n b n k e n --=--

(4) 设i=2。

(5) 由(2.3.20)式求k i

1

(1)(1)()

01

1

2

2

(1)

(1)

2()(1)()(1)N i i i n i i N N i i n n e n b n k a e

n b n ---=----==??-??=

=????+-????

∑∑∑

(6) 决定()i j a ,(j=1,2,…,i-1),

()(1)(1)

,(11

)i i i j j i i j a a k a j i ---=-≤≤-

(7) 同(3)。

(8) 设i=i+1。

(9) 若i ≤p ,重复(5)(6)(7),否则(10)。 (10)结束。

由于格型算法不需要计算自相关函数,可以直接从语音取样中求得预测系数,因而避免了语音端点处具有比较大的相关函数误差的缺点。

第3章simulink仿真的分析合成系统

3.1 仿真内容

对音频信号进行分析,实现对语音采样、线性编码,使语音在传输时失真最小。

3.2仿真系统模型

通过在MATLAB 命令栏中输入dsplpc,打开语音信号线性预测分析仿真模型:

显示仿真模型如下图:

图3-1 仿真系统框图

图3-1是线性预测语音信号的分析合成系统,本仿真图由两大部分构成,分别是语音信号的分析合成部分。由上图可知对于因信号进行采样,采样频率为8KHz的语音信号“MATLAB”,首先进行预加重,提升语音信号的高频部分,提高信噪比,然后通过叠阶窗分析将语音信号的频谱图连接起来,达到淡入淡出的效果,防止语音信号在连接点的跳变,避免刺耳的噪声。

而后通过汉明窗对语音信号频谱进行截取,分析一段语音信号。进行自相关函数的计算,得到LPC方程组,通过莱文森—杜宾算法计算出预测系数。预测系数作为逆滤波系数,并将残差信号送到声道滤波器中进行滤波,合成的语音信号进行去加重,便得到与原始信号相似的语音波形。

3.3 仿真工作过程

3.3.1语音信号采样

图3-2 输入语音信号模型

双击出现如下对话框,输入一个8kHZ的语音信号“matlab”。

图3-3 输入语音信号参数设定

参数分析:采样周期为1/8000,每帧采样点为80,并分帧处理。

3.3.2预加重

图3-4 预加重模型

图3-5 预加重参数设定

参数分析:

传递函数类型:全极点,即全零点FIR数字滤波器。这类滤波器对于无限长脉冲响应最终趋于0,由于无限长脉冲响应滤波器中存在反馈电路,因此对于脉冲输入信号的响应是无限延续的。有限脉冲响应滤波器的优点:FIR有线性相位,不会导致信号的包络失真,各个频率成分传输速度同样快,同步到达输入端。而IIR滤波器则可能导致包络失真,部分频率成分传输速度快就会先到达接收端,速度慢色频率成分则会后到达接收端,在输出端叠加,造成失真。并且FIR滤波器是稳定的,在Z域转换后的所有极点都在单位圆内。

滤波器结构:直接型无反馈。分子系数:[1,0.95] 起始值:]10[0

在语音信号的A/D转换过程中,为了防止频谱混叠,通常在对模拟语音信号取样之前先进行低通滤波器,但滤波的同时也降低了高频趋于信号的能量,这对线性预测分析是相当不利的。由于高频区域能量的降低可能会影响到自相关矩阵的正确性,导致自相关矩阵病态甚至可逆,因而通常在计算LPC系数之前利用只有一个零点的滤波器对语音进行处理,预加重的目的就是增强语音的高频分辨率。使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,以便于频谱分子或声道参数分析。通俗的说,预加重就是设计滤波器,常采用的是传递函数为H(z)=1-u/z的一阶FIR高通滤波器来实现预加重。预加重系数取接近于1的值,常取0.9~1。设n时刻的语音采样信号x(n),经过预加重处理后的结果

为y(n)=x(n)-ux(n-1),这里取u=0.98。

3.3.3叠阶窗分析

图3-6 叠接窗模型

如图3-1所示,通过预加重处理后,接下来进行加窗分帧处理。语音信号是一种随时间变化的信号,主要分为浊音和清音两大类。浊音的基音周期、清音周期信号幅度和声道参数等都随时间而缓慢变化。由于发声器官的惯性运动,可以认为在一小段时间里(一般为10~30ms)语音信号近似不变,即语音信号具有短时平稳性。这样,可以把语音信号分为一些短帧(称为分析帧)逐帧进行处理。正是因为逐帧分析,所以在帧与帧之间,即波形相接的地方不够平滑,在听觉上会有严重的失真,所以我们要建立淡入淡出的概念,通过交叠分段的方法,使帧和帧之间平滑过渡,使其保持连续性。语音信号的分帧是采用可移动的有限长度窗口进行加权的方法实现的。一般每秒33~100帧,视情况而定。前一帧和后一帧的交叠部分称为帧移,帧移与帧长的比值一般取为0~1/2。

双击该图标将出现图3-7:

图3-7 叠接窗参数设定

参数分析:由上图可知,帧长:160bit; 帧移动:80bit;帧移与帧长的比值为1/2,即一帧160个样点,缓冲80个样点。

3.3.4汉明窗

图3-8 汉明窗模型

如图3-8所示,语音信号的分帧是采用可移动的有限长度窗口进行加权的方法来实现的。常用的窗有两种,一种是矩形窗,一种是汉明窗,在这里我们用的是汉明窗。

下图是汉明窗的参数设定:

图3-9 汉明窗参数设定

参数分析:由图可知采用汉明窗口输入,采用对称采样。

3.3.5自相关算法

图3-10 自相关和莱文森-杜宾算法模型

由前面的讨论可知,清音和浊音的发生机理不同,因此在波形上也存在着较大差异。浊音的时间波形呈现出一定的周期性,波形之间相似性较好;清音的时间波形呈现出随机噪声的特性,杂乱无章,样点间的相似性较差。这样,可以用自相关函数测定语音的相似特性,之后运用莱文森-杜宾算法进行快速简便的运算,计算出预测系数。

在这个过程中即可用前n-1个值来预测第n个值,用来取消冗余,实际与现实有误差,来计算误差。计算得出的值作为预测系数进行傅里叶等计算得到LPC的频谱。而通过莱文森算法得出的预测系数作为滤波器系数,使预测语音信号和原始信号进行相减滤波得出残差,这里即为预测系数。

图3-11为LPC频谱。如图3-12为通过格形算法算出的反射系数样点波形图。

图3-11 LPC频谱图

图3-12 反射系数样点波形

图3-11为莱文森-杜宾算法计算得出的预测系数经添零后作傅里叶变换,再求其倒数得到的LPC频谱,图3-12为格形算法计算得出的反射系数样点波形图。通过杜宾算法算出的预测系数与通过格形算法算出的预测系数其实没有本质的区别,只是相比较而言,格形算法较为

简洁,更易于保证语音合成器的稳定性。此外,格形结构对于算法中的有限字长带来的误差比较不敏感,因此特别适宜于只能采取定点的硬件系统来实现,基于以上原因,大部分用语音合成器的系统都采用格形结构。

通过图3-11也可以清晰地看到第一共振峰,第二共振峰以及第三共振峰。在语音科学及语音学中,共振峰描述的是人类声道中的共振情形。常用的测量方法是由频谱分析或声谱图中,寻找频谱中的峰值。但假如如说话者,用比较高的基频发出元音,例如小孩或女性的声音,则频谱上看起来比较像是宽带状,比较无法看出明显的峰值。

3.3.6数字滤波器

从仿真框图中可以看到,分析滤波器有两个输入端,经格形运算后的预测系数作为分析滤波器的系数,并对预加重后的原始语音信号滤波,输出残渣。这个过程其实就是取新样本的实际数值,和预测值进行比较,得到差值后,仅把预测值与现实样值之差(预测误差)进行传输。接下来在接收端通过一个合成滤波器,将经格形算法得出的预测系数作为合成滤波器的预测系数,对残差进行滤波,得到新的语音信号,最后经加重滤波器,便可恢复与原信号近似的波形。

图3-13为分析滤波器的参数设定图。

图3-13 分析滤波器参数设定

由图3-13可知,分析滤波器采用FIR数字滤波器。

由图3-14可知,合成滤波器采用的是IIR型数字滤波器。

图3-15 零时刻残差时域波形图

应用matlab对语音信号进行频谱分析及滤波.

数字信号处理 —综合实验报告 综合实验名称:应用MatLab对语音信号进行 频谱分析及滤波 系: 学生姓名: 班级: 学号: 成绩: 指导教师: 开课时间学年学期

目录 一.综合实验题目 (1) 二、综合实验目的和意义 (1) 2.1 综合实验目的 (1) 2.2 综合实验的意义 (1) 三.综合实验的主要内容和要求 (1) 3.2 综合实验的要求: (2) 四.实验的原理 (2) 4.1 数字滤波器的概念 (2) 4.2 数字滤波器的分类 (2) (1)根据单位冲激响应h(n)的时间特性分类 (2) 五.实验的步骤 (3) 下面对各步骤加以具体说明。 5.1语音信号的采集 (3) 5.2 语音信号的频谱分析; (3) 5.3 设计数字滤波器和画出其频率响应 (5) 5.3.1设计数字滤波器的性能指标: (5) 5.3.2 用Matlab设计数字滤波器 (6) 5.6 设计系统界面 (19) 六、心得体会 (20) 参考文献: (21)

一.综合实验题目 应用MatLab对语音信号进行频谱分析及滤波 二、综合实验目的和意义 2.1 综合实验目的 为了巩固所学的数字信号处理理论知识,使学生对信号的采集、处理、传输、显示和存储等有一个系统的掌握和理解,再者,加强学生对Matlab软件在信号分析和处理的运用 综合运用数字信号处理的理论知识进行频谱分析和滤波器设计,通过理论推导得出相应结论,再利用 MATLAB 作为编程工具进行计算机实现,从而加深对所学知识的理解,建立概念。 2.2 综合实验的意义 语言是我们人类所特有的功能,它是传承和记载人类几千年文明史,没有语言就没有我们今天人类的文明。语音是语言最基本的表现形式,是相互传递信息最重要的手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。 语音信号处理属于信息科学的一个重要分支,大规模集成技术的高度发展和计算机技术的飞速前进,推动了这一技术的发展;它是研究用数字信号处理技术对语音信号进行处理的一门新兴学科,同时又是综合性的多学科领域和涉及面很广的交叉学科,因此我们进行语言信号处理具有时代的意义。 三.综合实验的主要内容和要求 3.1综合实验的主要内容: 录制一段个人自己的语音信号,并对录制的信号进行采样;画出采样后语音信号的时域波形和频谱图;给定滤波器的性能指标,采用窗函数法和双线性变换设计滤波器,并画出滤波器的频率响应;然后用自己设计的滤波器对采集的信号进行滤波,画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比,分析信号的变化;回放语音信号;综合实验应完成的工作: (1)语音信号的采集; (2)语音信号的频谱分析;

数字信号处理 语音信号分析与处理及其MATLAB实现..

摘要 (2) 1 设计目的与要求 (3) 2 设计步骤 (4) 3 设计原理及内容 (5) 3.1 理论依据 (5) 3.2 信号采集 (6) 3.3 构造受干扰信号并对其FFT频谱分析 (8) 3.4 数字滤波器设计 (9) 3.5 信号处理 (10) 总结 (12) 致谢 (13) 参考文献 (14)

用MATLAB对语音信号进行分析与处理,采集语音信号后,在MATLAB软件平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器滤除噪声,恢复原信号。 数字滤波器是数字信号处理的基础,用来对信号进行过滤、检测和参数估计等处理。IIR数字滤波器最大的优点是给定一组指标时,它的阶数要比相同组的FIR滤波器的低的多。信号处理中和频谱分析最为密切的理论基础是傅立叶变换(FT)。离散傅立叶变换(DFT)和数字滤波是数字信号处理的最基本内容。 关键词:MATLAB;语音信号;加入噪声;滤波器;滤波

1. 设计目的与要求 (1)待处理的语音信号是一个在20Hz~20kHz频段的低频信号 (2)要求MATLAB对语音信号进行分析和处理,采集语音信号后,在MATLAB平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器进行滤除噪声,恢复原信号。

2. 设计步骤 (1)选择一个语音信号或者自己录制一段语音文件作为分析对象; (2)对语音信号进行采样,并对语音信号进行FFT频谱分析,画出信号的时域波形图和频谱图; (3)利用MATLAB自带的随机函数产生噪声加入到语音信号中,对语音信号进行回放,对其进行FFT频谱分析; (4)设计合适滤波器,对带有噪声的语音信号进行滤波,画出滤波前后的时域波形图和频谱图,比较加噪前后的语音信号,分析发生的变化; (5)对语音信号进行回放,感觉声音变化。

基于Matlab的语音信号处理与分析

系(院)物理与电子工程学院专业电子信息工程题目语音信号的处理与分析 学生姓名 指导教师 班级 学号 完成日期:2013 年5 月 目录 1 绪论.............................................................................................................. 错误!未定义书签。 1.1课题背景及意义................................................................................. 错误!未定义书签。 1.2国内外研究现状................................................................................. 错误!未定义书签。 1.3本课题的研究内容和方法................................................................. 错误!未定义书签。 1.3.1 研究内容................................................................................ 错误!未定义书签。 1.3.2 开发环境................................................................................ 错误!未定义书签。 2 语音信号处理的总体方案............................................................................ 错误!未定义书签。 2.1 系统基本概述.................................................................................... 错误!未定义书签。 2.2 系统基本要求与目的........................................................................ 错误!未定义书签。 2.3 系统框架及实现................................................................................ 错误!未定义书签。 2.3.1 语音信号的采样.................................................................... 错误!未定义书签。 2.3.2 语音信号的频谱分析............................................................ 错误!未定义书签。 2.3.3 音乐信号的抽取.................................................................... 错误!未定义书签。 2.3.4 音乐信号的AM调制.............................................................. 错误!未定义书签。 2.3.5 AM调制音乐信号的同步解调............................................... 错误!未定义书签。 2.4系统设计流程图................................................................................. 错误!未定义书签。 3 语音信号处理基本知识................................................................................ 错误!未定义书签。 3.1语音的录入与打开............................................................................. 错误!未定义书签。 3.2采样位数和采样频率......................................................................... 错误!未定义书签。 3.3时域信号的FFT分析......................................................................... 错误!未定义书签。 3.4切比雪夫滤波器................................................................................. 错误!未定义书签。 3.5数字滤波器设计原理......................................................................... 错误!未定义书签。 4 语音信号实例处理设计................................................................................ 错误!未定义书签。 4.1语音信号的采集................................................................................. 错误!未定义书签。

含噪声的语音信号分析与处理设计

课程设计任务书 学生姓名:苗强强专业班级:电信1204 指导教师:阙大顺沈维聪工作单位:信息工程学院 题目: 程控宽带放大器的设计 初始条件: 程控宽带放大器是电子电路中常用模块,在智能仪器设备及嵌入式系统中有广 泛的应用。因此对于电子信息专业的技术人员来说,熟练掌握该项技术很有必要。 要求完成的主要任务:(包括课程设计工作量及其技术要求,以及说明书撰写等具体 要求) (1)输入阻抗>1KΩ,单端输入,单端输出,放大器负载电阻为600Ω; (2)3dB通频带10kHz~6MHz,在20kHz~5MHz频带内增益起伏<1dB。 (3)增益调节范围10 dB~40 dB,(通过键盘操作调节)。 (4)发挥部分:当输入频率或输出负载发生变化时,通过微处理器自动调节,保持 放大器增益不变。 (5)电路通过仿真即可。 时间安排: 1. 任务书下达,查阅资料 1天 2. 制图规范、设计说明书讲解 2天 3. 设计计算说明书的书写 5天 4. 绘制图纸 1天 5. 答辩 1天 指导教师签名:年月日 系主任(或责任教师)签名:年月日

滤波器设计在数字信号处理中占有极其重要的地位,FIR数字滤波器和IIR滤波器是滤波器设计的重要组成部分。利用MATLAB信号处理工具箱可以快速有效地设计各种数字滤波器。课题基于MATLAB有噪音语音信号处理的设计与实现,综合运用数字信号处理的理论知识对加噪声语音信号进行时域、频域分析和滤波。通过理论推导得出相应结论,再利用MATLAB 作为编程工具进行计算机实现。在设计实现的过程中,使用窗函数法来设计FIR数字滤波器,用巴特沃斯、切比雪夫和双线性变法设计IIR数字滤波器,并利用MATLAB 作为辅助工具完成设计中的计算与图形的绘制。通过对对所设计滤波器的仿真和频率特性分析,可知利用MATLAB信号处理工具箱可以有效快捷地设计FIR和IIR数字滤波器,过程简单方便,结果的各项性能指标均达到指定要求。 关键词数字滤波器 MATLAB IIR滤波器 FIR滤波器

语音信号特征的提取

语音信号特征的提取 摘要 随着计算机技术的发展,语音交互已经成为人机交互的必要手段,语音特征参数的精确度直接影响着语音合成的音质和语音识别的准确率。因此语音信号参数提取是语音信号处理研究中一项非常有意义的工作。 本文采用Matlab软件提取语音信号特征参数,首先对语音信号进行数字化处理,其次,进行预处理,包括预加重、加窗和分帧,本文讨论了预处理中各种参数的选择,以使信号特征提取更加准确。第三,讨论了各种时域特征参数的算法,包括短时能量、短时过零率等。 关键词:语音信号, 特征参数, 提取, Matlab 目录 第一章绪论 1.1语音信号特征提取概况 1.1.1研究意义 语音处理技术广泛应用于语音通信系统、声控电话交换、数据查询、计算机控制、工业控制等领域,带有语音功能的计算机也将很快成为大众化产品,语音将可能取代键盘和鼠标成为计算机的主要输入手段,为用户界面带来一次飞跃。 语音信号特征的提取是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信和准确的语音识别,才能建立语音合成的语音库。因此语音信号参数提取是语音信号处理研究中一项非常有意义的工作。 1.1.2 发展现状 语音信号处理是一门综合性的学科,包括计算机科学、语音学、语言学、声学和数学等诸多领域的内容。它的发展过程中,有过两次飞跃。第一次飞跃是1907年电子管的发明和1920年无线电广播的出现,电子管放大器使很微弱的声

音也可以放大和定量测量,从而使电声学和语言声学的一些研究成果扩展到通信和广播部门;第二次飞跃是在20世纪70年代初,电子计算机和数字信号处理的发展使声音信号特别是语音信号,可以通过模数转换器(A/D)采样和量化转换为数字信号,这样就可以用数字计算方法对语音信号进行处理和加工,提高了语音信号处理的准确性和高效性。 语音信号处理在现代信息科学中的地位举足轻重,但它仍有些基础的理论问题和技术问题有待解决,这些难题如听觉器官的物理模型和数学表示及语音增强的技术理论等,目前还有待发展。 1.2 本课题研究内容 本文主要介绍语音信号处理的理论及Matlab的相关内容,然后从Matlab仿真角度验证了录音、预处理、提取语音信号时域特征参数,主要讨论了预处理中各种参数的选择,以使信号特征提取更加准确。再次讨论了各种时域特征参数的算法,包括短时能量、短时过零率等,介绍了各环节的不同软件实现方法。最后对基于Matlab的语音信号特征参数提取进行总结。 第二章Matlab简介 MATLAB是国际上仿真领域最权威、最实用的计算机工具。它是MathWork 公司于1984年推出,它以强大的科学计算与可视化功能、简单易用、开放式可扩展环境,特别是所附带的30多种面向不同领域的工具箱支持,使得它在许多科学领域中成为计算机辅助设计和分析、算法研究和应用开发的基本工具和首选平台。 2.1 发展概况 Matlab是Matrix Laboratory(矩阵实验室的缩写),最初由美国Cleve Moler 博士在70年代末讲授矩阵理论和数据分析等课程时编写的软件包Linpack与Eispack组成,旨在使应用人员免去大量经常重复的矩阵运算和基本数学运算等繁琐的编程工作。1984年成立的Math Works公司正式把Matlab推向市场,并从事Matlab的研究和开发。1990年,该公司推出了以框图为基础的控制系统仿真工具Simulink,它方便了系统的研究与开发,使控制工程师可以直接构造系统框图进行仿真,并提供了控制系统中常用的各种环节的模块库。1993年,Math Works 公司推出的Matlab4.0版在原来的基础上又作了较大改进,并推出了Windows版,

数字语音信号处理实验报告

语音信号处理实验报告 专业班级电子信息1203 学生姓名钟英爽 指导教师覃爱娜 完成日期2015年4月28日 电子信息工程系 信息科学与工程学院

实验一语音波形文件的分析和读取 一、实验学时:2 学时 二、实验的任务、性质与目的: 本实验是选修《语音信号处理》课的电子信息类专业学生的基础实验。通过实验 (1)掌握语音信号的基本特性理论:随机性,时变特性,短时平稳性,相关性等; (2)掌握语音信号的录入方式和*.WAV音波文件的存储结构; (3)使学生初步掌握语音信号处理的一般实验方法。 三、实验原理和步骤: WAV 文件格式简介 WAV 文件是多媒体中使用了声波文件的格式之一,它是以RIFF格式为标准。每个WAV 文件的头四个字节就是“RIFF”。WAV 文件由文件头和数据体两大部分组成,其中文件头又分为RIFF/WAV 文件标识段和声音数据格式说明段两部分。常见的WAV 声音文件有两种,分别对应于单声道(11.025KHz 采样率、8Bit 的采样值)和双声道(44.1KHz 采样率、16Bit 的采样值)。采样率是指声音信号在“模拟→数字”转换过程中,单位时间内采样的次数;采样值是指每一次采样周期内声音模拟信号的积分值。对于单声道声音文件,采样数据为8 位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16 位的整数(int),高八位和低八位分别代表左右两个声道。WAV 文件数据块包含以脉冲编码调制(PCM)格式表示的样本。在单声道WAV 文件中,道0 代表左声道,声道1 代表右声道;在多声道WAV 文件中,样本是交替出现的。WAV 文件的格式 表1 wav文件格式说明表

语音信号的频域分析

实验二:语音信号的频域分析 实验目的:以MATLAB 为工具,研究语音信号的频域特性,以及这些特性在《语音信号处理》中的应用情况。 实验要求:利用所给语音数据,分析语音的频谱、语谱图、基音频率、共振峰等频域参数。要求会求取这些参数,并举例说明这些参数在语音信号处理中的应用。 实验内容: 1、 语音信号的频谱分析 1.1加载“ma1_1”语音数据。基于DFT 变换,画出其中一帧数据(采样频率为8kHz ,帧长为37.5ms ,每帧有300个样点)的频域波形(对数幅度谱)。 load ma1_1; x = ma1_1 (4161:4460); plot (x) N = 1024; k = - N/2:N/2-1; X = fftshift (fft (x.*hann (length (x)),N)); plot (k,20*log10 (abs(X))), axis ([0 fix(N/2) -inf inf ]) 已知该帧信号的时域波形如图(a )所示,相应的10阶LPC 谱如图(b )所示。 问题1:这帧语音是清音还是浊音?基于DFT 求出的对数幅度谱和相应的LPC 谱相比,两者有什么联系和区别? 问题2:根据这帧基于DFT 的对数幅度谱,如何估计出共振峰频率和基音周期? 问题3:时域对语音信号进行加窗,反映在频域,其窗谱对基于DFT 的对数幅度谱有何影响?如何估计出窗谱的主瓣宽度? 1.2对于浊音语音,可以利用其频谱)(ωX 具有丰富的谐波分量的特点,求出其谐波乘积谱: ∏ ==R r r X HPSx 1)()(ωω 式中,R 一般取为5。在谐波乘积谱中,基频分量变得很大,更易于估计基音周期。

数字信号处理期末实验 语音信号分析与处理

山东建筑大学信电学院课程设计说明书 语音信号分析与处理 摘要 用MATLAB对语音信号进行分析与处理,采集语音信号后,在MATLAB软件平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器滤除噪声,恢复原信号。 数字滤波器是数字信号处理的基础,用来对信号进行过滤、检测和参数估计等处理。IIR数字滤波器最大的优点是给定一组指标时,它的阶数要比相同组的FIR 滤波器的低的多。信号处理中和频谱分析最为密切的理论基础是傅立叶变换(FT)。离散傅立叶变换(DFT)和数字滤波是数字信号处理的最基本内容。 关键词:MATLAB;语音信号;加入噪声;滤波器;滤波 1. 设计目的与要求 (1)待处理的语音信号是一个在20Hz~20kHz频段的低频信号。 (2)要求MATLAB对语音信号进行分析和处理,采集语音信号后,在MATLAB平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器进行滤除噪声,恢复原信号。 1 山东建筑大学信电学院课程设计说明书

2. 设计步骤 (1)选择一个语音信号或者自己录制一段语音文件作为分析对象; (2)对语音信号进行采样,并对语音信号进行FFT频谱分析,画出信号的时域波形图和频谱图; (3)利用MATLAB自带的随机函数产生噪声加入到语音信号中,对语音信号进行回放,对其进行FFT频谱分析; (4)设计合适滤波器,对带有噪声的语音信号进行滤波,画出滤波前后的时域波形图和频谱图,比较加噪前后的语音信号,分析发生的变化; (5)对语音信号进行回放,感觉声音变化。 3. 设计原理及内容 3.1 理论依据 (1)采样频率:采样频率(也称采样速度或者采样率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率只能用 于周期性采样的采样器,对于非周期采样的采样器没有规则限制。通俗的讲,采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位之间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。(2)采样位数:即采样值或取样值,用来衡量声音波动变化的参数。 (3)采样定理:在进行模拟/数字信号的的转换过程中,当采样频率f大于信s.max 号中,最高频率f的2倍时,即:f>=2f,则采样之后的数字信号完整的maxmaxs.max 保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的 5~10倍;采样频率又称乃奎斯特定理。 (4)时域信号的FFT分析:信号的频谱分析就是计算信号的傅立叶变换。连续信号与系统的傅立叶分析显然不便于直接用计算机进行计算,使其应用受到限制。而FFT是一种时域和频域均离散化的变换,适合数值计算,成为用计算机分析 离2 山东建筑大学信电学院课程设计说明书 散信号和系统的的有力工具。对连续信号和系统,可以通过时域采样,应用DFT 进行近似谱分析。

语音信号处理答案

二、问答题(每题分,共分) 、语音信号处理主要研究哪几方面的内容? 语音信号处理是研究用数字信号处理技术对语言信号进行处理的一门学科,语音信号处理的理论和研究包括紧密结合的两个方面:一方面,从语言的产生和感知来对其进行研究,这一研究与语言、语言学、认知科学、心理、生理等学科密不可分;另一方面,是将语音作为一 种信号来进行处理,包括传统的数字信号处理技术以及一些新的应用于语音信号的处理方法 和技术。 、语音识别的研究目标和计算机自动语音识别的任务是什么? 语音识别技术,也被称为自动语音识别,(),其目标是将人类的语音中的词汇内容转换为 计算机可读的输入,例如按键、二进制编码或者字符序列。 计算机自动语音识别的任务就是让机器通过识别和理解过程把语音信号转变为相应的文本 或命令的高技术。 、语音合成模型关键技术有哪些? 语音合成是实现人机语音通信,建立一个有听和讲能力的口语系统所需的两项关键技术,该系统主要由三部分组成:文本分析模块、韵律生成模块和声学模块。.如何取样以精确地抽取人类发信的主要特征,.寻求什么样的网络特征以综合声道的频率响应,.输出合成声音的质量如何保证。 、语音压缩技术有哪些国际标准? 二、名词解释(每题分,共分) 端点检测:就从包含语音的一段信号中,准确的确定语音的起始点和终止点,区分语音信号和非语音信号。 共振峰:当准周期脉冲激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。 语谱图:是一种三维频谱,它是表示语音频谱随时间变化的图形,其纵轴为频率,横轴为时间,任一给定的频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。 码本设计:就是从大量信号样本中训练出好的码本,从实际效果出发寻找好的失真测度定义 公示,用最少的搜素和计算失真的运算量。 语音增强:语音质量的改善和提高,目的去掉语音信号中的噪声和干扰,改善它的质量 三、简答题(每题分,共分) 、简述如何利用听觉掩蔽效应。 一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。人耳的掩蔽效应一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声 音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。被掩蔽音单独存在时的听阈分贝值,或者 说在安静环境中能被人耳听到的纯音的最小值称为绝对闻阈。实验表明,—绝对闻阈值最小,即人耳对它的微弱声音最敏感;而在低频和高频区绝对闻阈值要大得多。在范围内闻阈随频率变化最不显著,即在这个范围内语言可储度最高。在掩蔽情况下,提高被掩蔽弱音的强度, 使人耳能够听见时的闻阈称为掩蔽闻阈(或称掩蔽门限),被掩蔽弱音必须提高的分贝值称为 掩蔽量(或称阈移)。 、简述时间窗长与频率分辨率的关系。 采样周期、窗口长度和频率分辨率△之间存在下列关系:△(*) 可见,采样周期一定时,△随窗口宽度的增加而减少,即频率分辨率相应得到提高,但同时时间分辨率降低;如果窗口取短,频率分辨率下降,而时间分辨率提高,因而二者是矛盾的。 、简述时域分析的技术(最少三项)及其在基因检测中的应用。()

数字信号处理在语音信号分析中的应用

《数字信号处理》 课程设计报告 数字信号处理在语音信号分析中的应用 专业班级: 姓名: 学号:

目录 摘要 (3) 1、绪论 (3) 2、课程设计的具体内容 (4) 2.1.1、读取语音信号的任务 (4) 2.1.2、任务分析和解决方案 (5) 2.1.4、运行结果和相应的分析 (5) 2.2、IIR滤波器设计和滤波处理 (6) 2.2.1、设计任务 (6) 2.2.2、任务分析和解决方案 (7) 2.2.3、编程得到的MATLAB代码 (7) 2.2.4、运行结果和相应的分析 (7) 2.3、FIR滤波器设计和滤波处理 (9) 2.3.1、设计任务 (9) 2.3.2、任务分析和解决方案 (9) 2.3.3、编程得到的MATLAB代码 (9) 2.3.4、运行结果和相应的分析 (11) 3、总结 (13) 4、存在的不足及建议 (13) 5、参考文献 (13)

数字信号处理设计任务书 摘要 语音信号滤波处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前 发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。信号处理是Matlab重要应用的领域之一。本设计通过录制一段语音,对其进行了时域分析,频谱分析,分析语音信号的特性。并应用matlab平台对语音信号进行加噪然后再除去噪声,进一步设计两种种滤波器即高通滤波器、带通滤波器,基于这两种滤波器设计原理,对含加噪的语音信号进行滤波处理。最后对比滤波前后的语音信号的时域和频域特性,回放含噪语音信号和去噪语音信号。论文从理论和实践上比较了不同数字滤波器的滤波效果。 1.绪论 通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。语言是人类持有的功能,声音是人类常用的工具,是相互传递信息的最主要的手段。因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。 随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输人这样便于使用的、自然的、人性化的输人方式。作为高科鼓应用领域的研究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长足的进步。它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理.工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面。可见,语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作。我们今天进行这一领域的研究与开拓就是要让语音信号处理技术走人人们的日常生活当中,并不断朝更高目标而努力。数字滤波器是数字信号处理的基础,用来对

语音信号线性预测分析

《视频语音处理技术》语音信号线性预测分析 学院名称:计算机与信息工程学院 专业名称:计算机科学与技术 年级班级: 姓名: 学号:

计算机与信息技术学院综合性、设计性实验报告 一、实验目的: 综合采用各种线性预测分析的方法,能够达到预测更为准确。要求掌握各种下列语音信号线性预测分析技术,提高学生数字语音信号处理的能力。利用MATLAB 编程环境和强大的处理功能,实现语音信号线性预测。主要训练如下的项目从而获得线性预测的综合能力: 1、LPC 方程的自相关解法。 2、LPC 参数到LSP 参数的转换。 3、LSP 参数到LPC 参数的转换。 4、LPC 参数到ISP 参数的转换。 二、实验仪器或设备:w indowsXP 下的Matlab 编程环境 三、总体设计(设计原理、设计方案及流程等) 线性预测编码原理:利用过去的样值对新样值进行预测,然后将样值的实际值与其 预测值相减得到一个误差信号,显然误差信号的动态范围远小于原始语音信号的动态范围,对误差信号进行量化编码,可大大减少量化所需的比特数,使编码速率降低。 1.LPC 方程的自相关解法 利用对称托普利兹(Toeplitz)矩阵的性质,自相关法求解可用Levinson-Durbin (莱文逊-杜宾)递推算法求解。该方法是目前广泛采用的一种方法。利用Levinson-Durbin 算法递推时,从最低阶预测器开始,由低阶到高阶进行逐阶递推计算。 自相关法递推过程如下: p i E j i r a i r k i i j i j i ≤≤?? ? ?? ? -=-∑= 1 )(-)( )1(1 -11) -(,()() 0 0r E =) 1(2)1(--=i i i E k E

语音信号的噪声分析及滤波的过程研究

电网络理论 课程设计与报告 题目:语音信号的噪声分析及滤波的过程研究

一、语音信号的噪声分析及滤除一般过程 选择一个语音信号作为分析的对象,或录制一段格式为 *.wav各人自己的语音信号,对其进行频谱分析;利用MATLAB中的随机函数产生噪声加入到语音信号中,模仿语音信号被污染,并对其进行频谱分析;设计数字滤波器,并对被噪声污染的语音信号进行滤波,分析滤波后信号的时域和频域特征,回放语音信号。其流程图如下所示: 二、音频信号、噪声的分析 (一)、音频信号分析 音频信号的频率范围在20Hz-20000Hz,是人耳可以听到的频率范围,超过这个范围的音频信号没有意义。语音的频率范围在30-1000Hz之间。 (二)、噪声的产生 噪声的来源一般有环境设备噪声和电气噪声。环境噪声一般指在录音时外界环境中的声音,设备噪声指麦克风、声卡等硬件产生的噪声,电气噪声有直流电中包含的交流声,三极管和集成电路中的无规则电子运动产生的噪声,滤波不良产生的噪声等。这些噪声虽然音量不大(因为在设备设计中已经尽可能减少噪声),但参杂在我们的语音中却感到很不悦耳,尤其中在我们语音的间断时间中,噪声更为明显。

三、A/D转换 A/D转换可分为4个阶段:即采样、保持、量化和编码。 采样就是将一个时间上连续变化的信号转换成时间上离散的信号,根据奈奎斯特采样定理fsZZfh,如果采样信号频率大于或等于2倍的最高频率成分,则可以从采样后的信号无失真地重建恢复原始信号。考虑到模数转换器件的非线性失真、量化噪声及接收机噪声等因素的影响,采样频率一般取2.5~3倍的最高频率成分。 要把一个采样信号准确地数字化,就需要将采样所得的瞬时模拟信号保持一段时间,这就是保持过程。保持是将时间离散、数值连续的信号变成时间连续、数值离散信号,虽然逻辑上保持器是一个独立的单元,但是,实际上保持器总是与采样器做在一起,两者合称采样保持器。图给出了A/D采样电路的采样时序图,采样输出的信号在保持期间即可进行量化和编码。 量化是将时间连续、数值离散的信号转换成时间离散、幅度离散的信号;编码是将量化后的信号编码成二进制代码输出。到此,也就完成了A/D转换,这些过程通常是合并进行的。例如,采样和保持就经常利用一个电路连续完成,量化和编码也是在保持过程中实现的。 四、通用串行总线 (一)、USB总线的分析 USB标准采用NRZI方式(翻转不归零制)对数据进行编码。翻转不归零制(non-return to zero,inverted),电平保持时传送逻辑1,电平翻转时传送逻辑0。USB 接头提供一组5伏特的电压,可作为相连接USB设备的电源。实际上,设备接收到的电源可能会低于5V,只略高于4V。USB规范要求在任何情形下,电压均不能超过5.25V;在最坏情形下(经由USB供电HUB所连接的LOW POWER 设备)电压均不能低于4.375V,一般情形电压会接近5V。

语音信号的时域特征分析

中北大学 课程设计说明书 学生姓名:蒋宝哲学号: 24 学生姓名:瓮泽勇学号: 42 学生姓名:侯战祎学号: 47 学院:信息商务学院 专业:电子信息工程 题目:信息处理实践:语音信号的时域特征分析指导教师:徐美芳职称: 讲师 2013 年 6 月 28 日

中北大学 课程设计任务书 2012-2013 学年第二学期 学院:信息商务学院 专业:电子信息工程 学生姓名:蒋宝哲学号: 24 学生姓名:瓮泽勇学号: 42 学生姓名:侯战祎学号: 47 课程设计题目:信息处理实践:语音信号的时域特征分析起迄日期: 2013年6 月7日~2013年6月 28 日 课程设计地点:学院楼201实验室、510实验室、608实验室指导教师:徐美芳 系主任:王浩全 下达任务书日期: 2013 年 6 月 7 日

语音信号的采集与分析 摘要 语音信号的采集与分析技术是一门涉及面很广的交叉科学,它的应用和发展与语音学、声音测量学、电子测量技术以及数字信号处理等学科紧密联系。其中语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的高。本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法,并通过PC机录制自己的一段声音,运用Matlab进行仿真分析,最后加入噪声进行滤波处理,比较滤波前后的变化。 关键词:语音信号,采集与分析, Matlab 0 引言 通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。语言是人类持有的功能.声音是人类常用的工具,是相互传递信息的最主要的手段。因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。 让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输人这样便于使用的、自然的、人性化的输人方式。作为高科鼓应用领域的研究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长足的进步。它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理.工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面。可见,语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作。我们今天进行这一领域的研究与开拓就是要让语音信号处理技术走人人们的日常生活当中,并不断朝更高目标而努力。 语音信号采集与分析之所以能够那样长期地、深深地吸引广大科学工作者去不断地对其进行研究和探讨,除了它的实用性之外,另一个重要原因是,它始终与当时信息科学中最活跃的前沿学科保持密切的联系.并且一起发展。语音信号采集与分析是以语音语言学和数字

数字信号处理教语音信号处理课程设计心得

这次课程设计虽然遇到了很多问题,很多困难,但是也学到了很多东西。不仅学到了书本上的东西,而且学到了很多课本上没有的东西,很多程序里的东西,特别是程序语法,总是有错误,但是总是不知道错在哪里,在细心的检查下,终于找出了错误和警告,排除困难后,程序编译就通过了,心里终于舒了一口气。还有各种各样问题,通过查网络和请教同学来弄明白,这个过程是痛苦的,有时候有些问题不能马上解决,感到很头痛,真想放弃这个问题,但是坚持下来,并且解决这些问题的时候,真的有种苦尽甘来的感觉。 应用MATLAB进行语音信号的处理是与我们所学课程及专业紧密相连的,有着很强的实践性。做这个课程设计的时候,并不是非常的顺利,我也有遇到很多困难。刚开始,我用自己的mp3录制的一个wav文件做语音信号处理,程序始终现实如下错误提示: ??? Error using ==> wavread Error using ==> wavread Data compression format (IMA ADPCM) is not supported. 我在查阅了很多资料,在网上也查阅相关信息,花费了大量时间也没找出结果,最后发现在WAV格式的语音文件有两种格式,即PCM格式和IMA ADPCM格式,而在MATLAB中用wavread函数进行语音处理时,并不能直接处理IMA ADPCM格式的语音信号,经

过格式转换之后(选择PCM格式),我运行出了正确的结果。刚开始由于对滤波器的滤波原理并不是很了解,于是我又翻出学过的数字信号处理课本,认真研究起各种滤波器了,这才使我明白了大多数滤波器是如何工作地,不再单单只是懂理论,理论与实际相结合是很重要的,只有理论知识是远远不够的,只有把所学的理论知识与实践相结合起来,从理论中得出结论。实验过程中,我感觉到初始语音信号和滤波输出后的语音信号在音色上有一定的差别,这说明了信号在处理、传输过程中有损耗。不管对于什么样的课题,其实也是有很多东西可以发掘的,这需要我们在平时多积累,多思考,只有这样,才能取得更大的进步,才能学有所用,学有所长。 通过这次设计,进一步加深了对数字信号处理的了解,让我对它有了更加浓厚的兴趣。通过这次课程设计使我懂得了,平时的理论知识只有通过自己动手做一个课题,从做这个课题的过程中发现问题,解决问题,这个学习的过程,会比我们平时只通过课堂上听讲得到的知识更加生动立体,跟让人记忆深刻。在设计的过程中,我发现同学间的互帮互助真的很重要。当我们有问题的时候,大家一起讨论,将自己的观点表达出来,当发现别人的观点与自己的不同的时候,我们通过查阅资料找到最终正确的答案,这个过程是互利互惠的。这也培养了我们以后走上工作岗位后的团队精神,对我们以后的为人处世都有很大帮助。同时我们在设计的过程中发现了自己的不足之处,对以前所学过的知识理

语音信号特征参数研究

语音信号特征参数研究 石海燕 (浙江工业大学信息工程学院,浙江杭州310032) 摘要:在语音技术的发展过程中使用了大量的语音信号特征参数,好的语音信号特征参数能对语音识别起至关重要的作用。本文对语音信号特征参数、语音信号特征参数的选择进行了介绍,并介绍了语音信号的短时能量、短时平均幅度的提取。 关键词:语音信号;特征参数;短时能量 中图分类号:TP391文献标识码:A文章编号:1009-3044(2008)04-10754-04 StudyonSpeechSignalFeatureParameter SHIHai-yan (CollegeofInformationEngineering,ZhejiangUniversityofTechnology,Hangzhou310032,China) Abstract:Intheprocessofdevelopingspeechtechnologyusedinalargenumberofspeechsignalfeatureparameters,agoodspeechsignalfeatureparametersplayedacriticalroleinspeechrecognition.Inthispaperweintroducedthespeechsignalfeatureparameters,thespeechsignalfeatureparametersselection,andintroducedshort-termenergy、short-termaveragerangeextraction. Keywords:speechsignal;featureparameter;short-termenergy 1引言 在语音识别的发展过程中使用了大量的语音信号特征参数。特征参数的提取是关系到语音识别系统性能好坏的一个关键技术,其基本思想是将预处理过的信号通过一次变换,去掉冗余部分,而把代表语音本质的特征参数抽出来。接下去所要作的识别处理都是建立在特征参数之上的,如果特征参数不能很好地反映语音信号的本质,识别就不能成功。 语音信号特征参数是分帧提取的,每帧特征参数一般构成一个矢量,所以语音信号特征是一个矢量序列。我们将语音信号切成一帧一帧,每帧大小大约是20 ̄30ms。帧太大就不能得到语音信号随时间变化的特性,帧太小就不能提取出语音信号的特征,每帧语音信号中包含数个语音信号的基本周期。有时希望相邻帧之间的变化不是太大,帧之间就要有重叠,帧叠往往是帧长的1/2或1/3。帧叠大,相应的计算量也大。 常用的语音特征参数有平均能量、平价跨零数或跨零率、共振峰、LPC参数、倒谱参数、临界带倒谱等。下一节介绍一些常用的语音特征。 2语音信号特征参数介绍 (1)基音周期(Pitch) 人的语音基本上由两类构成,一类是浊音(voice),另一类是清音(unvoice)。浊音的语音信号具有较强的周期性,不同的浊音波形是不同的。浊音的这种周期叫基音周期,其倒数叫做基音频率,它主要和声带的特性有关。一般来说,成年男性的语音的基音频率在60Hz ̄200Hz,而成年女性和儿童语音的基音频率在200Hz ̄450Hz。清音的语音信号具有随机噪声的特点,一般来说清音的幅度小于浊音的幅度。基音周期(Pitch)是指发浊音时声带震动所引起的周期运动时间间隔,代表声带震动的快慢,震动越快音高会越高,基音周期是声带振动频率F0的倒数,它是语音信号分析的一个重要参数。 (2)短时频谱 语音信号特征在较短的时间间隔中保持基本不变,即语音信号具有时变特性,因而可以将语音信号看作是一个短时平稳过程。语音信号具有一些重要的短时特征。短时频谱是语音信号的一个重要的短时特性。可以用下列公式计算: (1) 收稿日期:2008-01-12 个人简介:石海燕(1977-),女,浙江诸暨人,实验师,主要研究方向:语音处理、模式识别。

相关文档