文档库 最新最全的文档下载
当前位置:文档库 › 哈尔滨工程大学语音信号处理实验报告资料

哈尔滨工程大学语音信号处理实验报告资料

哈尔滨工程大学语音信号处理实验报告资料
哈尔滨工程大学语音信号处理实验报告资料

实 验 报 告

实验课程名称: 语音信号处理实验

姓名: 班级: 20120811 学号:

指导教师 张磊 实验教室 21B#293 实验时间 2015年4月12日 实验成绩

实验序号

实验名称

实验过程 实验结果 实验成绩

实验一 语音信号的端点检测 实验二 语音信号的特征提取 实验三

语音信号的基频提取

实验一 语音信号的端点检测

一、实验目的

1、掌握短时能量的求解方法

2、掌握短时平均过零率的求解方法

3、掌握利用短时平均过零率和短时能量等特征,对输入的语音信号进行端点检测。

二、实验设备 HP 计算机、Matlab 软件 三、实验原理 1、短时能量

语音信号的短时能量分析给出了反应这些幅度变化的一个合适的描述方法。对于信号)}({n x ,短时能量的定义如下:

∑∞

-∞

=∞

-∞

=*=-=

-=

m m n n h n x m n h m x m n w m x E )()()()()]()([222

2、短时平均过零率

短时平均过零率是指每帧内信号通过零值的次数。对于连续语音信号,可以

考察其时域波形通过时间轴的情况。对于离散信号,实质上就是信号采样点符号变化的次数。过零率在一定程度上可以反映出频率的信息。短时平均过零率的公式为:

∑∑-+=∞

-∞=--=

---=1)]

1(sgn[)](sgn[2

1 )

()]1(sgn[)](sgn[21N n n

m w w

m n m x m x

m n w m x m x Z

其中,sgn[.]是符号函数,即

?

?

?<-≥=0)(10)(1

)](sgn[n x n x n x

3、端点检测原理

能够实现这些判决的依据在于,不同性质语音的各种短时参数具有不同的概率密度函数,以及相邻的若干帧语音应具有一致的语音特性,它们不会在S 、U 、V 之间随机地跳来跳去。要正确判断每个输入语音的起点和终点,利用短时平均幅度参数E 和短时平均过零率Z 可以做到这一点。

首先,根据浊音情况下的短时能量参数的概率密度函数)|(V E P 确定一个阈值参数H E ,H E 值一般定的较高。当一帧输入信号的短时平均幅度参数超过H E 时,就可以判定该帧语音信号不是无声,而有相当大的可能是浊音。根据H E 可判定输入语音的前后两个点1A 和2A 。在1A 和2A 之间的部分肯定是语音段,但语音的精确起点、终点还要在1A 之前和2A 之后仔细查找,如图1所示。

C 1

B 1 A 1

A 2

B 2

C 2

E H E E L

C 2

B 2 A 1

C 1

B 1 A 2 Z

Z s

图1 端点检测原理示意图

为此,再设定一个较低的阈值参数L E ,由1A 点向前找,当短时能量由大到小减至L E 可以确定点1B 。类似地,可以由2A 点向后找,确定2B 点。在1B 和2B 之间的仍能肯定是语音段。然后由1B 向前和2B 向后,利用短时平均过零率进行搜索。根据无声情况下的短时平均过零率,设置一个参数s Z ,如果由1B 向前搜索时,短时平均过零率大于s Z 的3倍,则认为这些信号仍属于语音段,直到短时平均过零率下降到低于3倍的s Z ,这时的点1C 就是语音的精确的起点。对于终点也做类似的处理,可以确定终点2C 。采用短时平均过零率的原因在于,1B 点以前可能是一段清辅音,它的能量相当弱,依靠能量不可能将它们与无声段分开。而对于清辅音来说,它们的过零率明显高于无声段,因而能用这个参数将二者区分开来。

存在噪声的情况下,正常的过零率计算会存在一定的误差,解决这个问题的一种方法是对上述过零率定义做一个简单的修改,即设立一个门限T ,将过零率的含义修改为跨过正负门限的次数,如图2。

门限3 门限2 门限1 门限1 门限2 门限3

时间

图2 门限短时平均过零率

于是,有:

)

(}])1(sgn[])(sgn[ ])1(sgn[])(sgn[{21m n w T m x T m x T m x T m x Z m n -+--++

----=∑∞

-∞= 这样计算的短时平均过零率就有一定的抗干扰能力。即使存在小的随机噪声,只要它不超过正负门限所构成的带,就不会产生虚假过零率。 四、实验步骤及程序 实验程序:

function point_check() s1=wavread('man.wav'); s=s1/max(abs(s1)); s=filter([1 -0.9375],1,s); plot(s); len=length(s); round=160; repeat=80;

inc=round-repeat;%b_len-2*repeat; ka=ceil((len-round)/(round-repeat))+1;

s=[s;zeros((round-repeat)*(ka-1)+round-len,1)]; len=length(s); w=zeros(round,ka); for i=1:ka

for k=1:round

w(k,i)=s(k+(i-1)*(round-repeat),1);

end

end

ST=0.01;

F=zeros(ka,round);

for i=1:ka

for k=0:round-1

for j=1:round-k

F(ka,k+1)=F(ka,k+1)+abs(w(j,i)-w(j+k,i));

end

if(k

if(w(k+1,i)>0&&w(k+2,i)<0)

z=sign(w(k+1,i)-ST)-sign(w(k+2,i)+ST);

elseif(w(k+1,i)<0&&w(k+2,i)>0)

z=sign(w(k+2,i)-ST)-sign(w(k+1,i)+ST);

end

if(z==2)

f(i,1)=f(i,1)+1;

end

end

end

end

amp=sum(abs(w).^2,1);

实验结果截图:

024********x 10

5

-0.8

-0.6-0.4-0.200.20.40.6

0.8

五、实验结果与分析

这次实验利用MATLAB 对信号进行分析和处理,利用短时过零率和短时能量,对语音信号的端点进行检测。我之前虽然接触过MATLAB 软件,但从未进行过有关语音信号的操作,在实验过程中欠缺独立性,代码是参考网上的,在理解的基础上借鉴。学习是无止境的,现在的动手能力不强也是由于之前的松懈造成的,以后一定要多动手,毕竟能力是立身之本。

实验二 语音信号的特征提取

一、实验目的

1、掌握语音信号的Mel 倒谱特征(MFCC )的求解方法

2、掌握语音信号的线性预测原理以及LPC 特征的求解方法 二、实验设备 HP 计算机、Matlab 软件 三、实验原理

1、MFCC 特征原理及求解方法

在语音识别和说话人识别中,常用的语音特征是基于Mel 频率的、倒谱系数(Mel Frequency Cepstrum Coefficient ,简称MFCC )。由于MFCC 参数是将人耳的听觉感知特性和语音的产生机制相结合,因此目前大多数语音识别系统中广泛使用这种特征。

研究者根据心理学实验得到了类似于耳蜗作用的一组滤波器组,这就是Mel 频率滤波器组。Mel 频率可以用公式表达如下:

)700/log(12595 frequency Mel f +?=

在实际应用中,MFCC 倒谱系数计算过程如下:

(1) 将信号进行分帧,预加重和加汉明窗处理,然后进行短时傅立叶变换

得到其频谱; (2) 求出频谱平方,即能量谱,并用M 个Mel 带通滤波器进行滤波,由

于每一个频带中分量的作用在人耳中是叠加的,因此将每个滤波频带内的能量进行叠加,这时第k 个滤波器输出功率谱)(k x '; (3) 将每个滤波器的输出取对数,得到相应频带的对数功率谱;并进行反

离散余弦变换,得到L 个MFCC 系数,如下式所示。一般L 取12~16个左右;

∑=-'=M

k n M n k k x C 1]/)5.0(cos[)(log π L

n ,....2,1= (4) 这种直接得到的MFCC 特征作为静态特征,将这种静态特征做一阶

和二阶差分,得到相应的动态特征。

2、线性预测原理及LPC 特征求解方法

根据参数模型功率谱估计的思想,可以将语音信号()x n 看作是由一个输入序列)(n u 激励一个全极点的系统(模型))(z H 而产生的输出,如图3所示。

()

x n )

(n s )(n u

)(z H

图3 语音信号的模型化

系统的传递函数为:

∑=--=

p

i i

i z a G z H 11)(

其中G 为常数,i a 为实数,p 为模型的阶数。显而易见,这种模型是以系数i a 和增益G 为模型参数的全极点模型,即AR 模型。

用系数{i a }可以定义一个p 阶线性预测器)(z F

∑=-=p

i i i z a z F 1)(

这个p 阶预测器从时域角度可以理解为,用信号的前p 个样本来预测当前的

样本得到预测值()x

n , 1

()()p

i i x

n a x n i ==-∑ 因为预测器)(z F 是用AR 模型的系数{i a }来构造的,而AR 模型是在最小均方意义上对数据的拟合,所以预测器)(z F 必然是一个最佳预测器,即此时预测器的预测误差短时总能量最小。

语音信号的线性预测分析就是根据这一性质,从语音信号()x n 出发,依据最小均方误差准则,估计出一组线性预测器的系数{i a },它就是我们所要求的信号AR 模型的系数。{i a }被称为线性预测系数或LPC 系数。

预测器的预测误差)(n e 为:

1()()()()()p

i i e n x n x

n x n a x n i ==-=--∑ 由上式可知,)(n e 是输入为()x n ,且具有如下形式传递函数的滤波器的输出

i p

i i z a z F z A -=∑-=-=1

1)(1)(

因此称)(z A 为预测误差滤波器。比较式(4-1)和式(4-5)可知)(/)(z H G z A =,即预测误差滤波器是系统)(z H 的逆滤波器。

为了在最小均方误差意义上计算一组最佳预测系数,定义短时预测均方误差为

2

2

21()[()()][()()]p

n i n

n

n

i E e n x n x

n x n a x n i ===-=--∑∑∑∑ 由于语音信号的时变特性,线性预测分析应该在短时的语音段上进行,即按帧进行。因此上式的求和通常也是在一帧语音的范围内进行。为了使n E 达到最小,{i a }必须满足),,2,1( ,0/p k a E k n ???==??。则有:

1(2()()2()())p

n

i n i n

k E x n x n k a x n k x n i a =?=-----?∑∑∑ 这样可以得到以{i a }为变量的线性方程组

1

()()()()p

i

n

i n

x n x n k a x n k x n i =-=--∑∑∑, p k ,,2,1???=

要构造信号的AR 模型,还应估算增益因子G 。将系统传递函数转化成差分方程的形式:

1()()()p

i i x n a x n k Gu n ==-+∑

则预测误差)(n e 和残差能量n E 分别计算如下:

()[()()]()n

n

e n x n x

n Gu n =-=∑∑ ∑=n

n n u G E )(22

激励信号)(n u 无法准确计算,但根据前文所述的语音产生模型,在浊音情况

下,激励可以看作是准周期的脉冲串;在清音时,可以看作为高斯白噪声。因此

输入信号总能量可以认为近似为1,这样估算增益因子 2/1??n

E G =。这种计算只是一种近似的方法,。

为了使模型的假定能够很好地符合语音产生的模型,需要考虑如下两个因素。

(1)模型阶数p 的选择

阶数p 应与共振峰的个数相吻合,通常一对极点对应一个共振峰,因此当共振峰数为5时,应取p =10。考虑到一些情况,一般按如下的方式计算模型阶数12+=D p ,其中D 为共振峰的个数。 (2)通过预加重进行高频提升

由于声门脉冲形状和口唇辐射的影响,语音信号的频谱在总趋势上会产生高频衰落的现象,大约每倍程下降6dB 。要抵消这一影响,通常在LPC 分析之前采用一个非常简单的一阶FIR 滤波器进行预加重以进行高频提升,其传递函数为11--z α,其中α为预加重系数,对10kHz 采样的语音,一般取α=0.95。大量的实践证明:LPC 参数是反映语音信号特征的良好参数。 附:莱文逊—杜宾递推算法 该算法过程如下: (1)计算自相关系数(),0,1,...,n R j j p =;

(2)(0)(0)n E R =;

(3)1=i ;

(4)开始按如下公式进行递推运算:

1

(1)1

(1)

()()

i i n j n j i i R i a R i j k E --=---=

i i i k a =)(

()(1)(

i i i j j i i j a a k a ---=-, 1,...

,1j i =- )1(2)()1(--=i i i E k E

(5) 1+=i i 。若p i >则算法结束退出,否则返回第(4)步。 四、实验步骤及程序 MFCC 特征提取程序:

close all

clear

clc

[x]=wavread('N:\second\man.wav');

bank=melbankm(24,256,8000,0,0.5,'m');

bank=full(bank);

bank=bank/max(bank(:));

for k=1:12

n=0:23;

dctcoef(k,:)=cos((2*n+1)*k*pi/(2*24));

end

w = 1 + 6 * sin(pi * [1:12] ./ 12);

w = w/max(w);% 预加重滤波器

xx=double(x);

xx=filter([1 -0.9375],1,xx); % 语音信号分帧

xx=enframe(xx,256,80); % 计算每帧的MFCC参数for i=1:size(xx,1)

y = xx(i,:);

s = y' .* hamming(256);

t = abs(fft(s));

t = t.^2;

c1=dctcoef * log(bank * t(1:129));

c2 = c1.*w';

m(i,:)=c2';

end

figure

imagesc(m);xlabel('帧数');

ylabel('幅度');

title('MFCC');

实验结果截图:

帧数

幅度

MFCC

2

4

6

8

10

12

2000400060008000100001200014000

16000

LPC 特征提取程序:

clear clc

I = wavread('N:\second\man.wav');%读入原始语音 %subplot(3,1,1), plot(I);

title('原始语音波形')

%对指定帧位置进行加窗处理 Q = I';

N = 256; % 窗长

Hamm = hamming(N); % 加窗 frame = 60;%需要处理的帧位置

M = Q(((frame - 1) * (N / 2) + 1):((frame - 1) * (N / 2) + N)); Frame = M .* Hamm';%加窗后的语音帧 [B,F,T] = specgram(I,N,N/2,N); [m,n] = size(B); for i = 1:m

FTframe1(i) = B(i,frame); end

P =50;%input('请输入预测器阶数 = '); ai = lpc(Frame,P); % 计算lpc 系数

LP = filter([0 -ai(2:end)],1,Frame); % 建立语音帧的正则方程 FFTlp = fft(LP);

E = Frame - LP; % 预测误差 figure

subplot(2,1,1),plot(1:N,Frame,1:N,LP,'-r');grid;

title('原始语音和预测语音波形')

subplot(2,1,2),plot(E);grid;

title('预测误差');

figure

fLength(1 : 2 * N) = [M,zeros(1,N)];

Xm = fft(fLength,2 * N);

X = Xm .* conj(Xm);

Y = fft(X , 2 * N);

Rk = Y(1 : N);

PART = sum(ai(2 : P + 1) .* Rk(1 : P));

G = sqrt(sum(Frame.^2) - PART);

A = (FTframe1 - FFTlp(1 : length(F'))) ./ FTframe1

subplot(2,1,1),plot(F',20*log(abs(FTframe1)),F',(20*log(abs(1 ./ A))),'-r'); grid;

xlabel('频率/dB');ylabel('幅度');

title('短时谱');

subplot(2,1,2),plot(F',(20*log(abs(G ./ A))));grid;

xlabel('频率/dB');ylabel('幅度');

title('LPC谱');

figure%求出预测误差的倒谱

pitch = fftshift(rceps(E));

M_pitch = fftshift(rceps(Frame));

subplot(2,1,1),plot(M_pitch);grid;

xlabel('语音帧');ylabel('/dB');

title('原始语音帧倒谱');

subplot(2,1,2),plot(pitch);grid;

xlabel('语音帧');ylabel('/dB');

title('预测误差倒谱');

figure %画出语谱图

ai1 = lpc(I,P); % 计算原始语音lpc系数

LP1 = filter([0 -ai(2:end)],1,I); % 建立原始语音的正则方程

subplot(2,1,1);

specgram(I,N,N/2,N);

title('原始语音语谱图');

subplot(2,1,2);

specgram(LP1,N,N/2,N);

title('预测语音语谱图');

实验结果截图:

Time

F r e q u e n c y

原始语音语谱图

10002000300040005000600070008000900010000

2040

60Time

F r e q u e n c y

预测语音语谱图

10002000300040005000600070008000900010000

2040

60

050100

150200250300

-10

-50

5语音帧/d B

原始语音帧倒谱

50

100

150200

250

300

-3-2-10

1语音帧

/d B

预测误差倒谱

10

20

304050

60

70

-300

-200-1000

100频率/dB 幅度

短时谱

01020

3040506070

-100

0100

200频率/dB

幅度

LPC 谱

50

100

150200

250

300

-1-0.500.5

1原始语音和预测语音波形

50

100

150

200

250

300

-0.1

-0.0500.05

0.1预测误差

2

4

6

8

10

12

14x 10

5

-1-0.8-0.6-0.4-0.200.20.40.60.8

1原始语音波形

五、实验结果与分析

这次实验利用MATLAB 对信号进行分析和处理,主要就是进行语音线性预测,语音线性预测的基本思想是:一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近。通过使实际语音抽样值与线性预测抽样值的均方误差达到最小,可以确定唯一的一组线性预测系数。做了LPC 特征提取的实验之后,促进了我对MFCC 特征提取进行探究和验证,此次试验让我对相关知识加深了理解。

实验三 语音信号的基频提取

一、实验目的

1、掌握语音信号基频的概念,加深对基频刻画声调特征作用的理解。

2、掌握语音信号基频特征的典型求解方法 二、实验设备 HP 计算机、Matlab 软件 三、实验原理

1、基频概念的理解

基音检测的方法大致可分为三类:① 波形估计法。直接由语音波形来估计基音周期,分析出波形上的周期峰值。包括并行处理法、数据减少法等;② 相关处理法。这种方法在语音信号处理中广泛使用,这是因为相关处理法抗波形的相位失真能力强,另外它在硬件处理上结构简单。包括波形自相关法、平均振幅差分函数法(AMDF )、简化逆滤波法(SIFT )等;③ 变换法。将语音信号变换到频域或倒谱域来估计基音周期,利用同态分析方法将声道的影响消除,得到属于激励部分的信息,进一步求取基音周期,比如倒谱法。虽然倒谱分析算法比较复杂,但基音估计效果较好。这里我们只考虑自相关方法的基频提取。 2、自相关方法的基频提取

浊音信号的自相关函数在基音周期的整数倍位置上出现峰值,而清音的自相关函数没有明显的峰值出现,因此检测自相关函数是否有峰值就可以判断是清音或浊音,峰—峰值之间对应的就是基音周期。

为了提高自相关方法检测基音周期的准确性,需要进行一些前期的预处理。 1)预处理

语音信号的低幅值部分包含大量的共振峰信息,而高幅值部分包含较多的基音信息。因此,任何削减或者抑制语音低幅度部分的非线性处理都会使自相关方法的性能得到改善。中心削波即是一种非线性处理,用以消除语音信号的低幅度部分,其削波特性如图4所示,数学表达形式为

??

?

??-<+≤>-==L L L C

n x L n x C n x C n x L n x n C n y )()(|)(|0)()()()(

其中削波电平L C 由语音信号的峰值幅度来确定,它等于语音段最大幅度的一个固定百分数,一般取最大信号幅度的60%~70%。这个门限的选择是重要的,一般在不损失基音信息的情况下应尽可能选得高些,以达到较好的效果。经过中心削波后只保留了超过削波电平的部分,其结果是削去了许多和声道响应有关的波动。中心削波后的语音再计算自相关函数,这样在基音周期位置呈现大而尖的峰值,而其余的次要峰值幅度都很小。据报道使用这种方法,对电话带宽的语音在信噪比低至18dB 的情况下获得了良好的性能。

C [x ]

x

+C L

-C L

图4 中心削波函数

计算自相关函数的运算量是很大的,其原因是传统的计算机进行乘法运算非常费时。尽管近年来随着数字信号处理器的广泛使用,实时地计算自相关函数已经不是问题,但在基音检测中仍然有一些减少短时自相关运算的有效方法。如可对中心削波函数进行修正,采用三电平中心削波的方法,如图5所示。其削波函数为

??

?

??-<-≤>==L L L C

n x C n x C n x n x C n y )(1|)(|0)( 1)]([)(

即削波器的输出在L C n x >)(时为1,L C n x -<)(时为1-,除此以外均为零。

虽然这一处理会增加刚刚超过削波电平峰的重要性,但大多数次要的峰被滤除掉了,而只保留了明显的周期性峰。

C [x ]

x

+C L

-C L

+1 -1

图5 三电平削波函数

此外,还可以用一个通带为900Hz 的线性相位低通滤波器滤除高次谐波分量。这样处理后的信号,基本上只含有第一共振峰以下的基波和谐波分量。实验表明,用这种方法做预处理,对改善自相关和平均幅度差函数法的基音检测都有明显的效果。

2)基于自相关函数的基音检测

短时自相关函数在基音周期的各个整数倍点上有很大的峰值,只要找到第一最大峰值点的位置,并计算它与原点的间隔,便能估计出基音周期。但实际上并不是这么简单,第一个最大峰值点的位置有时不能与基音周期相吻合。产生这种情况的原因有以下两个方面。第一方面是与窗的长度有关。一般认为窗长至少应大于两个基音周期,才可能有较好的效果。第二方面与声道特性的影响有关。有的情况下,即使窗长已经选得足够长,第一个最大峰值点与基音周期仍不一致,这就是声道共振峰特性的干扰。经过上述带通滤波的预处理,就可以消除大部分的共振峰的影响。但是,如果希望减少自相关计算中的乘法运算,可以把上述中心削波后的信号)}({n y 的自相关用两个信号的互相关代替,其中一个信号是)}({n y ,令一个信号是对)}({n y 进行三电平量化产生的结果)}({n y '。显然,)(n y '只有-1,0,+1三种可能的取值,因而这里的互相关计算只需做加减法,而这个互相关序列的周期性与)}({n y 的自相关序列近似相同。

下面结合L.R.Rabiner 一篇论文中介绍的具体例子来叙述关于自相关函数的基音检测方法。假设信号的采样率为10kHz ,窗序列采用300点的矩形窗,帧叠200点。这时对每一帧进行基音周期估计的步骤如下:

(1) 用900Hz 低通滤波器对一帧语音信号)}({n x 进行滤波,并去掉开头的

20个输出值不用,得到)}({n x '; (2) 分别求)}({n x '的前部100个样点和后部100个样点的最大幅度,并取

其中较小的一个,乘以因子0.68作为门限电平L C ; (3) 对)}({n x '分别进行中心削波得到)}({n y 和三电平量化得到)}({n y '; (4) 求这两个信号的互相关值)(k R 。其中∑=+'?=300

21

)()()(n k n y n y k R ,此处k

的取值范围20~150相应于基音频率范围60Hz~500Hz ,)0(R 相应于短

时能量;

得到互相关值后,可以得到)150()...

20(R R 中的最大值m a x R ,如果)0(25.0max R R <,则认为本帧为清音,令其基音周期值为0,否则基音周期即为使)(k R 为最大值max R 时位置k 的值,即)(max arg 150

20k R p k ≤≤=。

3)后处理

无论采用哪一种算法求得的基音周期轨迹与真实的基音周期轨迹不可能完全吻合。大部分段落是吻合的,而在一些局部段落或区域中有一个或几个基音周期的估计值偏离了正常的轨迹这时称为基音轨迹产生了若干“野点”。为了去除这些野点,可以采用平滑算法,其中最常用的是中值平滑算法和线性平滑算法。 在中值滤波平滑算法中,被平滑点的左右各取L 个样点,连同被平滑点共同构成一组12+L 个信号样点值。将这些样点值按大小次序排成一队,取此队列中间者作为平滑器的输出。L 值一般取为1或2,即中值平滑的“窗口”一般套住3或5个样值。中值平滑的优点是既可以有效地去除少量野点,又不会破坏基音周期轨迹中的两个平滑段之间的阶跃性变化。

线性平滑是用滑动窗进行线性滤波处理,即:

∑-=?-=

L

L

m m w m n x n y )()()(

其中}.....0,...1,),({L L L m m w +--=为12+L 点平滑窗,满足:

1)(=∑-=L

L

m m w

例如三点窗的值可取为}25.0,5.0,25.0{。线性平滑在纠正输入信号中不平滑处样点的同时,也使附近的样点值做了修改,所以窗长不易过长。 四、实验步骤及程序 实验程序:

x=wavread('man.wav');%读取声音文件 figure;

stem(x,'.'); %显示声音信号的波形

n=160; %取20ms 的声音片段,即160个样点 for m=1:length(x)/n; %对每一帧求短时自相关函数 for k=1:n; Rm(k)=0; for i=(k+1):n;

Rm(k)=Rm(k)+x(i+(m-1)*n)*x(i-k+(m-1)*n); end end

语音信号处理实验指导书

语音信号处理实验指导书 实验一 语音信号采集与简单处理 一、 实验目的、要求 (1)掌握语音信号采集的方法 (2)掌握一种语音信号基音周期提取方法 (3)掌握短时过零率计算方法 (4)了解Matlab 的编程方法 二、 实验原理 基本概念: (a )短时过零率: 短时内,信号跨越横轴的情况,对于连续信号,观察语音时域波形通过横轴的情况;对于离散信号,相邻的采样值具有不同的代数符号,也就是样点改变符号的次数。 对于语音信号,是宽带非平稳信号,应考察其短时平均过零率。 其中sgn[.]为符号函数 ?? ?? ?<=>=0 x(n)-1sgn(x(n))0 x(n)1sgn(x(n)) 短时平均过零的作用 1.区分清/浊音: 浊音平均过零率低,集中在低频端; 清音平均过零率高,集中在高频端。 2.从背景噪声中找出是否有语音,以及语音的起点。 (b )基音周期 基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等。因为汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是一个十分重要的问题。 ∑--= -=1 )]1(sgn[)](sgn[21N m n n n m x m x Z

由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很宽,而同—个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情。基音提取的主要困难反映在:①声门激励信号并不是一个完全周期的序列,在语音的头、尾部并不具有声带振动那样的周期性,有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。②声道共振峰有时会严重影响激励信号的谐波结构,所以,从语音信号中直接取出仅和声带振动有关的激励信号的信息并不容 易。③语音信号本身是准周期性的(即音调是有变化的),而且其波形的峰值点或过零点受共振峰的结构、噪声等的影响。④基音周期变化范围大,从老年男性的50Hz 到儿童和女性的450Hz ,接近三个倍频程,给基音检测带来了一定的困难。由于这些困难,所以迄今为止尚未找到一个完善的方法可以对于各类人群(包括男、女、儿童及不向语种)、各类应用领域和各种环境条件情况下都能获得满意的检测结果。 尽管基音检测有许多困难,但因为它的重要性,基音的检测提取一直是一个研究的课题,为此提出了各种各样的基音检测算法,如自相关函数(ACF)法、峰值提取算法(PPA)、平均幅度差函数(AMDF)法、并行处理技术、倒谱法、SIFT 、谱图法、小波法等等。 三、使用仪器、材料 微机(带声卡)、耳机,话筒。 四、 实验步骤 (1)语音信号的采集 利用Windows 语音采集工具采集语音信号,将数据保存wav 格式。 采集一组浊音信号和一组清音信号,信号的长度大于3s 。 (2)采用短时相关函数计算语音信号浊音基音周期,考虑窗长度对基音周期计算的影响。采用倒谱法求语音信号基音周期。 (3)计算短时过零率,清音和浊音的短时过零率有何区别。 五、实验过程原始记录(数据,图表,计算) 短时过零率 短时相关函数 P j j n s n s j R N j n n n n ,,1) ()()(1 =-=∑-= ∑--=-=10 )]1(sgn[)](sgn[21N m n n n m x m x Z

语音信号处理实验报告

语音信号处理实验 班级: 学号: 姓名:

实验一 基于MATLAB 的语音信号时域特征分析(2学时) 1) 短时能量 (1)加矩形窗 a=wavread('mike.wav'); a=a(:,1); subplot(6,1,1),plot(a); N=32; for i=2:6 h=linspace(1,1,2.^(i-2)*N);%形成一个矩形窗,长度为2.^(i-2)*N En=conv(h,a.*a);% 求短时能量函数En subplot(6,1,i),plot(En); if (i==2) ,legend('N=32'); elseif (i==3), legend('N=64'); elseif (i==4) ,legend('N=128'); elseif (i==5) ,legend('N=256'); elseif (i==6) ,legend('N=512'); end end 00.51 1.52 2.5 3 x 10 4 -1 100.5 1 1.5 2 2.5 3x 10 4 024 N=3200.5 1 1.5 2 2.5 3x 10 4 05 N=6400.5 1 1.5 2 2.5 3x 10 4 0510 N=12800.5 1 1.5 2 2.5 3x 10 4 01020 N=2560 0.5 1 1.5 2 2.5 3x 10 4 02040 N=512 (2)加汉明窗 a=wavread('mike.wav'); a=a(:,1); subplot(6,1,1),plot(a); N=32;

for i=2:6 h=hanning(2.^(i-2)*N);%形成一个汉明窗,长度为2.^(i-2)*N En=conv(h,a.*a);% 求短时能量函数En subplot(6,1,i),plot(En); if (i==2), legend('N=32'); elseif (i==3), legend('N=64'); elseif (i==4) ,legend('N=128'); elseif (i==5) ,legend('N=256'); elseif (i==6) ,legend('N=512'); end end 00.51 1.52 2.5 3 x 10 4 -1 100.5 1 1.5 2 2.5 3x 10 4 012 N=3200.5 1 1.5 2 2.5 3x 10 4 024 N=6400.5 1 1.5 2 2.5 3x 10 4 024 N=12800.5 1 1.5 2 2.5 3x 10 4 0510 N=2560 0.5 1 1.5 2 2.5 3x 10 4 01020 N=512 2) 短时平均过零率 a=wavread('mike.wav'); a=a(:,1); n=length(a); N=320; subplot(3,1,1),plot(a); h=linspace(1,1,N); En=conv(h,a.*a); %求卷积得其短时能量函数En subplot(3,1,2),plot(En); for i=1:n-1 if a(i)>=0 b(i)= 1;

哈尔滨工程大学 优秀个人简历

两年以上工作经验 30岁 上海 139********(手机) wangrui@https://www.wendangku.net/doc/e510510212.html, 王瑞景观工程师 最近工作 公司:X X房地产开发行业:房地产开发职位:景观工程师 最高学历 学校:哈尔滨工程大学 学历:本科专业:通信工程 工作经验 公司:X X房地产开发2010/1--2017/5 职位:景观工程师 行业:房地产开发 部门:设计部 工作内容: 1、负责配合优化参数的修改; 2、负责****模块相应功能的调试和增强 3、负责产品需求分析、可行性分析,单板的硬件框架设计; 4、负责项目管理、进度控制、系统设计以及模块的分发、管理工作; 5、负责为投标项目撰写投标技术方案; 6、负责****局域网的组建及维护。 公司:X X房地产开发有 限公司 2009/1--2010/1 职位:景观设计师 行业:房地产开发 部门:设计部 工作内容: 1、负责协助上级领导完成设计供方的筛选、委托工自我评价 具有丰富的无线通信经验,参加过数 十个国内外大中型项目,例如: ***、***。熟悉短波、VHF、UHF、 微波等无线频段的传播特性,具备很 强的解决突发问题的能力。对工作具 有热情和投入的精神、具有团队合作 意识和很强的事业心。沟通能力强, 编程习惯好,可以承受在较大压力下 工作。 求职意向 到岗时间:一周以内 工作性质:全职 希望行业:房地产开发 目标地点:上海 期望月薪:面议/月 目标职能:景观工程师 语言能力 英语:熟练 听说:熟练 读写:熟练 证书 大学英语六级2007/6大学英语四级2006/12

作;2、负责参与项目前期的调研工作,归纳和整理规划设计条件;3、负责景观设计书的编制;4、负责监督工程的质量,控制工程进度5、负责参与景观工程的初步验收和竣工验收,审核工程质量验收并做好相关记录。 教育经历 学校:哈尔滨工程大学2005/9--2009/6 专业:通信工程本科

哈尔滨工程大学土木专业考研经验分享

哈尔滨工程大学土木专业考研经验分享 本人今年报考哈工程的土木工程专业学术硕士,已被录取。希望大家不要拿这帖子对号入座,也不要跟我要联系方式什么的了,我所知道的都会写在这里了,最终考上还是靠自己的努力,与其上网浪费时间,倒不如安心看书备研,初试多考几分,为复试争取足够的资本。 一、关于初试 数学、英语、政治大家自己找适合自己的方法看就行,这里主要说下专业课。 专业课我曾给某考研班打电话问过,那边接电话的人自称是已经考上这个专业的哈工程研究生,一份2010年的卷子,加上该考研班内部杂七杂八的一些东西,要买到300元,我当时就乐了:这哥们一定是想钱想疯了。然后索性就自己搞了。 专业课一般是材力和结力选其一,报名时选你认为把握大的就好。今年的结力我感觉题有点偏,有些地方复习的思路不太对,只是得了112分。复试时看到有几个哥们初试专业课是材料力学,分都在120+的样子,据他们说材力比结力容易,但仁者见仁吧。 结构力学出题选用龙驭球的书,我感觉这本书比较难,也没必要看这本书,那样会有种不分主次的感觉,主要是注意下这本书上的一些提法,比如“图乘法作弯矩图”,这本书上会叫做“用虚功原理作弯矩图”。 我觉得结力最难最偏的就是简答题,主要是问结力计算的一般方法步骤、和拱有关的问题。特别要注意拱,会有3-4个都是和拱有关的,没有计算,都是概念理解。 计算题解法很基础,力法、位移法、力矩分配法,多做几道习题就能掌握。但这并不意味计算题很简单,因为题里给出的条件根本没有办法用对称简化,全凭算的小心,所以你一定要注意你的计算能力。 结力主要对着复习大纲看知识点,注意理解、掌握、了解的含义。 二、关于复试面试 面试顺序按初试排名挨个进,每人20分钟,一般不会少,今年17个人从上午8点一直干到了下午1点多。 流程是这样,进去先用英语自我介绍,然后有个老师专门针对你的介绍,用英语提几个问题,让你来答。然后是抽一个专业英语翻译的字条,先读一遍,然后翻译。接着就是从两堆纸条里分别抽2个问题,这个就看点了,有人抽的很难(比如:框架结构破坏的3种形态、单双向板破坏特征),有人抽的很简单(比如:混凝土梁正截面破坏的3种形态),涉及的方面会有:砌体、高层、抗震、混凝土、钢结构。最后就是聊天,给一个话题,谈你的看法,主要考察你平时对周围的关注情况、你的语言组织能力和思维。 三、关于复试笔试 笔试由混凝土和钢结构组成,各100分,3小时,用的教材是哈工大,北建工,华南水利水电学院等4校合编的教材。

哈尔滨工程大学研究生开题报告规定

哈尔滨工程大学 研究生开题报告规定(试行) 第一条研究生开题报告是研究生学位论文工作的重要环节。为了强化过程管理,做好开题报告工作,保证学位论文质量,根据《中华人民共和国学位条例》和《中华人民共和国学位条例暂行实施办法》有关规定,结合我校实际,制定本规定。 第二条研究生学位论文选题(以下简称“选题”)应在充分查阅文献资料的基础上,由研究生和导师(组)共同商定;或在对研究生情况充分了解的基础上,由导师(组)提出、征求研究生同意后确定。选题应满足以下要求:(一)选题应按分类指导原则,在学术方面具有开拓性、技术应用方面具有先进性,使研究课题在理论意义、学术水平和实用价值等方面具有较高水准。 (二)选题应密切结合实际,力求解决现代化建设中一些急需解决的科学技术难点,同时,根据我校研究生资助体系的规定要求,研究生应尽量结合导师承担的科研项目,对国民经济和社会发展进步起到指导和推动作用。 (三)选题要根据指导教师的研究方向,考虑本学科、本行业的科研基础和实验条件。同时要结合研究生本人的基础和特长以及导师的学术指导专长,选择适宜的论文题目,并在时间安排上留有余地,确保按时完成学位论文,使研究生通过论文工作得到从事科学研究工作全过程的基本训练。 第三条研究生在系统的文献查阅和广泛的调查研究的基础上,撰写开题报告,制定切实可行的论文工作计划,填写《研究生开题报告评审表》,经导师(组)审阅同意、院(系、部)批准后,确定开题时间。硕士生应于第三学期末前、博士生应于第四学期末前完成开题报告。未按期开题者,由研究生及其导师向所在院(系、部)提交延期开题申请,经院(系、部)审批后报研究生院备案,研究生院将对其加强过程监控力度。 第四条开题报告的内容 开题报告字数硕士不少于5000字,博士不少于6000字,内容具体要求如下:(一)选题的目的、依据和国内外研究进展。说明选题的理论意义和现实意义,着重说明选题的经过、该课题在国内外的研究动态和对开展此课题研究工作的设想以及课题的学术和实际应用价值。 (二)论文研究方案。包括研究目标、研究内容和拟解决的关键问题、拟采取的研究方法、技术路线、实验方案、可行性分析和创新之处。 (三)所需的科研条件。包括论文研究过程中可能遇到的困难、问题以及解决的途径、方法和措施,预期达到的目标、研究成果和论文结束后可能取得的创新性成果。

哈尔滨工程大学文件-哈尔滨工程大学研究生院

哈尔滨工程大学文件 哈工程校发…2017?57号 关于印发《哈尔滨工程大学博士研究生 科研创新基金管理办法》的通知 各有关单位: 为进一步鼓励我校研究生开展基础研究,提高学生创新能力,培养拔尖创新人才,规范并加强研究生科研创新的过程管理,充分发挥科研创新在研究生培养工作中的重要作用,提高研究生培养质量,学校制定了《哈尔滨工程大学博士研究生科研创新基金管理办法》。经2017年7次校长办公会通过,现印发给你们,请遵照执行。 哈尔滨工程大学 2017年6月2日

哈尔滨工程大学 博士研究生科研创新基金管理办法 第一章总则 第一条为提高学生创新能力,培养拔尖创新人才,不断提升研究生的培养质量,学校决定设立“哈尔滨工程大学博士研究生科研创新基金”(以下简称“创新基金”)。 第二条为规范创新基金的使用和管理,保证创新基金产出达到预期效果,结合《中央高校基本科研业务费管理办法》及我校实际,特制定本办法。 第三条创新基金资助对象为我校全日制在读博士研究生。 第二章创新基金内涵及资助方式 第四条创新基金为专项资金,主要用于资助优秀在读博士研究生结合自身学位论文研究方向,在导师指导下从事基础性、前瞻性、颠覆性的课题研究工作,培养研究生严谨务实、精益求精的科学精神,支持拔尖创新人才在国内外一流大学和一流学科从事科研、学习、交流。创新基金来源于“中央高校基本科研业务费”。 第五条创新基金按照申请项目的水平和实际研究情况,资助额度一般不超过10万元,每年资助20人左右。对探索性强、风险性高的申请项目,可予以小额资助开展预研探索研究。创新基金评审实行宁缺毋滥的原则,如无符合条件或评审不通过者,名额可空缺。 第六条创新基金资助期限为1-2年,获得资助后至毕业前至少应有一年的课题研究时间。 第三章创新基金申报条件 第七条创新基金申报条件如下:

语音信号处理实验报告

通信与信息工程学院 信息处理综合实验报告 班级:电子信息工程1502班 指导教师: 设计时间:2018/10/22-2018/11/23 评语: 通信与信息工程学院 二〇一八年 实验题目:语音信号分析与处理 一、实验内容 1. 设计内容 利用MATLAB对采集的原始语音信号及加入人为干扰后的信号进行频谱分析,使用窗函数法设计滤波器滤除噪声、并恢复信号。 2.设计任务与要求 1. 基本部分

(1)录制语音信号并对其进行采样;画出采样后语音信号的时域波形和频谱图。 (2)对所录制的语音信号加入干扰噪声,并对加入噪声的信号进行频谱分析;画出加噪后信号的时域波形和频谱图。 (3)分别利用矩形窗、三角形窗、Hanning窗、Hamming窗及Blackman 窗几种函数设计数字滤波器滤除噪声,并画出各种函数所设计的滤波器的频率响应。 (4)画出使用几种滤波器滤波后信号时域波形和频谱,对滤波前后的信号、几种滤波器滤波后的信号进行对比,分析信号处理前后及使用不同滤波器的变化;回放语音信号。 2. 提高部分 (5)录制一段音乐信号并对其进行采样;画出采样后语音信号的时域波形和频谱图。 (6)利用MATLAB产生一个不同于以上频段的信号;画出信号频谱图。 (7)将上述两段信号叠加,并加入干扰噪声,尝试多次逐渐加大噪声功率,对加入噪声的信号进行频谱分析;画出加噪后信号的时域波形和频谱图。 (8)选用一种合适的窗函数设计数字滤波器,画出滤波后音乐信号时域波形和频谱,对滤波前后的信号进行对比,回放音乐信号。 二、实验原理 1.设计原理分析 本设计主要是对语音信号的时频进行分析,并对语音信号加噪后设计滤波器对其进行滤波处理,对语音信号加噪声前后的频谱进行比较分析,对合成语音信号滤波前后进行频谱的分析比较。 首先用PC机WINDOWS下的录音机录制一段语音信号,并保存入MATLAB软件的根目录下,再运行MATLAB仿真软件把录制好的语音信号用audioread函数加载入MATLAB仿真软件的工作环境中,输入命令对语音信号进行时域,频谱变换。 对该段合成的语音信号,分别用矩形窗、三角形窗、Hanning窗、Hamming窗及Blackman窗几种函数在MATLAB中设计滤波器对其进行滤波处理,滤波后用命令可以绘制出其频谱图,回放语音信号。对原始语音信号、合成的语音信号和经过滤波器处理的语音信号进行频谱的比较分析。 2.语音信号的时域频域分析 在Matlab软件平台下可以利用函数audioread对语音信号进行采样,得到了声音数据变量y,同时把y的采样频率Fs=44100Hz放进了MATALB的工作空间。

《语音信号处理》实验报告材料

实用 中南大学 信息科学与工程学院 语音信号处理 实验报告 指导老师:覃爱娜 学生班级:信息0704 学生名称:阮光武 学生学好:0903070430 提交日期:2010年6月18日

实验一 语音波形文件的分析和读取 一、实验的任务、性质与目的 本实验是选修《语音信号处理》课的电子信息类专业学生的基础实验。通过实验: (1)掌握语音信号的基本特性理论:随机性,时变特性,短时平稳性,相关性等; (2)掌握语音信号的录入方式和*.WAV音波文件的存储结构; (3)使学生初步掌握语音信号处理的一般实验方法。 二、实验原理和步骤: WAV文件格式简介 WAV文件是多媒体中使用了声波文件的格式之一,它是以RIFF格式为标准。每个WAV文件的头四个字节就是“RIFF”。WAV文件由文件头和数据体两大部分组成,其中文件头又分为RIFF/WAV文件标识段和声音数据格式说明段两部分。常见的WAV声音文件有两种,分别对应于单声道(11.025KHz采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。采样率是指声音信号在“模拟→数字”转换过程中,单位时间内采样的次数;采样值是指每一次采样周期内声音模拟信号的积分值。对于单声道声音文件,采样数据为8位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位和低八位分别代表左右两个声道。WAV文件数据块包含以脉冲编码调制(PCM)格式表示的样本。在单声道WAV文件中,道0代表左声道,声道1代表右声道;在多声道WAV文件中,样本是交替出现的。WAV文件的格式见表1。

哈工程各个专业的详细介绍

各个专业的详细介绍: 1.船舶与海洋工程专业——专业简介 本专业始于中国人民解放军军事工程学院(简称“哈军工”)的海军工程系舰船设计专业。始终保持军工特色,设有船舶性能、船舶结构、船舶设计、潜器设计、海洋工程5个专业方向。本专业涉及面广,除数学、力学外,主要还有船舶与海洋工程水动力学、船舶与海洋工程结构力学、计算机科学、材料科学、机械制造学、焊接技术及管理工程等学科。 开设的主要课程:理论力学、材料力学、船舶与海洋工程流体力学、船舶与海洋工程结构力学、船舶与海洋工程静力学、船舶与海洋工程结构物阻力与推进、船体制造工艺、船舶设计与海洋工程结构物设计原理、船舶与海洋工程结构物强度与结构设计、计算机原理及应用、机械设计、电工电子技术等。 迄今为止,本专业已为我国船舶工业培养本科生5100余人。本专业具有世界先进水平的实验设备和测试手段,拥有大型实验室,其中“风、浪、流海洋环境模拟水池(50米×50米×30米)”拥有国内唯一的X—Y航车系统,“船模实验水池”长110米,配备有三维多板造波机、大型四自由度适航仪等先进设备,是ITTC成员单位;“工程结构实验室”为世界银行贷款建设;船舶CAD/CAM实验室拥有各类主流大型造船工程应用软件和结构分析软件,为广船国际等大型造船企业设立tribon软件培训中心。本专业是国内高校首家通过英国皇家造船师协会(RINA)的评估和认证的本科专业,每年提供20名免费学生会员名额,标志着本专业的教学和实验水平得到国际认同。挪威DNV船级社、法国BV船级社、日本NK船级社等国际主要的船级社和英国皇家造船师协会(RINA)在该专业设立奖学金。近年来,本专业与美国休斯敦“能源谷”紧密联系,共同创建了“深海工程技术研究中心”,目前该中心已入围我国“111工程”计划。2006年《科技时报》评选本专业全国综合排名第一。 本专业一些分支学科的研究水平和人才培养已达到国际先进水平。历年毕业生就业统计数据表明,本专业毕业生主要到与船舶和海洋工程有关的公司及国家各部委机关,以及沿海沿江各船舶设计院、研究所和造船骨干企业工作,部分取得留学资格,被选送到美国、加拿大、英国、挪威、德国、日本、希腊等国留学深造。本专业将为有志于我国船舶事业、海洋开发事业的青年提供一流的学习环境,完备的科学研究设施。 2.港口航道与海岸工程(暂无详细介绍) 3.土木工程专业介绍 培养掌握工程力学、流体力学、岩土力学和结构设计的基本理论和基本知识,具备从事土木工程项目的规划、设计、研究开发、施工及管理的能力,能在房屋建筑工程、公路与城市道路工程、桥梁工程、隧道与地下工程、机场工程等方面从事设计、研究、施工、教育、管理、投资和技术开发的高级工程技术人才。 开设的主要课程:理论力学、材料力学、结构力学、岩土力学、流体力学、混凝土结构、砌体结构、钢结构、房屋建筑学、土木工程施工技术、土木工程施工预算、工程

哈尔滨工程大学研究生学位论文答辩委员会决议的主要内容和参考格式(修订)

关于印发《哈尔滨工程大学研究生学位论文答辩委员会决议的主要内容和参考格式(修订)》的通知 研院函﹝2010﹞17号 各学院(系,部): 为规范研究生学位论文答辩工作,进一步完善我校研究生学位论文工作环节,学校于2008年11月印发了《关于印发<研究生学位论文答辩委员会决议的主要内容和参考格式>的通知》(研院函﹝2008﹞90号)。经过一年多的执行,有力地规范了研究生学位论文答辩。根据《研究生学位论文答辩委员会决议的主要内容和参考格式》的执行过程中出现的问题,结合我校学位论文答辩的实际情况,现修订后印发,请各学院(系,部)参照执行。 本通知自下发之日起执行。原《研究生学位论文答辩委员会决议的主要内容和参考格式》(研院函﹝2008﹞90号)文件同时废止。 附件:《哈尔滨工程大学研究生学位论文答辩委员会决议的主要内容和参考格式(修订)》 研究生院 2010年4月13日

附件: 哈尔滨工程大学研究生学位论文答辩委员会决议的 主要内容和参考格式(修订) 研究生学位论文答辩决议一般应包括以下5部分内容: 第1部分主要介绍该论文的选题、文献综述和论文研究的基本情况。如: 哈尔滨工程大学专业(博士,硕士,工程硕士,高校教师硕士,工商管理硕士,公共管理硕士等)研究生所完成的学位论文《》……………………。【说明:划线部分按照研究生的实际情况填写;括弧内的内容根据研究生的学位级别及学位类别进行选择;虚线部分应根据学位论文和论文答辩的实际情况对学位论文的选题、文献综述和研究情况等进行描述】 第2部分主要阐述该论文的新见解(新意)或创新点。如: 论文取得了下列研究成果: 1. 2. 第3部分主要应对论文的结构、逻辑、写作规范、研究方法等方面以及答辩情况做出评价,并说明是否达到研究生学位论文应有的学术水平。如: ………………………………。答辩委员会委员认为作者(具有,基本具有,不具有)坚实的基础理论和系统的专门知识,(具备,不具备)从事(博士为“独立从事”)科学研究工作的能力。【说明:虚线部分是“对论文的结构、逻辑、写作规范、研究方法等方面以及答辩情况做出的评价”;划线部分应根据论文和答辩的实际情况选择恰当的词语,如博士可填写“坚实宽广”、“系统深入”等;括弧内的内容根据研究生的学位级别、答辩委员会投票情况、专家评议情况进行

语音信号处理实验报告实验二

通信工程学院12级1班 罗恒 2012101032 实验二 基于MATLAB 的语音信号频域特征分析 一、 实验要求 要求根据已有语音信号,自己设计程序,给出其倒谱、语谱图的分析结果,并根据频域分析方法检测所分析语音信号的基音周期或共振峰。 二、 实验目的 信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分析和处理问题。另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更深入地说明信号的各项红物理现象。 由于语音信号是随着时间变化的,通常认为,语音是一个受准周期脉冲或随机噪声源激励的线性系统的输出。输出频谱是声道系统频率响应与激励源频谱的乘积。声道系统的频率响应及激励源都是随时间变化的,因此一般标准的傅立叶表示虽然适用于周期及平稳随机信号的表示,但不能直接用于语音信号。由于语音信号可以认为在短时间内,近似不变,因而可以采用短时分析法。 三、 实验设备 1.PC 机; 2.MATLAB 软件环境; 四、 实验内容 1.上机前用Matlab 语言完成程序编写工作。 2.程序应具有加窗(分帧)、绘制曲线等功能。 3.上机实验时先调试程序,通过后进行信号处理。 4.对录入的语音数据进行处理,并显示运行结果。 5.依次给出其倒谱、语谱图的分析结果。 6. 根据频域分析方法检测所分析语音信号的基音周期或共振峰。 五、 实验原理及方法 1、短时傅立叶变换 由于语音信号是短时平稳的随机信号,某一语音信号帧的短时傅立叶变换的定义为: 其中w(n -m)是实窗口函数序列,n 表示某一语音信号帧。令n -m=k',则得到 ()()()jw jwm n m X e x m w n m e ∞-=-∞= -∑

博士学位情况表-哈尔滨工程大学研究生院

附件2 申请博士学位人员基本信息表

答辩委员会决议 该部分内容请参照“关于印发《研究生学位论文答辩委员会决议的主要内容和参考格式》的通知(研院函[2010]17号)”文件书写(注:答辩委员会决议格式仅供参考,可另行撰写)。 根据《中华人民共和国学位条例》,答辩委员会共有x人,经答辩委员会无记名投票表决,x 票赞成,x 票弃权,x票反对。认为该论文(达到了,基本达到了,尚未达到)(工学,法学,管理学等)博士学位论文的水平,一致决定通过xx的博士学位论文答辩,同意xx毕业,并建议授予其(经济学,法学,教育学,文学,理学,工学,管理学等)博士学位。 攻读博士学位期间发表的论文和取得的科研成果 ①包含中文、英文两种情况,其中被SCI、EI、ISTP收录的,要求注明收录号;CSSCI来源期刊,在期刊名后标注“(CSSCI)”;CSCD来源期刊,在期刊名后标注“(CSCD)”。发表论文应注明与学位论文的相关性。 ②已录用的,最后加上“已录用”; ③已投稿但尚未录用的论文不要填写。 示例如下: [1]王二, 刘四等.船用柴油机排气消声器性能试验台的研制.内燃机工程(CSCD),2006(2):64-67页.(EI:2006249938292;对应论文3.3) [2]Yan Zhao, Zhi Li and Fe Sun. Rapid Transfer Alignment Based on Unscented Kalman Filter. 2007 American Control Conference, Minneapolis, MN, USA, June 14-16,https://www.wendangku.net/doc/e510510212.html,A:IEEE,2006: 215-220P (EI:20070542544245;对应论文4.2) [3]王二, 刘二等.船用柴油机排气消声器性能试验台的研制.内燃机工程(CSCD).已录用(对应论文5.1) … 说明:请用A4纸双面打印上述内容,限两张纸;每页右上角加盖院系教务办公章。

数字语音信号处理实验报告

语音信号处理实验报告 专业班级电子信息1203 学生姓名钟英爽 指导教师覃爱娜 完成日期2015年4月28日 电子信息工程系 信息科学与工程学院

实验一语音波形文件的分析和读取 一、实验学时:2 学时 二、实验的任务、性质与目的: 本实验是选修《语音信号处理》课的电子信息类专业学生的基础实验。通过实验 (1)掌握语音信号的基本特性理论:随机性,时变特性,短时平稳性,相关性等; (2)掌握语音信号的录入方式和*.WAV音波文件的存储结构; (3)使学生初步掌握语音信号处理的一般实验方法。 三、实验原理和步骤: WAV 文件格式简介 WAV 文件是多媒体中使用了声波文件的格式之一,它是以RIFF格式为标准。每个WAV 文件的头四个字节就是“RIFF”。WAV 文件由文件头和数据体两大部分组成,其中文件头又分为RIFF/WAV 文件标识段和声音数据格式说明段两部分。常见的WAV 声音文件有两种,分别对应于单声道(11.025KHz 采样率、8Bit 的采样值)和双声道(44.1KHz 采样率、16Bit 的采样值)。采样率是指声音信号在“模拟→数字”转换过程中,单位时间内采样的次数;采样值是指每一次采样周期内声音模拟信号的积分值。对于单声道声音文件,采样数据为8 位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16 位的整数(int),高八位和低八位分别代表左右两个声道。WAV 文件数据块包含以脉冲编码调制(PCM)格式表示的样本。在单声道WAV 文件中,道0 代表左声道,声道1 代表右声道;在多声道WAV 文件中,样本是交替出现的。WAV 文件的格式 表1 wav文件格式说明表

语音信号处理实验报告实验一

通信工程学院12级1班罗恒2012101032 实验一语音信号的低通滤波和短时分析综合实验 一、实验要求 1、根据已有语音信号,设计一个低通滤波器,带宽为采样频率的四分之一,求输出信号; 2、辨别原始语音信号与滤波器输出信号有何区别,说明原因; 3、改变滤波器带宽,重复滤波实验,辨别语音信号的变化,说明原因; 4、利用矩形窗和汉明窗对语音信号进行短时傅立叶分析,绘制语谱图并估计基音周期,分析两种窗函数对基音估计的影响; 5、改变窗口长度,重复上一步,说明窗口长度对基音估计的影响。 二、实验目的 1.在理论学习的基础上,进一步地理解和掌握语音信号低通滤波的意义,低通滤波分析的基本方法。 2.进一步理解和掌握语音信号不同的窗函数傅里叶变化对基音估计的影响。 三、实验设备 1.PC机; 2.MATLAB软件环境; 四、实验内容 1.上机前用Matlab语言完成程序编写工作。 2.程序应具有加窗(分帧)、绘制曲线等功能。 3.上机实验时先调试程序,通过后进行信号处理。 4.对录入的语音数据进行处理,并显示运行结果。 5. 改变滤波带宽,辨别与原始信号的区别。 6.依据曲线对该语音段进行所需要的分析,并且作出结论。 7.改变窗的宽度(帧长),重复上面的分析内容。 五、实验原理及方法 利用双线性变换设计IIR滤波器(巴特沃斯数字低通滤波器的设计),首先要设计出满足指标要求的模拟滤波器的传递函数Ha(s),然后由Ha(s)通过双线性变换可得所要设计的IIR滤波器的系统函数H(z)。如果给定的指标为数字滤波器的指标,则首先要转换成模拟滤波器的技术指标,这里主要是边界频率Wp和Ws 的转换,对ap和as指标不作变化。边界频率的转换关系为∩=2/T tan(w/2)。接着,按照模拟低通滤波器的技术指标根据相应设计公式求出滤波器的阶数N和3dB截止频率∩c ;根据阶数N查巴特沃斯归一化低通滤波器参数表,得到归一化传输函数Ha(p);最后,将p=s/ ∩c 代入Ha(p)去归一,得到实际的模拟滤波器传输函数Ha(s)。之后,通过双线性变换法转换公式s=2/T((1-1/z)/(1+1/z))得到所要设计的IIR滤波器的系统函数H(z)。

语音信号处理实验报告11

实验一 语音信号的时域分析 一、 实验目的、要求 (1)掌握语音信号采集的方法 (2)掌握一种语音信号基音周期提取方法 (3)掌握语音信号短时能量和短时过零率计算方法 (4)了解Matlab 的编程方法 二、 实验原理 语音是一时变的、非平稳的随机过程,但由于一段时间内(10-30ms)人的声带和声道形状的相对稳定性,可认为其特征是不变的,因而语音的短时谱具有相对稳定性。在语音分析中可以利用短时谱的这种平稳性,将语音信号分帧。 10~30ms 相对平稳,分析帧长一般为20ms 。 语音信号的分帧是通过可移动的有限长度窗口进行加权的方法来实现的。几种典型的窗函数有:矩形窗、汉明窗、哈宁窗、布莱克曼窗。 语音信号的能量分析是基于语音信号能量随时间有相当大的变化,特别是清音段的能量一般比浊音段的小得多。定义短时平均能量 [][]∑∑+-=∞-∞=-=-= n N n m m n m n w m x m n w m x E 122)()()()( 下图说明了短时能量序列的计算方法,其中窗口采用的是直角窗。 过零就是信号通过零值。对于连续语音信号,可以考察其时域波形通过时间轴的情况。而对于离散时间信号,如果相邻的取样值改变符号则称为过零。由此可以计算过零数,过零数就是样本改变符号的次数。单位时间内的过零数称为平

均过零数。 语音信号x (n )的短时平均过零数定义为 ()[]()[]()()[]()[]() n w n x n x m n w m x m x Z m n *--=---= ∑∞ -∞=1sgn sgn 1sgn sgn 式中,[]?sgn 是符号函数,即 ()[]()()()()???<-≥=01 01sgn n x n x n x 短时平均过零数可应用于语音信号分析中。发浊音时,尽管声道有若干个共振峰,但由于声门波引起了谱的高频跌落,所以其语音能量约集中干3kHz 以下。而发清音时.多数能量出现在较高频率上。既然高频率意味着高的平均过零数,低频率意味着低的平均过零数,那么可以认为浊音时具有较低的平均过零数,而清音时具有较高的平均过零数。然而这种高低仅是相对而言,没有精确的数值关系。 短时平均过零的作用 1.区分清/浊音: 浊音平均过零率低,集中在低频端; 清音平均过零率高,集中在高频端。 2.从背景噪声中找出是否有语音,以及语音的起点。 基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等。因为汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是一个十分重要的问题。 由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很宽,而同—个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情。基音提取的主要困难反映在:①声门激励信号并不是一个完全周期的序列,在语音的

哈尔滨工程大学专业历史历任院长

哈尔滨工程大学毕业证样本历任 校长 哈尔滨工程大学简介、乘车路线地址: 哈尔滨工程大学,始建于1953年的中国人民解放军军事工程学院(“哈军工”),现隶属于中华人民共和国工业和信息化部,由国防科工委、教育部、中国人民解放军海军、黑龙江省政府四方共建。从哈尔滨火车站到哈尔滨工程大学:站前广场乘坐6路南通大街站下车就到了。还有14、74路才四站就到南通大街上文化公园对过的哈工程大学站了。哈尔滨工程大学地址:黑龙江哈尔滨市南岗区南通大街145号。 哈尔滨工程大学历任校(院)长及任职年限: 冯捷:(1980.2至1983.6,任哈尔滨船舶工程学院院长);邓三瑞:(1983.6至1987.6,任哈尔滨船舶工程学院院长);吴德铭:(1988.10至1994.5,任哈尔滨船舶工程学院院长);(1994.5至1997.12,任哈尔滨工程大学校长);邱长华:(1997.12-2004.6,任哈尔滨工程大学校长);刘志刚:(2004年6月-现今,任哈尔滨工程大学校长)。 哈尔滨工程大学所设院系、专业学科: 哈尔滨工程大学设有船舶工程学院、动力与能源工程学院、水声工程学院、自动化学院等现设有船舶工程学院、航天与建筑工程学院、动力与能源工程学院、自动化学院、水声工程学院、计算机科学与技术学院、软件学院、国家保密学院、机电工程学院、信息与通信工程学院、经济管理学院、材料科学与化学工程学院、理学院、人文社会科学学院、国际合作教育学院、继续教育学院、核科学与技术学院、国防教育学院等18个学院。 哈尔滨工程大学历史变迁过程详解: 哈尔滨工程大学的前身是1953年创建的中国人民解放军军事工程学院。陈赓大将任军事工程学院首任政委兼院长。毛泽东主席为学院的成立颁发了训词。学院按军兵种设立空军工程系、炮兵工程系、海军工程系、装甲兵工程系、工程兵工程系五个系。1961年学院被确定为全国重点大学。1960年到1962年,学院进行了分建和改建。1966年4月,根据中央军委决定,“中国人民解放军军事工程学院”改名为“哈尔滨工程学院”,退出部队序列。 1970年,国务院、中央军委决定,哈尔滨工程学院海军工程系全建制及原军工其他各机关系部的部分干部教师调整归第六机械工业部(后为中国船舶工业总公司)领导,在“哈军工”原址组建哈尔滨船舶工程学院。1978年哈尔滨船舶工程学院被国家教委确定为全国重点院校。1994年4月,经国家教委批准,哈尔滨船舶工程学院更名为哈尔滨工程大学。1996年学校通过了“211工程”预审,成为国家“211工程”的首批建设学校之一。2002年教育部批准我校试办研究生院;2002年科技部教育部批准我校启动建设“国家大学科技园”;2002年国防科工委、黑龙江省政府确定我校实施重点共建。

新语音信号处理实验指导2015年秋

《语音信号处理》 实验指导书 哈尔滨理工大学 自动化学院 电子信息科学与技术系 2014.10

语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。同时,语言也是人与机器之间进行通信的重要工具,它是一种理想的人机通信方式,因而可为信息处理系统建立良好的人机交互环境,进一步推动计算机和其他智能机器的应用,提高社会的信息化程度。语音信号处理是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。虽然从事这一领域研究的人员主要来自信号与信息处理及计算机应用等学科,但是它与语音学、语言学、声学、认知科学、生理学、心理学等许多学科也有非常密切的联系。 20世纪60年代中期形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅立叶变换(FFT)等是语音信号数字处理的理论和技术基础。随着信息科学技术的飞速发展,语音信号处理取得了重大的进展:进入70年代之后,提出了用于语音信号的信息压缩和特征提取的线性预测技术(LPC),并已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域,以及用于输入语音与参考样本之间时间匹配的动态规划方法;80年代初一种新的基于聚类分析的高效数据压缩技术—矢量量化(VQ)应用于语音信号处理中;而用隐马尔可夫模型(HMM)描述语音信号过程的产生是80年代语音信号处理技术的重大发展,目前HMM已构成了现代语音识别研究的重要基石。近年来人工神经网络(ANN)的研究取得了迅速发展,语音信号处理的各项课题是促进其发展的重要动力之一,同时,它的许多成果也体现在有关语音信号处理的各项技术之中。 为了深入理解语音信号数字处理的基础理论、算法原理、研究方法和难点,根据数字语音信号处理教学大纲,结合课程建设的需求,我们编写了本实验指导书。

哈尔滨工程大学 语音信号处理实验报告

实 验 报 告 实验课程名称: 语音信号处理实验 姓名: 班级: 20120811 学号: 指导教师 张磊 实验教室 21B#293 实验时间 2015年4月12日 实验成绩 实验序号 实验名称 实验过程 实验结果 实验成绩 实验一 语音信号的端点检测 实验二 语音信号的特征提取 实验三 语音信号的基频提取

实验一 语音信号的端点检测 一、实验目的 1、掌握短时能量的求解方法 2、掌握短时平均过零率的求解方法 3、掌握利用短时平均过零率和短时能量等特征,对输入的语音信号进行端点检测。 二、实验设备 HP 计算机、Matlab 软件 三、实验原理 1、短时能量 语音信号的短时能量分析给出了反应这些幅度变化的一个合适的描述方法。对于信号)}({n x ,短时能量的定义如下: ∑ ∑∞ -∞ =∞ -∞ =*=-= -= m m n n h n x m n h m x m n w m x E )()()()()]()([222 2、短时平均过零率 短时平均过零率是指每帧内信号通过零值的次数。对于连续语音信号,可以 考察其时域波形通过时间轴的情况。对于离散信号,实质上就是信号采样点符号变化的次数。过零率在一定程度上可以反映出频率的信息。短时平均过零率的公式为: ∑∑-+=∞ -∞=--= ---=1)] 1(sgn[)](sgn[2 1 ) ()]1(sgn[)](sgn[21N n n m w w m n m x m x m n w m x m x Z 其中,sgn[.]是符号函数,即 ? ? ?<-≥=0)(10)(1 )](sgn[n x n x n x

【哈尔滨工程大学排名】哈尔滨工程大学特色专业-哈尔滨工程大学录取分数线

【哈尔滨工程大学排名】哈尔滨工程大学特色专业-哈尔滨工程大学录 取分数线 哈尔滨工程大学坐落于美丽的松花江畔——北国冰城哈尔滨市。学校是首批入选国家“211工程”建设和设有研究生院的全国重点大学,是我国“三海一核”(船舶工业、海军装备、海洋开发、核能应用)领域重要的人才培养和科学研究基地。哈尔滨工程大学具有光荣的历史传统,前身是创建于1953年的中国人民解放军军事工程学院(“哈军工”)。1970年,在哈军工原址,以海军工程系全建制及其它各系(部)部分干部教师为基础,组建哈尔滨船舶工程学院,1994年更名为哈尔滨工程大学。1978年,学校被国务院确定为全国重点大学;1982年成为首批具有博士、硕士学位授予权的单位;1996年进入首批“211工程”建设高校行列;2002年由教育部批准设立研究生院;2007年,由国防科工委、教育部、黑龙江省政府、海军四方共建。学校现隶属于工业和信息化部。学校占地面积126.1万平方米,建筑面积96.7万平方米。校园建筑中西合璧,飞檐碧瓦,气势恢宏。现设有船舶工程学院、航天与建筑工程学院、动力与能源工程学院、自动化学院、水声工程学院、计算机科学与技术学院、机电工程学院、信息与通信工程学院、经济管理学院、材料科学与化学工程学院、理学院、人文社会科学学院、核科学与技术学院、国际合作教育学院、继续教育学院、国防教育学院、软件学院、国家保密学院等18个学院,以及外语系、工程训练中心、体育军事训练部等3个教学系部、中心;设有40多个科研机构以及150多个科研和教学实验室,其中国家级重点实验室2个,国防重点学科实验室2个,国家级学科创新引智基地2个,国家电工电子教学基地1个,国家级实验教学示范中心4个,国家大学生文化素质教育基地1个。图书馆共有藏书256.9万册。学校具有“三海一核”领域主体学科特色鲜明、相关学科整体配套、专业结构布局合理的学科专业体系。现有本科专业58个,硕士学位授权点95个(含MBA、MPA、EMBA),工程硕士领域22个,一级博士学位授权学科6个,二级博士学位授权学科25个,博士后科研流动站11个,博士后科研工作站1个,学科专业涉及7个学科门类和37个一级学科。其中,国家重点学科一级1个、二级1个,国防科工委“十五”重点学科7个、“十一五”国防特色学科11个、“十一五”国防特色专业7个;“十一五”期间黑

相关文档
相关文档 最新文档