文档库 最新最全的文档下载
当前位置:文档库 › 基于频谱包络算法的语音转换研究_徐欣

基于频谱包络算法的语音转换研究_徐欣

基于频谱包络算法的语音转换研究_徐欣
基于频谱包络算法的语音转换研究_徐欣

123

1、引言

语言是思维和交际工具,与思维有着紧密的联系,是思维的载体和表现形式。语言是一种社会现象,是人类最重要的交际工具,是进行思维交流和传递信息的工具。语言是语音信号的一种表达形式。而语音转换是要改变一个说话人的语音,使之听起来象是另外一个人的语音。语音转换可以分为两种方式:一种是通过改变源说话人音色特征,使其尽可能符合目标说话人的声音特征,保持语义内容等信息不变,从而达到源说话人和目标说话人的语音的转换;另外一种是将男子声音到女子声音的相互转换,或者是小孩和老人声音的转换,这种类型的转换相对较简单,大多是基于语音波形的直接修改。语音转换又分成训练、转换和合成三个阶段。语音转换系统通过改变语音信号的声学特征参数来调整语音。语音信号可看作由声门激励信号与声道共振滤波特性相互作用得到的,声道的共振滤波特性不仅与语音信号的语义信息有关,还与语音的个性信息有着密切的关系,所以声道的共振滤波特性是语音信号中很重要的部分,而语音转换的其中一个重要的内容就是声道共振滤波特性的转换。也就是说如果需要有效的进行语音转换那么首先要对对声道共振滤波特性进行准确的表示,对其转换可以分为参数法(parametric)和非参数法(non-parametric)。对语音信号共振峰带宽、幅度、频率和频谱倾斜等参数首先提取然后再分别加以转换的方法就是参数法;非参数转换是指将语音信号共振峰带宽、幅度、频率和频谱倾斜等参数先作为谱包络的一个整体再进行转换。

谱包络的这种表示包含了很多方法,其中有基于由幅度谱得到的离散余弦倒谱和MFCC倒谱,也有基于LPC分析的LPC推导参数表示法等。对于谱包络部分,频谱包络的共振峰与由LPC系数得到LSF能对应起来,最后达到准确有效的语音转换;通过LPC系数得到的伪对数面积比(PLAR)可以与声道的生理结构对应,通过对PLAR和PARCOR的转换也可以实现对LPC频谱包络的转换。语音信号在频域中被分解成激励部分和谱包络部分,在谱包络部分中用倒谱表示,在对谱包络转换时通过转换倒谱来实现,从而达到有效的转换。

2、语音转换Matlab仿真

此次仿真是利用上述知识分别对音频文件进行了改变基频以

及变速变调的处理。

基频转换仿真使用的音频是wav格式的。需要先将音频信号经wavread函数转换成Matlab列数组变量;用Matlab强大的运算能力进行数据分析和处理;处理后的数据如是音频数据,则可用wavread转换成wav格式文件或用sound,wavplay等函数直接回放。使用的方法是通过改变基频然后时长规整的方式来达到目的。

首先更改基频:通过资料的查询和整理,可以知道不同人的基频不同统计如下:正常成年男声:0~200Hz;正常成年女声:200~450Hz。女声基频=男声基频*1.5。在程序中,通过抽样与插值的方式来达到基频的改变,使男声转变为女声。用整数D对语音信号X(n)进行抽取:Xd=X(Dn);然后将X(n)的抽样频率提高到I(整数)

倍 ,即为对X(n)的插值:D/I=3/2。再进行时长规整,通过抽样插

值来改变基频也使播放速度发生改变,程序中使用重叠叠加法达到时长规整,恢复播放速度和时间。将原始信号以帧长N,帧间距Sa进行分解,然后以帧间距Ss进行合成。Sa与Ss的的比值决定了时长规整因子F=Sa/Ss。为保证重叠区域幅度不变,加了汉明窗。程序设计中注意从输入序列中截取的语音段的起点是在原先的起点的基础上向后延时Sa个点。

主要程序段:

for ypos=Wsi

m:Ss:(ypts-W);%将这W个点中的前Wov个点与输出序列的最后Wov个点进行比较,比较它们之间的一致性 

if (kmpred<=Kmax) km=kmpred; else 

rxy=zeros(1, Kmax+1); rxx=zeros(1, Kmax+1); for k=Kmin:kdecim:Kmax end 

Rxy=(rxx ̄=0).*rxy./(rxx+(rxx==0)); km=min(find(Rxy==max(Rxy))-1);%比较得到一致性最好的点,即第m个窗口的移动量 end 

Y(ypos+ovix)=((1-xfwin).*Y(ypos+ovix))+(xfwin.*padX(Wsim+xabs+ovix)); 

%窗口中前Wov个点以加权方式叠加 Y(ypos+newix)=padX(Wsim+xabs+newix); %将剩余的点补充到输出序列中去 end 

原始的音频文件是一个男声的,经过采样频率变换使基频改变之后,得到的是一段女声版的音频。Matlab仿真结果如下图所示:

图1 语音转换前后语音信号对比图

基于频谱包络算法的语音转换研究

徐欣 李枚亭

(南京邮电大学地理与生物信息学院 江苏南京 210046)

摘 要:语音转换是语音信号处理领域的一个较新的分支,具有很重要的理论和实用价值。本文介绍了语音转换中频谱包络的内容,设计了MATLAB语音转换程序,通过改变基频以及变速变调达到男女声音信号转换等效果,并通过仿真结果分析这种语音转换的特点。

关键词:语音转换 频谱包络 MATLAB中图分类号: TP391文献标识码:A 文章编号:1007-9416(2011)09-0123-03

124

图2 语音转换前后的频谱图比较

通过改变采样频率,使基频得到了改变。从听觉效果上,这种改变成功的使男生变成了女声,但是,从收听效果的感觉上,略微有点失真。

图1是语音转换前后的声音信号的对比图,上面的图是未转换之前的原声,下面的是转换之后的声音。从图中可以看出,经过语音转换之后,在某些部位出现了失真的现象,但是总体上的效果还是很好的。

图2是语音转换前后的频谱图的比较,可以看出,语音转换的效果还是比较理想的。

下面我们用PLAR曲线改变的方法,对上例中的语音进行了仿真处理,转换之后的图形如下所示:

图3 变换前后的PLAR系数图

图4 PLAR曲线改变语音转换的波形对比图

本次仿真从听觉角度来说,基本听不清楚语音转换之后的声音,只是偶尔蹦出几个模糊不清的字。从图4可以得知,经过语音转换之后,信号失真很严重,效果非常的差。

语音的变调与变速的仿真实验是对PCM语音文件进行的变调与变速处理。

程序中的几个参数:FL:帧长WL:窗长P:预测系数个数s:载入语音L:读入语音长度FN

:帧数A:预测系数。具体Matlab实验图形如下:

图5 第27帧极点与原极点对比图

图6 激励信号,原始语音和重建语音的波形对比

在图5中,通过对比变调后的第27帧极点与原极点观察,零点和极点都在单位圆内,属于因果稳定的滤波器。

通过对激励信号,原始语音和重建语音的声音和波形对比分析,激励信号的音质听起来不是很清楚,但是最后合成的语音效果和原始语音差不多。从图6中我们也可以看出,重建后的语音的波形图与原始语音基本一致。

图7 变速语音激励与重建语音信号

125

图8 变调语音激励与重建语音信号

变速后的语音变的抑扬顿挫,但是略有失真。第一个字明显被加强,而最后几个字则被弱化。从图7中也可以看出,刚开始的时候波形突然变得陡峭,而后面的部分都比原语音的波形要平坦。变调后声音有点失真,听起来就像男的学女的说话。从图8中可以看出,波形变得尖锐陡峭。

3、结语

用不同的方法都能进行语音转换,但是得到的效果并不相同,一种好的算法对于语音转换来说非常重要。语音转换的研究对语音分析、语音编码、语音合成、语音识别、说话人识别等语音信号处理的其它各个领域有重要的促进作用。例如伪装说话人身份;用于语音增强系统,帮助声带等发音器官存在病变或者损伤的病人恢复正常语音;用于文-语转换系统中,合成出不同说话人个性特征的语音;在电影配音中,通过语音转换,能还原原演员的音效,增强电影

的效果;在语音识别领域,说话人自适应和说话人归一化的问题是一个非常重要的研究课题。通过语音转换技术,可以提高系统的鲁棒性;在通信领域,可以用来提高极低速率编码的语音质量;可以用于机器语言翻译系统等。参考文献

[1]孙俊.基于激励源及其韵律特征的源—目标说话人声音转换研究[D].中国科学技术大学,2006.

[2]刘金凤.基于DSP的语音转换系统研究[D].吉林大学,2006.

[3] 赵恒,李冬梅,张玉宏.MATLAB环境下的基于GMM模型的说话人识别系统[J].微计算机信息,2007,31:262-263.

[4]胡益平.基于GMM的说话人识别技术研究与实现[D].厦门大学,2007.

[5]张剑,戴蓓蒨,孙俊,陆伟,李辉.基于分类线性加权的源-目标话者声音转换算法的研究[J].电路与系统学报,2008.03.

[6]宋鹏.说话人语音转换技术的研究[D].东南大学,2009.

[7]王薇,杨震.基于GMM的语音转换系统性能研究[C]//第十四届全国信号处理学术年会(CCSP-2009)论文集.湖南长沙:中国电子学会信号处理分会.2009:175-178.

[8]潘渊.声音转换及相关技术的研究[J].今日科苑,2010.(22):113.[9]赵义正.改进GMM谱包络转换性能的语音转换算法研究[J].科学技术与工程,2010,17:4172-4174.

[10]辛全超.基于GMM的说话人语音识别研究与实践[D].华东师范大学,2010.

[11]张凯,朱立新,赵义正.基于重训练高斯混合模型的语音转换方法[J].声学技术,2010,01:52-55.基金项目

国家自然科学基金项目(编号60872105);南京邮电大学青蓝基金项目(编号NY210047)

在用NLMS等一系列算法对 w(n)进行权值的更新过程中,有一个问题是很关键的,那就是双端的判决,其作用主要是判决通信的双方在某一时刻是谁在说话,其判决的结果有四种:“静音”,“远端”,“近端”和“双端”。双端判决在回声消除器中非常重要,它决定着整个系统的对于信号的响应方式。为了解决双端的问题,大多数的技术[1][2][3]选择在双端期间停止滤波器更新,本文是采用基于信号间相关性的方法来进行双端检测,这个相关性为远端信号和麦克风输入信号之间的相关性,计算出相关性结果之后,再将它与预设定好的阈值进行比较,之后得出判决结果。

2、仿真结果

在仿真过程中,采用了图(2)所示的序列信号作为实际的房间脉冲响应向量 h(n),此序列是用实验采集到的真实的房间脉冲响应序列。图(3)为回声消除的仿真结果, ()x n 和 ()y n 为实验语音,均为实际人说话的语音,采样率为8 kHz ,单通道语音。 ()x n 是远端语音信号, ()y n 为麦克风采集到的语音信号,它包括了近端说话人语音和回声信号。图(3)中的)(n e 为回声消除之后的结果信号,此时)(n e 已经只包含了近端说话人的语音信号。

3、结语

自适应算法中最简单、运算量最小的是以LMS为代表的一类算法,如NLMS算法;另一类是以RLS等为代表的各种算法,这类算法运算量很大。在回声消除各种自适应滤波算法中,根据实际应用,

还有很多地方需改善,比如各种参数的选择,而且要更好地解决收

敛速度和稳态残留误差之间的矛盾,实现较理想稳定的回声消除效果还存在很多难点,期望能提出更好的改进算法。

另外,除了居于核心地位的自适应滤波技术外,实际回声消除技术应用系统中还包括双端检测、舒适噪声产生、残留回波的非线

性处理技术等。例如在双端检测这块,文章[4]

就提出了一种新颖的无双端方法;文章[5]则从语音信号分频段的角度考虑,利用子带技术对回声信号进行处理。总之,回声消除的各种技术都可以改进,这样整个回声消除器才能实现一个良好的回声消除效果。参考文献

[1]Gansler T, Hansson M, Ivarsson C J, et al . A double-talkdetector based on coherence [J]. IEEE Transaction OnCommunications, 1996, Vol 44 : 1421-1427.

[2]Ye H, Wu Bo-Xiu. A new double-talk detection algorithm basedon the orthogonality theorem[J],IEEE Transaction OnCommunications, 1991,Vol 39:1542-1545.

[3]Benesty J, Mogan D R, Cho J H. A new class of doubletalkdetectors based on cross-correlation[J]. IEEE Transaction OnSpeech And Audio Processing, 2000,Vol 8(2):168-172.

[4]谢鹏,刘加.采用变步长算法的无双端检测回声消除系统.数据采集与处理[J].2010.11 Vol25 No.6.

[5]谢鹏,刘加.子带仿射投影及子带双端检测算法的回声消除系统.通信技术[J].Vol 43, No.03,2010.

??????上接第122页

包络解调法及其诊断

包络解调法及其诊断 包络解调法是故障诊断中较常用的一种方法,它可非常有效地识别某些冲击振动。从而找到该冲击振动的振源。例如,当轴承或齿轮表面因疲劳或应力集中而产生剥落和损伤时,会产生周期性的冲击振动信号,如图4—25所示。 从图4—25个可以看出,信号包括两部分:—部分是载频信号,即系统的自由振荡信号及各种随机干扰信号的频率,是图形中频率成分较高的信号;第二部分是调制信号,即包络线所包围的信号。它的频率较低,多为故障信号。 因此.若要对故障源进行分析,就必须把低频信号(或调制信号)从高频信号(或载频信号)中分离出来。这一信号分离、提取过程,被称为信号的包络解调。对分离提取出来的包络信号进行特征频率和幅度分析,就能准确可靠地诊断出如轴承和齿轮的疲劳、切齿、剥落等故障。

目前分析高频冲击的有效方法之一是共振解调(包络处理),即取振动时域波形的包络线,然后对包络线进行频谱分析。由于包络线处理可找出反复发生振动的规律,根据轴承的特征频率,就可诊断出轴承或齿轮故障的部位。研究表明,当轴承或齿轮无故障时,在共振解调频谱中没有高阶谱线;有故障时,共振解调频谱中出现高阶谱线。 当齿轮发生疲劳裂纹时,齿轮刚度的变化会引起齿轮振动噪声信号瞬时频率(相位)和幅值的变化。但裂纹由于只影响齿轮刚度,齿形无大变化,故振动噪声信号在频域中无明显征兆,因此频谱分析对裂纹诊断基本无效。可采用时域平均法分析。如果齿轮同时存在其它类型的故障,则时域平均法的可靠性不高。此时可试用希尔伯特变换或自适应滤波技术提取相位信息,也可试用共振解调分析技术即包络谱分析法。 一、包络分析法进行故障诊断的原理 当轴承或齿轮某一元件表面出现局部损伤时,在受载运行过程中

什么是包络频谱

什么是包络频谱? 假设旁边的时间信号是由啮合齿轮的振动引起的。 这个信号是传送力引起的。它从一个齿轮牙传到另一个齿轮牙。 如果牙与牙的传送力是一样,那么整个周期的振动值就是想同的。 正常振动的频谱只会有一种频率,那就是啮合频率 啮合频率(F)=转频(T)X 牙数(N) 如果齿轮节径和轴的中心不在同一位置。那么牙与牙之间的距离就会改变,相应的传送力也会改变。 齿轮啮合频率 F 该谱显示两种频率,一是啮合频率,二是轴的转频 它会产生啮合频率的幅值波动

什么是包络分析 该信号包含一个稳定的啮合频率, 还有一个由轴转速引起的波动信号 如果我们使用只测量波动信号的仪器,那么就会产生旁 边的信号 这个频谱强调了波动信号,使稳定信号 影响最小。在新的频谱中轴的波动是支配信号,而不是在正常振动的啮合频率 信号。 这就是包络频谱 。 我们要看到高频振动的波动最好使用加 速度,单位是 “g”,当频率增加,加速度的信号值就会增加。 包络信号由自己的单位 “gE” (包络加速度). 包络信号值是由多少个产生原始信号的波动故障决定的,而不是由故障的严重程度决定。所以不同测点进行比较就会很困难,而同一测点的包络频谱可以进行比较。 齿轮啮合 轴转速波动 轴转速波动 轴转速波动 F

“包络” 谱图的术语不是对信号处理过程的确切描述,但仍是我们为了简化时所用的术语。 包络谱和传统的频谱在外观上(振幅和频率)并没有区别只是表示不同的信息 包络谱图对正弦运动不敏感–而不象FFT图能用位移,速度和加速度参数确定简单正弦运动产生的复杂信号。 包络谱对与冲击力相关的事件敏感。 量化冲击频率和强度对振动分析是非常有帮助的。尽管有些机器会产生冲击能量(如往复设备), 但大多数机器不会。冲击力是破坏性的,通常表明会发生故障。最典型的包络谱图应用是检测轴承缺陷。 什么是包络信号,如何得到? (1)测量的振幅单位是加速度但信号的处理区别于传统的加速度信号。 (2)振幅单位由厂商自己定–每一个都有自己的名字,或是单位的首写字母。 例如: CSI (Emerson) 使用峰值;Entek (Rockwell Automation)使用gSE (脉冲能–缩略为IRD) ;SKF 使用HFD (高频域) 和ESP (包络信号处理–缩略为DI) (3)使用滤波器处理信号,强调可能发生的每一种冲击力。 滤波器有两个等级: 包络滤波器–这种类型的滤波器设置包络的频率,包括了高频(Fmax)和低频(Fmin)。发生的任一振动超出此范围都会被过滤掉。 高通滤波器–这种类型的滤波器取消了高频Fmax限制,但仍有Fmin限制,过滤低于它的振动频率。 每一个厂商设置自己的信号处理和滤波器。因此, 尽管它们都提供类似的信息, 但在振幅范围内是不能直接相比的。 (4)信号处理集中在短时冲击信号上(时域信号的脉冲),在这种情况下FFT处理往往“失效” (更准确的说是“更难发现”) 因为它适合处理平稳信号。

震动测试第9章 包络分析

包络谱分析?什么是“包络”谱图??如何区别对待? ?轴承缺陷模拟放大器?“冲击能”是这样产生的??冲击能如何影响FFT ??包络谱能提供什么信息??轴承缺陷之外“冲击源" ??警语

什么是“包络谱”图? Y-轴单位: 振幅 X-轴单位: 频率(cpm or Hz)

“包络”谱图的术语不是对信号处理过程的确切描述,但仍是我们为了简化时所用的术语。 包络谱和传统的频谱在外观上(振幅和频率)并没有区别-只是表示不同的信息 包络谱图对正弦运动不敏感–而不象FFT图能用位移,速度和加速度参数确定简单正弦运动产生的复杂信号。 包络谱对与冲击力相关的事件敏感。 量化冲击频率和强度对振动分析是非常有帮助的。尽管有些机器会产生冲击能量(如往复设备), 但大多数机器不会。冲击力是破坏性的,通常表明会发生故障。最典型的包络谱图应用是检测轴承缺陷。

包络谱图的处理过程? 什么是包络信号,如何得到? (1)测量的振幅单位是加速度但信号的处理区别于传统的加速度信号。 (2)振幅单位由厂商自己定–每一个都有自己的名字,或是单位的首写字母。 例如: CSI (Emerson) 使用峰值;Entek(Rockwell Automation)使用gSE(脉冲能– 缩略为IRD);SKF 使用HFD (高频域) 和ESP (包络信号处理–缩略为DI)(3)使用滤波器处理信号,强调可能发生的每一种冲击力。 滤波器有两个等级: 包络滤波器–这种类型的滤波器设置包络的频率,包括了高频(Fmax)和低频(Fmin)。发生的任一振动超出此范围都会被过滤掉。 高通滤波器–这种类型的滤波器取消了高频Fmax限制,但仍有Fmin限制, 过滤低于它的振动频率。 每一个厂商设置自己的信号处理和滤波器。因此, 尽管它们都提供类似的信息, 但在振幅范围内是不能直接相比的。 (4)信号处理集中在短时冲击信号上(时域信号的脉冲),在这种情况下FFT处理往往“失效”(更准确的说是“更难发现”) 因为它适合处理平稳信号。 (5)如果冲击间隔一致(如冲击力有规律地发生), 那么这段时间间隔就会转化 成理想的频率单位(Hz or cpm)。 (6)可以估算冲击强度,这与冲击脉冲信号和背景噪声之比有关。 (7)相应频率的振幅峰值显示在频谱上。 包络谱提供给我们一种位移、速度和加速度谱不可能比是的有价值的信息,它为分析专家提供了另一种有力工具。

EMD包络谱故障分析

EMD 分解后的原始信号及频谱 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 010002000 3000 4000 5000 6000 0.050.1 0.15 0.2 原始信号频谱 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 -0.4 -0.200.20.4原始信号时域波形 0.02 0.04 0.06原始信号频谱 从时域图中可以看到较为明显的周期性冲击,但是故障特征不明显。在频谱当中,亦存在较为明显的边频带以及很多共振频率,这些冲击大都是电机转数的倍频。

原始信号的包络 1000 2000 3000 4000 5000 6000 00.010.020.03 0.04原始信号包络谱 100 200 300 400 500 600 求信号的包络谱,明显看出转速及其二倍频。 EMD 分解 0.1 0.2 0.3 0.4 0.50.6 0.7 0.8 0.9 -0.200.2IMF1时域波形图 00.10.20.30.4 0.50.60.70.80.9 -0.200.2IMF2时域波形图00.10.20.30.4 0.50.60.70.80.9 -0.200.2IMF3时域波形图00.10.20.3 0.40.50.60.70.80.9 -0.200.2IMF4时域波形图00.10.20.3 0.40.50.60.70.80.9 -0.100.1IMF5时域波形图00.10.2 0.30.4 0.5 0.60.70.80.9 -0.05 00.05IMF6时域波形图

IMF 分量的频谱 00.05 IMF1频谱 00.01 0.02IMF2频谱 0100020003000400050006000 00.005 0.01IMF3频谱 00.01 0.02IMF4频谱 00.005 0.01IMF5频谱 0100020003000 400050006000 0.005 0.01IMF6频谱 IMF 分量的包络 100 200 300 400500600700 800 900 1000 00.05IMF1包络谱 01002003004005006007008009001000 00.010.02IMF2包络谱 01002003004005006007008009001000 00.005 0.01IMF3包络谱 01002003004005006007008009001000 00.010.02IMF4包络谱 0100 2003004005006007008009001000 0.005 0.01IMF5包络谱 100 200300400 500 600 7008009001000 05-3IMF6包络谱 从上图可以看出,也有电机转速的及其倍频处的冲击。

文字转换语音免费软件【操作流程】

文字转换语音免费软件【操作流程】 这年头爱看网络小说的人是越来越多了,但是,那密密麻麻的文字让人看着看着就头昏眼花了,于是就出来了一款可以将文字转换成语音的软件(狸莴文字转换语音软件)这款软件不仅可以用来听网络小说,学外语,读新闻,校对文章,还可以制作有声小说音频(支持导出mp3与及wav格式的声音),用处大大滴!安装后运行该软件。 运行软件后添加一个txt文档(建议大家把小说以及新闻等都复制粘贴到txt文档)进来试听一下。在软件右下角有添加按钮,点击添加txt文档。 双击添加进来的文档就可以听到声音了,播放、停止等功能按钮都在左边,可以按个人需要点击使用。

播放时突然听到一声猪一般惨叫:奥买噶!(别说这是你的猪叫声哈!)为什么读的是英文,明明添加进来的是中文文字?淡定!原因就是这款软件只能用电脑系统自带的语音库,而系统自带的语音库就默认是英语。 解决办法就是下载安装一个中文语音库,回到软件主界面,点击下载语音库按钮进入网页下载页面,找到“cn-Hui-y”(这个语音库相对声质比较好)之后进行点击下载。 下载之后解压安装,这里有个需要注意的问题,就是语音库安装包不能解压到中文名字 的文件夹,否则会导致语音库无法正常运行,谨记!然后打开应用程序,点击启动语音库服务。 接着回到软件主界面,点击刷新语音库,然后再点击播放按钮试听一下,这回读的不是英文了吧,而是大家再熟悉不过的中文了,真的是太神奇了!谢谢你那感谢的目光,也谢谢各位的捧场,以后有好东西都会跟大家分享滴,嘎嘎~~~

软件还有很多功能,比如分角色朗读,需要用到这个功能键的朋友就要多下载几个语音库来安装了,我相信爱看小说的你肯定用得上,哈哈!这里就不做具体操作了。 软件还支持插入背景音乐,在朗读的同时还支持录音等这些功能,感兴趣的朋友不妨亲自去体验尝试,设置出令自己满意的效果。想想那煽情动人的小说再配上那催人泪下的背景 音乐,天呐!我都要落泪啦,软件的功能还真是强大。 相信你已经学会了如何操作这个软件了,这款把狸涡文字变语音软件还是很方便的,不仅仅用来听小说,还能听新闻;对于学习英语的学生,或是学者都适用,能帮助你矫正发音,再也不用花钱去买那啥英语学习机了;上课的老师还可以用来朗读文章给学生听,哎呀呀,这用处真的是大大滴!

基于LabVIEW的包络谱分析在齿轮箱故障诊断中的研究

龙源期刊网 https://www.wendangku.net/doc/bf795337.html, 基于LabVIEW的包络谱分析在齿轮箱故障诊断中的研究 作者:李旗朱成俊 来源:《中国科技博览》2017年第25期 [摘要]齿轮箱在运行时的故障振动信号往往表现出非线性与非平稳性并且以调制的形式存在,基于此本文结合LabVIEW强大的信号处理功能和包络谱分析在处理调制信号的优点,将其应用到齿轮箱的故障诊断中,通过实验结果表明:基于LabVIEW的包络谱分析能够有效的辨别出齿轮箱的故障信息。 [关键词]故障诊断;包络谱;LabVIEW;齿轮箱 中图分类号:TH165.3 文献标识码:A 文章编号:1009-914X(2017)25-0127-01 齿轮箱是机械设备的重要组成部件,如果发生故障,往往会产生不可逆转的破坏,因此对其进行故障监测具有重要的价值。但是由于齿轮箱在运行时环境的复杂性,其振动信号往往表现出非线性和非平稳性,很难对其进行直接分析判断,而传统的傅里叶变换只适合应用于处理平稳信号,已经不适合用于对齿轮箱进行监测。因此需要找到其它的适合处理非平稳信号的算法,基于此刘自然提出了先用EMD将信号进行分解后,提取出表示齿轮箱故障特征的IMF,然后进行倒频谱分析,该方法准确的判断出了齿轮箱的故障信息。本文以LabVIEW为开发环境,设计了包络谱分析的齿轮箱故障诊断系统,将其应用到齿轮箱的故障诊断中。 1 包络谱分析基本原理 包络谱分析是针对非平稳调制信号的处理算法。对比传统的傅里叶变换,包络谱分析算法不仅改进在处理信号方式的算法,而且在处理的过程中有所加强。在包络谱分析之前对所需处理的信号进行带通滤波可以消除低频成分对信号分析时候的影响,有利于提取出所需的低频调制信号。对经过包络谱分析变换处理后得到的包络谱分析图进行分析可以诊断机械的故障类别。对信号进行包络谱分析时需先对进行Hilbert变换,其公式为 包络谱分析是诊断机械设备零件损伤的一种有效方法,经常把它应用到对轴承故障检测,现将其应用到齿轮箱诊断中。先通过数据采集卡采集齿轮箱振动信号,对其进行高通或带通滤波处理,对处理后信号进行包络谱分析,判断齿轮箱故障(图1)。 2 包络谱分解的LabVIEW实现 LabVIEW是NI公司开发的图形化编程语言,包含很多信号处理工具包,为信号处理提供了很大帮助。LabVIEW在工程上的应用越来越突出,本文结合LabVIEW编写关于包络谱分析

包络线和包络谱计算程序

%一个求包络线和包络谱的程序 %现代希尔伯特变换解调分析: %带通滤波;希尔伯特变换获得信号时域的包络线;用fft变换获得包络谱 %如何获得包络线? %信号经希尔伯特变换不能直接得到包络,设信号x的希尔伯特变换为y,则平方和 %x.^2+y.^2(或者再开根号,直接取平方和的效果为好)才是信号x的包络。 %构造实验数据 clear all;close all; t=0:0.005:1*pi; fs=10000; s=4*sin(2*200*pi*t).*(sin(2*4500*pi*t))+25*(sin(2*4500*pi*t)); figure(1); subplot(211);plot(t,s);title('原始信号'); %运用小波方法滤波 [c,l]=wavedec(s,1,'db10'); d1=wrcoef('d',c,l,'db10'); a1=0; subplot(212);plot(d1);title('滤波后重构的高频信号'); %希尔伯特变换求包络线 y=hilbert(d1); y1=abs(d1+y*j); %这是取得包络线的三种方程。看一看哪种效果好。 %y1=abs(y); %或者z=x.^2+y.^2; 有的取得是abs(y),但是不推荐用。%y1=d1.^2+y.^2; %通过分析,该方程在包络谱中的效果最好,即取二者平方和。 figure(2); subplot(211); hold on plot(t,s); plot(t,y1,'r');title('包络线'); hold off %FFT求包络谱 N=1024; p=abs(fft(y1,N)); subplot(212); plot((0:N/2-1)/N*fs,p(1:N/2));%只需取到半频,即fs/2 %f=(0:N-1)*fs/N; plot(f,p); %横坐标是在fs上,其中以fs/2为轴中心对称。 title('包络谱');xlabel('频率');ylabel('功率谱'); %对比信号直接的傅里叶变换功率谱与包络谱

基于EMD包络功率谱滚动轴承故障诊断

基于EMD的包络功率谱滚动轴承故障诊断

摘要 本文简要介绍了滚动轴承的故障特征及判定方法,并基于经验模态分解EMD(Empirical Mode Decomposition)与功率谱相结合的方法。将原始信号分解成不同尺度的固有模态函数IMF(Intrinsic Mode Function),求取IMF分量的包络,计算其包络功率谱,得到轴承的故障特征频率,进行诊断。 关键词:滚动轴承;故障诊断;EMD;包络功率谱

Abstract This paper briefly introduces the method of judging and fault features of rolling bearing, and based on empirical mode decomposition EMD (Empirical Mode Decomposition) method combined with power spectrum. The original signal is decomposed into different scales of intrinsic mode function IMF (Intrinsic Mode Function), the envelop take IMF components, calculate the envelope power spectrum, get the fault characteristic frequency of bearing, diagnosis. Keywords: rolling bearing; fault diagnosis; EMD; envelope power spectrum

如何把文本文字转换为语音

现在很多的人在到达较高的年纪后,眼镜就开始有点老花了。每天长时间阅读报纸、书籍就会导致眼镜十分的疲惫,甚至连手机上的文字看起来都变得模糊。另外还有很多视力不好的小伙伴,在长期用眼后也会感觉到眩晕、疲劳。因此在长时间用眼后,应该让自己的眼睛多加休息。如果大家还想继续阅读文字内容的话,可以将文字转换为语音,把看改为听。接下来小编就将告诉大家如何把文本文字转换为语音。 1.打开浏览器,查找关键词。鼠标双击打开电脑里的百度浏览器,然后在浏览器当中搜索关键词文字转语音在线转换,接着鼠标点击进入搜索到得相关转换页面里。

2.选择文字转语音功能。进入页面后,鼠标光标移动到语音识别选项上。然后再点击选中下方的文字转语音功能。 3.输入文字内容。接着会转入新的页面里,在页面的方框中输入要转换为语音的文字内容。

4.完成自定义设置。接下来在页面内下方有个自定义设置转换选项,大家按照自己的转换需求,将其中的各个选项设置好。 5.正式开始转换。当文字内容输入完成后,鼠标点击页面内右下角的开始转换选项,页面就会开始将输入的文字转换为语音。

6.下载保存到电脑中。当转换完成后,鼠标点击页面内的立即下载选项,把转换后的语音文字保存到自己的电脑中即可。 7.除了在线转换外,接下来小编还将告诉大家另外种实现文字转语音的操作方法。先在电脑里安装个带有文字转语音功能的pdf转换器。

8.鼠标点击pdf转换器,将其给打开进入操作界面。然后在转换器中使用鼠标点击页面内的文字语音转换选项。 9.选中文件转语音功能。接下来使用鼠标点击转换器内左侧的文件转语音选项,再接着点击下方的文件转语音功能。

EMD包络谱故障分析

基于EMD 的包络谱进行故障诊断 故障频率介绍: 轴承故障的频率f=a*fr(a 是上表系数,fr 是电机转数) 正常信号 对正常信号分别观察原始信号和频谱,原始信号的包络,EMD 分解,EMD 分解后的IMF 分频谱和包络。 原始信号及频谱 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 -2-1012 原始信号时域波形 010002000 3000 4000 5000 6000 0.05 0.1 0.15 0.2 原始信号频谱 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 -0.4 -0.200.20.4原始信号时域波形 0100020003000400050006000 0.02 0.04 0.06X: 358.9Y: 0.01467 原始信号频谱 X: 164.8 Y: 0.01828 X: 1036Y: 0.0564 X: 2102Y: 0.02123

从时域图中可以看到较为明显的周期性冲击,但是故障特征不明显。在频谱当中,亦存在较为明显的边频带以及很多共振频率,这些冲击大都是电机转数的倍频。 原始信号的包络 1000 2000 3000 4000 5000 6000 00.010.020.03 0.04原始信号包络谱 100 200 300 400 500 600 求信号的包络谱,明显看出转速及其二倍频。

EMD 分解 0.1 0.2 0.3 0.40.50.6 0.7 0.8 0.9 -0.200.2IMF1时域波形图 00.10.20.30.40.50.60.70.80.9 -0.200.2IMF2时域波形图 00.10.20.30.40.50.60.70.80.9 -0.200.2IMF3时域波形图 00.10.20.30.40.50.60.70.80.9 -0.200.2IMF4时域波形图 00.10.20.30.40.50.60.70.80.9 -0.100.1IMF5时域波形图 00.10.20.30.4 0.5 0.60.70.80.9 -0.05 00.05IMF6时域波形图 IMF 分量的频谱 00.05 IMF1频谱 00.01 0.02IMF2频谱 0100020003000400050006000 00.005 0.01IMF3频谱 00.01 0.02IMF4频谱 00.005 0.01IMF5频谱 0100020003000 400050006000 0.005 0.01IMF6频谱 IMF 分量的包络

文字转换成语音的免费软件

互联网科技发展迅速,为我们的工作也提供了很多方便之处,比如说,我们在工作中遇到PDF文件需要转换成word 文档,可以使用PDF转换器来解决。有些时候因为工作需要,我们需要将文字转换成语音来保存或者传送,当然了我们还是使用工具来解决,下面小编给大家分享一下。 1、PDF转换器不仅可以将PDF文件转换成word,还可以将文字转换成语音。就是使用PDF转换器这个工具来完成的。大家可以在百度浏览器搜索关键词PDF转换器,然后将软件下载安装到电脑中。

2、软件安装后,鼠标双击进入工具操作页面,这个软件的色彩搭配很好,增强了视觉感。我们目标上方的工具栏目,点击【文字语音转换】,这时候页面的左侧就会出现栏目【文字转语音】,再接着点击【文字转语音】,就可以了。 3、现在添加文件,在页面底部点击【添加文件】的按钮,会弹

出一个文件夹,在文件夹中,找到文件,选中添加到处理列表中。也可以选中文件,直接拖拽到处理列表中。 4、这一步是设置文件转换完成的保存位置,在页面的上方找到输出目录,有两个选择,分别是源文件夹和本地的任意文件夹,这个看个人需求来选择。

5、以上都设置好之后,将开始文字转语音的操作了,点击页面上方状态栏下方的【播放】按钮,转换过程中保持良好的网络状态,以防导致文件转换失败。 6、稍等片刻,文件转换进度显示100%的时候,就是文件转换完

成了。可以直接在页面点击【打开】按钮,查看和保存文件,也可以在上面设置的保存位置中查看文件。 上面分享给大家的软件,功能丰富,而且操作简单,上面文字转语音的操作仅仅用了六步就搞定了,大家下载安装好软件后,可以按照上面的操作步骤来解决问题,希望可以帮助大家。

文字转换语音软件使用图文教程

文字转换语音软件使用图文教程 1.首先打开软件 2.然后在文本框输入您要合成的文本 3.然后点开始合成开始试听效果

4.试听完毕后 5. 6.在保存语音文件前面点对号最好点合成语音生成在文件夹内 7.如果您也可以自行配音或者选择软件配音 8.下面公布下真人配音技巧 首先,如果大家都很喜欢配音,或者非常想要自己尝试下,那么经常会遇到如下的问题: 1.我录音总是不连贯,无法很流畅的说台词,为什么?

2.我的声音干瘪,或者太平凡,没有办法很华丽,怎么办? 3.如何融入角色,感情总是不到位,很苦恼呀。 4.到底如何变声,怎样有方法的练习,如何具体应用呢? 以上四点可能好多朋友会问,那么今天我就从头说起,如何去入门,练习以及应用配音技巧。 第一部分,配音的基本功及训练 声音的艺术具体应该分为两种,一种是唱,一种就是说了,从发声角度讲技巧相似度比较高,但是应用和操作就有很大区别,唱歌好的人未必配的好音,配音好的也未必会唱好歌。 1.气息运用问题,想要熟练配音,广义点说,熟练发音和体会共振和共鸣,就必须要体会气息。 其实在前一篇文章,朗诵学习那里已经提到过,这里再仔细的说下。吸气要用鼻子,注意慢慢的像在闻林间山边的花香一样,同时感觉到自己的小腹部隆起,就是吸气的过程。夸张点说,体会丹田之气。然后呼气是用嘴部,慢慢的吐出,如此反复训练,甚至可以在走路,上班,轻微运动时候做这种练习,用鼻子吸入新鲜空气,用嘴吐出浊气。练习熟练后就可以鼻子

吸气后,说话训练了,感觉在说话的同时,气流在口腔的呼出,这是重点,也是我们学习气流振动的前提,物理学说过,声音的发出是要有振动和共鸣的,放在发声训练一样是基本定理。 2.口部操锻炼自己的口部肌肉灵活,通过发声训练气息和共振。 简单点说,口部肌肉灵活掌握后才能更准确的发声和运用自己的嘴。注意口部操要勤练习,贵在坚持。本网站有相关的资料,我在这里再仔细的说明一下。口部操部分【】里是我补充说明,其他为转载资料。气泡音:声音部位越低(颈窝)越好,气泡越大越好。不要紧张,最好躺在床上练习,枕头抽调放松【就是脖子深处吐泡泡的感觉,咯咯的,自己体会下】噘唇:努力向外牵引。一次20个【就是撅嘴在回收,动作越大越好】 抿唇:努力往两边牵引。一次20个【类似于用完唇膏后的动作,但是注意牵引是指嘴角两侧在抿住的同时向耳根部拉伸】 扣唇:努力使上唇下扣下唇。上下唇发出音,上唇努力的向下唇扣【简单理解就是用唇部力量体会上包天,下包天的劲道,别说你不理解】 顶舌:用舌尖努力顶左右脸部。一次20个随时作

语音转换为文字的软件

有没有语音转换为文字的软件? 解放双手的革命—IBM Viavoice带来不用手的输入法你像往常一样打开计算机准备工作,然而却没有像往常一样伏在键盘和鼠标上,而是抱着胳膊对计算机说出想要做的每件事情。而计算机像往常一样辛勤地响应着你的各种口述命令——到新浪网上看看新闻,然后到和讯网上看看股市行情,再打开Word开始写报告或者出一份策划方案。直到最后整个报告或策划方案连格式都编好了,你伸伸胳膊对计算机说“停止听写”,然后满意地离开了办公室。自始至终,你很少去碰键盘或鼠标,而一直是口述着各种命令,包括报告/策划方案内容的输入、格式的编排等。为什么一切都变得如此美妙?因为你的计算机安装了一套IBM ViaV oice语音识别系统的最新版本——世纪版。可以说,IBM ViaV oice所带来的不用双手的输入方式,是一场解放双手的革命。那么,如何在Word中使用IBM ViaV oice,进行口述式的文字输入及文本格式编排工作呢?在安装IBM ViaV oice时,系统会提问您是否安装对Word的支持。如果您选择了安装,则安装完毕后,在Word菜单中将会增加一个“听写”菜单。该菜单中包括的菜单项有“显示纠错窗口”、“隐藏纠错窗口”及“创建听写宏”等。关于纠错窗口的作用,将在下文中有比较详细的介绍。对于语音输入来说,纠错功能是非常必要的。那么,如何在Word中进行语音输入呢?在ViaVoice中,有一个术语叫做“听写文本”,是用来进行语音输入的命令。当启动ViaV oice语音中心时,屏幕上方就会出现“ViaV oice语音中心”这个菜单,旁边还有一个麦克风按钮。单击麦克风按钮,打开它并准备口述文档。在口述之前,需要确认您的用户名出现在语音中心上。然后,就可以开始文档的口述输入了。说“听写到Word”,打开Word,然后开始口述文档。需要提醒您的是,在口述的时候,最好读出文档中的标点符号和格式命令,比如句号,逗号,另起一段等。当然,在听写文本的时候,ViaV oice可能不清楚您所说的词或者误识,这种情况可以通过使用纠错窗口纠正误识词,并让ViaV oice 对现存文档进行分析,以便学习您的词汇和风格,从而提高ViaVoice的识别准确度。在文档听写完毕后,以常规的文本文件形式保存听写文档。需要注意的是,在关闭文件时,ViaV oice将会提醒您保存语音数据。这时建议您选择是,以便在保存文档的同时,保存相关的语音信息,便于将来校对和纠错。在听写的过程中,可以念一个菜单名,比如听写,来打开菜单,或念一个按钮名,比如显示纠错窗口来对按钮进行操作。那么,如何对文档进行纠错呢?最快速的纠错方式是将语音命令、键盘输入和鼠标点击组合起来,进行操作。不论是在口述完一段文字后要查找误识的词,还是要对某单个的词进行纠错,或者是要对一个词组(或者是一组词)进行纠错,首先需要用鼠标或键盘选中这些目标文字,然后念“纠错”这个命令,显示纠错窗口。这时候,如果看到正确的词已经位于候选词列表中,请选择该词的序号,例如8,然后说命令“选8”,之后您将看到所选的词或短语已经被纠正了。然后,重复上述过程,对其他的文字继续进行校对。有时候会遇到这种情况,候选词列表中没有正确的词或短语。这种情况下,您可以试试重新口述该词或词组。如果结果正确,您可以继续进行校对。如果重新口述不成功,可以念“取消”,返回到原来的文本,并单击纠错窗口的编辑框,用键盘输入正确的词/短语,之后念“纠错”或者按回车进行确定即可。最糟糕的情况是,正确的词或短语不在系统词汇表中。这种情况下,ViaV oice将弹出“分析词”窗口,要求您决定是将要纠错的词分成多个词进行加入,还是合成一个词加入。其后,ViaVoice将弹出的“加入发音”窗口,您可以在这个窗口中对这些新的词/短语进行发音训练,以后ViaV oice就可以识别它了。在这里,ViaV oice专家要给您的一个建议是:在开始使用ViaVoice时,每口述一段文字以后,就进行纠错,这有利于ViaV oice尽快熟悉您的行文风格及常用的词语。而当您的识别率提高以后,再在整段文字口述完毕以后进行纠错。如何在听写文档的过程中,对文档进行编辑呢?ViaV oice提供了多个编辑命令,可以用语音直接编辑文档。例如,“撤消”命令就是撤消最后一次操作的结果;“取消”命令就是删除最后一个听写出的词或者短语;“剪切”命令就是删除所选文本

文字转语音软件哪个好用

文字转语音软件哪个好用?有些时候因为工作需要,我们需要将文字转换成语音来保存或者传送,在网上这种类似的工具也是很多,但是哪一个好用呢?找到好用的工具,即节省时间还可以很快解决问题。当然今天小编就把软件分享发给大家。 1、PDF转换器大家已经不陌生了,但是之前都是来转换PDF文件,现在PDF转换器新增了功能,可以将文字转换成语音、同样也可以将语音转换成文字。大家可以在百度浏览器搜索关键词PDF转换器,然后将软件下载安装到电脑中。

2、软件安装后,鼠标双击进入工具操作页面,这个软件的色彩搭配很好,增强了视觉感。我们目标上方的工具栏目,点击【文字语音转换】,这时候页面的左侧就会出现栏目【文字转语音】,再接着点击【文件转语音】,功能就选择完成了。 3、这一步是添加文件,在页面底部点击【添加文件】的按钮,

会弹出一个文件夹,在文件夹中,找到文件,选中添加到处理列表中。也可以选中文件,直接拖拽到处理列表中。 4、接下来是设置文件转换完成的保存位置,在页面的上方找到【输出目录】,有两个选择,分别是原文件夹和本地的任意文件夹,这个根据个人需求来选择。

5、以上都设置好之后,将开始文字转语音的操作了,点击页面上方状态栏下方的【播放】按钮,转换过程中保持良好的网络状态,以防导致文件转换失败。 6、稍等片刻,文件转换进度显示100%的时候,就是文件转换完

成了。可以直接在页面点击【打开】按钮,查看和保存文件,也可以在上面设置的保存位置中查看文件。 文字转语音哪个软件好用,上面是使用PDF转换器来解决的,大家下载安装好软件后,可以按照上面的操作步骤来解决问题,希望可以帮助大家。

文字转换语音

文字转换语音软件使用教程 1.首先打开软件 2.然后在文本框输入您要合成的文本 3.然后点开始合成开始试听效果

4.试听完毕后 5. 6.在保存语音文件前面点对号最好点合成语音生成在文件夹内 7. 8.如果您也可以自行配音或者选择软件配音 9.下面公布下真人配音技巧 首先,如果大家都很喜欢配音,或者非常想要自己尝试下,那么经常会遇到如下的问题:

1.我录音总是不连贯,无法很流畅的说台词,为什么? 2.我的声音干瘪,或者太平凡,没有办法很华丽,怎么办? 3.如何融入角色,感情总是不到位,很苦恼呀。 4.到底如何变声,怎样有方法的练习,如何具体应用呢? 以上四点可能好多朋友会问,那么今天我就从头说起,如何去入门,练习以及应用配音技巧。 第一部分,配音的基本功及训练 声音的艺术具体应该分为两种,一种是唱,一种就是说了,从发声角度讲技巧相似度比较高,但是应用和操作就有很大区别,唱歌好的人未必配的好音,配音好的也未必会唱好歌。 1.气息运用问题,想要熟练配音,广义点说,熟练发音和体会共振和共鸣,就必须要体会气息。 其实在前一篇文章,朗诵学习那里已经提到过,这里再仔细的说下。吸气要用鼻子,注意慢慢的像在闻林间山边的花香一样,同时感觉到自己的小腹部隆起,就是吸气的过程。夸张点说,体会丹田之气。然后呼气是用嘴部,慢慢的吐出,如此反复训练,甚至可以在走路,上班,轻微运动时候做这种练习,用鼻子吸

入新鲜空气,用嘴吐出浊气。练习熟练后就可以鼻子吸气后,说话训练了,感觉在说话的同时,气流在口腔的呼出,这是重点,也是我们学习气流振动的前提,物理学说过,声音的发出是要有振动和共鸣的,放在发声训练一样是基本定理。 2.口部操锻炼自己的口部肌肉灵活,通过发声训练气息和共振。 简单点说,口部肌肉灵活掌握后才能更准确的发声和运用自己的嘴。注意口部操要勤练习,贵在坚持。本网站有相关的资料,我在这里再仔细的说明一下。口部操部分【】里是我补充说明,其他为转载资料。气泡音:声音部位越低(颈窝)越好,气泡越大越好。不要紧张,最好躺在床上练习,枕头抽调放松【就是脖子深处吐泡泡的感觉,咯咯的,自己体会下】噘唇:努力向外牵引。一次20个【就是撅嘴在回收,动作越大越好】 抿唇:努力往两边牵引。一次20个【类似于用完唇膏后的动作,但是注意牵引是指嘴角两侧在抿住的同时向耳根部拉伸】 扣唇:努力使上唇下扣下唇。上下唇发出音,上唇努力的向下唇扣【简单理解就是用唇部力量体会上包天,下包天的劲道,别说你不理解】

相关文档
相关文档 最新文档