文档库 最新最全的文档下载
当前位置:文档库 › 嗓音质量评价与测量续1

嗓音质量评价与测量续1

嗓音质量评价与测量续1
嗓音质量评价与测量续1

III.2 连贯言语分析和测量

在工作和家庭中嗓音的普通日常运用,为配合变化的言语目标,说话人的声带几乎是经常调节的。可是,如果研究声带活动的话,在流畅朗读文本时有一半的时间用在了无音和清音上,另一半时间产生嗓音。在流畅的言语中嗓音地运用,在不同的语言中看来是相同的,图III.2.1a中给出一个例子,一位葡萄牙发音人朗读一段文本,其中无音和清音所占的时间比例与嗓音发生的时间比例。这个发音人的声带振动情况见图III.1.4。

图III.2.1a 在一段~4分钟朗读文本的时间里,产生嗓音与无音和清擦音所占的时间比例。这些结果也适用于普通话,在许多其它声调语言和印欧语中这个比例也是近乎相等的和典型的。(参见图III.2.15)

图III.2.1b 在连贯言语中嗓音运用的方法。本概率分布表明嗓音的运用在一般连贯言语中的一些浊音小段里是多么不同。这是典型的连贯言语(与图III.1.a的数据相同)。

尽管一半时间花在产生嗓音上,在这段时间里嗓音的运用还是不断变化的。图III.2.1b表示这个发音人运用嗓音的大范围的嗓音区间分析。语调以及与元音和辅音有关的发音人的喉和声门上声道的相互作用*,导致连续改变声带设置,这是在持续元音发音中不出现的。因而,连贯言语中的嗓音音高由发音人发起来和由听音人听起来,都和在持续元音当中不同。表III.1给出在连贯言语中听觉区分音高变化的能力(用大量的嗓音音段)比在听相对长的元音音高变化的能力要差十倍左右。

*通常认为嗓音声源和声道之间是相互独立的,这只是一种近似。实际上声带振动是受声道状态影响的。最实际的例子就是发高元音/i/时,声带振动频率要比发低元音/a/时要高。这称为内在音高。此外还有声学上的相互作用。有关嗓音声源和声道之间的相互作用的细节,可参阅“言语科学与言语技术”,[瑞典] G. 方特 J.高奋著,张家騄等译,商务印书馆,1994。---译者注

图III.2.2 滑动音高变化知觉与音长的关系。

图中虚线是对听觉感受音高差别能力测试的平均结果的最佳拟合。音高差是在稳定地改变音高而音长相同声音之间的基频差值。控制变数为音长和基频变化率。三个不同国家的五个实验室采用自然言语、合成言语或者纯音刺激做的试验。所用的音长覆盖在说话和歌唱中的范围。

这个音高知觉差别并不是嗓音数据的特有特征,而是听觉本身的特性。图III.2.2给出一个五个实验室的音高知觉数据的简化综述,这些数据是关于听音人检测音高变化能力的,声刺激的基频是连续变化的(t’Hart et al., 1990, p32)。在不同的测量中言语和纯音两者都用,从所有观测中得到的一个简单结论是,一个声音的持续时

间越长,听觉机构检测音高变化的能力就越高。听元音、纯音以及歌唱的音高的方式和听连贯言语是不一样的。因而,在临床嗓音分析中,采用连贯言语数据是有实用优点的,其好处在于:(1)与实际生活问题相关联,(2)能分析嗓音的动态方面,(3)可以同听话人和说话人能够听到的一些嗓音情况相联系。

III.2.1 嗓音音高范围和规则性

III.2.1.1 音高和频率的关系

在对连贯言语的嗓音音高特性作测量的时候,第一个实际问题就是得到感受音高的变化与声带振动频率之间的关系。表III.1所提供的信息是同直接解决这个问题相关的。这些数据给出一个刚刚感受到差别的范围(差别阈, DL---Difference Limen),大约相当于在6%到20%的频率变化。这些可感知的差别是对不同语速的言语材料测得的。发音越快形成一个可感受的音高差别的频率变化就越大。这也就是在图III.2.2中所综合的试验的实质。当一个刺激频率的变化慢的时候,听音人检测音高变化的能力较强,而同样的频率变化发生在一个较小的时间段里的时候,检测能力就差一些。对于1秒钟的时长,可感知的变化为~0.2半音/秒,可是对于0.1秒的时长,能检测的差别是6半音/秒。图III.2.1b曲线的重心是在70毫秒左右,这相当于32半音/秒以及30毫秒的听觉积分时间,在表III.1中对应6%的差(别)阈。

图III.2.4 是两个喉描记术(声门电阻抗议)测得的基频Fx随时间变化的例子,一个是连贯言语,一个是本(色声)调(citation tone)*。在这套本(色音)调中的声调4和与之相邻的连贯言语的头一个主要的Fx变化,两者在~0-1秒的音长内都具有~32半音/秒的基频变化率。本(色声)调是由发音人有意发出来的,但是在两个例子中的最大Fx的最大变化率是可以相比的。

*citation tone用在有声调语言,如汉语,时它是指以孤立形式出现的本来的声调,也就是字典里标注的声调。---译者注

当采用直方图来表示与音高知觉相联系的频率测量结果的时候,这些参数为我们提供了人耳分析能力的指南,也指导选择所要匹配的直方格子的大小。为了分析精确起见,最好选择精度比人耳的分析能力更高,这就要选择格子的尺度为3%大小。为了与感知能力相匹配起见,最好分析精度和人耳一样,从上述讨论与综述来看,6%大小的格子相当于音高变化为一个半音(semitone),这个精度是对连贯言语正常感知能力的低端。

III.2.1.2 确定声带振动频率

要解决的下一个问题是,找到一种数据采集方法,它本身就能精确确定声带振动频率。这最好是由测量单个周期的时长来达到。用这种方法,可以确定每一次声带振动的瞬时频率而不用平滑,并且可以一周一周精确地测出振动的规则性。从III.1节关于声门电阻抗仪的讨论得知,数出信号Lx是直接从声带接触测量得到的,这就使得它特别适合既作为持续音又作为连贯言语处理的基础。声带振动每一周中声

激励的信号起点来自于声带接触闭合,声带闭合的时间长度是嗓音质量的一个重要方面。嗓音产生的这些时间因素,现在还不能够从声学传声器来得到可靠的数据。

图III.2.3 声带振动一周一周的时长的定义

本图的上部展示由一位女性说的一句话“He would only answer I don’t know”的宽带频谱*。宽带频谱的下面标有“音高和响度”,粗黑杠的宽度表示振幅Ax, 中心的白线表示相应的声带周期Tx。图的下部表示声门电阻抗的波形Lx,同时自动生成闭合时刻的标记。

*宽带频谱是指用较宽的频带,常用带宽300Hz,做语音分析得到的频谱。这样的频谱可以看出语音特征随时间变化的细节,图上纵向的细微条纹便是由声带一周一周的振动产生的。另有一种窄带频谱,常用带宽45Hz,用来显示语音信号的谐波结构。---译者注

在嗓音诊断中要求相关的物理测量的最重要的知觉参数为音高、响度和音质。图III.2.3给出一个连贯言语的例子,这是一个和响度的物理相关物的直接测量,还带有一小段声带振动不规则信号的放大图。尽管知觉和物理信号之间不是严格的相关,利用声门电阻抗仪直接获取声带闭合参数,使得对正常嗓音和病理嗓音取样来测量声带振动频率范围和不规则性要比之用声学传声器信号更适宜。

III.2.2 在对比声调和连贯言语中声带振动频率范围

III.2.2.1 基本嗓音频率分布

图III.2.4 汉语孤立声调对比和图III.1.4的成年男人的连贯言语(朗读文本)取样与喉振动频率的经过时间(elapsed time)分布eDFx的关系。朗读文本的样本为250sec。

图III.2.4的左面表示在长约4分钟的朗读文本中,声带频率范围的测量结果。每个声带周期都包括了,相应的每个频率Fx,是由ELG得到的Lx波形用1微秒时间采样来确定的。画出的直方图分布eDFx,是根据频率区间(格子),其宽度为四分之一音调(3%频率),以便得到高于感知水平的精度。eDFx分布是每个格子所占用的时间占总采样时间的比例,用百分数来表示。eDFx代表“Fx经过的时间分布”,其中Fx是一个声带振动的频率,它使用Lx信号不经过平滑来确定的。

eDFx的概率=在3%频率格子里的声带振动周期总时长 / 整个嗓音纪录的总时长

(7)

所选格子尺寸是同表III.1给出的最低限可以相比的,提供一个代表实用临床测量的基础。用于说话的嗓音频率范围以西方音乐音阶表示为从A0 (27.5Hz)到A5 (880Hz)。很多临床医生都熟悉这个标度,对于嗓音频率也还对应于美(mel)标尺,这是由音调感觉距离导出的[Stevens et al., 1937]。测量歌唱嗓音要把范围扩展到A6 (1760Hz)。为了这类分析对一个说话人运用嗓音具有代表性,就要应用大于40秒的言语采样,作为临床上方便与表示精确的折衷,最好是2分钟。eDFx给出说话人嗓音运用的一般观察,它对把这样的概观同音高控制的物理细节联系起来是有价值的。普通话音节“ma”[mA]的四声对立的Fx曲拱示于图III.2.4, 紧挨着eDFx分布。再向右,是一个连贯言语取样的声调结构用黑线Fx来表示,黑线的宽度,像在图III.1.6和III.1.7种中一样,是表示同时存在的响度变化的。孤立声调变化比在连贯言语中要慢,可是,它们覆盖较宽的频率范围,正如前面说过的其最大变化率是可以比较的。

图III.2.5a 经过时间喉频率分布。

一名男发音人的~4分钟连贯言语取样,也是图III.2.4分析的基础。

图III.2.5b 基于每个格子中的周期数的分布。

在图III.2.4 和III.2.5a 中分析用的~4分钟的连贯言语取样。

图III.2.5上有两个图,上面的图是eDFx,下面的图是DFx1 它表示对于同样的数据,声带频率的一种不同的测量结果。所画的分布DFx1是根据把频率范围分割成相连的区间(格子)的标准惯例,并把落入每个区间内的声带周期总数除以整个数据采样中的声带周期总数。[Huber (2000) 提到的采用周期数作为测量的基础,Lieberman (1960)和 Fourcin (1974)早就已经用过。Baken 与 Orlikoff (2000)讨论采用计时而不用周期的问题。]

DFx1 概率=在一个3%频率格子中的声带周期总数/ 整个嗓音记录中的声带周期总数

(8)

频率区间是基于一步为四分之一音调(3%频率)来划分的。选择这种步长是为了可以同表III.1中的频率差阈下限可以相比,并提供一个实用临床测量的基础,如前所述,它是可以用于时长大于40秒的言语采样的。整个频率范围还是根据西方音乐音阶从A0到A5。用这个分布测得的说话或唱歌的频率范围,会包括还没有很好定义的音高的不规则性。因为,它是基于每一个周期来确定的。采用周期比经过时间好的地方在于,对高声带频率给以较大的关注(同eDFx分布情况相比)。这里,上下两个图,对于正常嗓音来说,差别不大。病理嗓音由于具有大量的低频率成分,这两种数据表示方式的差别就会很大。这样就有了能把正常嗓音和被损伤的嗓音差别显示出来的数据分析技术,其结果与知觉更相关,将在下面加以讨论。

III.2.2.2 测量音高---DFx2分布

明确表示嗓音音高的感觉决定于声带的规则振动。如果声带振动时它们在相继周期定时地紧密接触,这样瞬时频率就落在音高差阈DL之内(见表III.1),那么说话人的声道激励便产生可接受的音高感觉。实际上,音高感觉是要有四个以上规则的声学过程发生才建立起来的(Doughty & garner, 1948),但是在病理嗓音分析中证明,在基本定义的水准上来寻找规则性,只有在两个声带周期相连续的情况下才是有效的。

图III.2.6a 相继单个嗓音周期的频率分布DFx1---病理嗓音,发音人B。

在DFx1分布中发音人嗓音的低频成分表现出一个第二频率模式。

图III.2.6b 相继两个嗓音周期的频率分布---病理嗓音,发音人B。

DFx2给出发音人嗓音音高规则性的一个指征。这个分布是按照一对嗓音周期跟着另一对嗓音周期相继落入分析格子画出来的分布。

III.2.6给出“音高搜寻“过程的应用实例,按照这种方法从一个特定的(息肉状的)病理嗓音(发音人B)得到的。图III.2.6把DFX1 和DFx2放在了一起,一个在上一个在下。DFx2是按照相邻的一对嗓音周期与另一对嗓音周期之间的时长差,落入3%频率格子之内的分布画出来的。

DFx2概率=成对相继嗓音周期落入3%频率格子中的总数/ 整个嗓音记录中嗓音周期的总数(9)

现在DFx2更近于代表那些有规律性的声带周期(至少两周)。对于正常嗓音来说,DFx1 和DFx2之间的形状和大小都相差很小。可是,这个病理嗓音的例子,尽管病状不太严重,两者的差别还是很明显。从在DFx2 中的周期总数与在DFx1中的周期总数之比,得出的“相干性(coherence)”为46%。相干性仅为46%是因为与病症有关的相继声带周期的低频是不规则的,他们很少落入同一个Fx格子之内,而在DFx2中这样的低频振动方式就几乎没有了。

图III.2.7a 正常嗓音的DFx1 和DFx2 的重叠---发音人A。

两个分布很一致。

图III.2.7b 病理嗓音的DFx1 和 DFx2的重叠---发音人B。

发音人嗓音中的不正常低频成分产生一个在DFx1曲线中的第二低频振动方式,但是在DFx2曲线中就看不见了。

图III.2.7给出两利用极方便的方法来表示DFx1 和 DFx2分布。图III.2.7a对正常嗓音(发音人A)把DFx1 和DFx2画在一起,两个分布在这里形状上和范围上都几乎一样。即便是很好的“规则的”嗓音也有一些偶然情况,两个相继的声带周期并不落入同一个分析格子,也就是两个周期之间的差别大于3%频率。

图III.2.7b是把息肉状的病理嗓音(发音人B)的DFx1 和DFx2画在一起,在图III.2.6上它们分别画在两个图上。DFx1由于病症造成声带振动的两个振动方式,而在DFx2上就只有一个了。这两个重叠的图形给出有关一个说话人运用嗓音中规则性嗓音诊断的一个直接的指征。

III.2.3 Fx一周一周相互对照,CFx

虽然DFX1 同为确定音高的成分分布DFx2 相对比,被证明对于繁忙的临床工作是很有用的,接下来就提出来对嗓音不规则的大小要有一个更完整的总的看法。这里要解决的问题,涉及一个相当于在持续元音分析中的抖动,对于连贯言语的等效的定义。尽管抖动的概念基本上是建立在一周一周变化的数学分析的基础之上的,看来并不与音高知觉明显相关,但对于正常嗓音抖动测量,由于听觉对持续元音音高差阈的大小而与音高知觉紧密相连(见III.1.2)。因为不论是正常听觉的频率差阈还是一个良好嗓音在发持续元音时的抖动都是只有0.1%,它们具有坚实的理论基础。

初看起来,对于连贯的正常的言语情况并不那么简单。在对话、朗读或者演讲中普通的嗓音运用,必须取决于为了有效的交际而运用适当的对比语调。和语调相关的声带频率Fx就是要变化的,因而相当于持续元音的任何测量都必须要定量地对这一事实加以考虑。使用差阈测量表明对于解释元音的感知和产生是有用的,为提供直接确定和测量连贯言语中的不规则性的方法它也是至关重要的。6%频率的差别阈限是与感知连贯言语的语调变化相匹配的,它可以用来提供一种分辨正常语调和非正常语调之间的声带周期的方法。这样的分辨基本上取决于每一个声带周期同与它相邻的周期之间,用6%频率差阈格子作为基本度量单位,进行距离比较。

图III.2.8 声带频率Fx的相互对照CFx,正常言语两分钟取样,具有半音格子和参考差阈直线。(对于语音,频率坐标从27.5Hz 开始到880Hz为止)

图III.2.8是以言语产生和感知的综合作基础的。它给出一个CFx(Fx相互对照)表示的一个例子,它是从一个正常嗓音(发音人A)得出来的,加上音高格子(6%频率差阈)来表示。CFx提供一个相继声带周期对,Fx1 和Fx2的单个频率在全部嗓音记录中的直接比较。它给出声带周期比较可用于表示整个频率范围的声带振动不规则的结构的一种方法。DFx2可以拣出一周一周的规则性,CFx则显示一周一周的变化,既有规则的也有不规则的。

CFx 概率=声带振动周期对在6%频率格子中的总数 / 在整个嗓音记录中声带周期总数

(10)

对于正常嗓音,图III.2.8中,中心的主对角线典型地在两三个频率差阈DL宽度之间(这对欧洲语言和普通话都会是有效的)。这相当于说话人音高控制得很好,Fx在所遇到的正常语调中的变化。相继的Fx对之间的差别大于2DL的时候,就

要落在中心宽对角线之外的方格里去了。值得注意的是,正常的发音直接同正常的感知相联系,在图III.2.8中,听觉差阈相当于发音中产生的Fx变化。对嗓音产生的测量证实测量差阈(DL)基础的效用,因为在正常发音中大于95%的声带周期都在由感知确定的中心对角线范围之内。CFx也为定量表示不规则性测量提供一个基础。不规则性的一个有用的度量是,CFx的不规则性百分率。不规则性百分率是以百分数表示的声带周期落到宽对角线以外的格子数目与全部嗓音记录中声带周期总数的比率。

%不规则性(百分率不规则性),CFx= [声带周期落到图III.2.8中a 和b两条直线以外的格子总数 / 全部嗓音记录中声带周期的总数]*100

(11)

实际上,采用中心参考对角线提供一个临床上的有用的标准。按照这个感知基础的标准,一个非常好的嗓音,带有小的吱嘎声(creak),可以预期在发音中只有小于5%的不规则性。在英国对于英国英语的嗓音诊断的经验,得出采用10%作为划分良好嗓音和发声困难嗓音的界限。这也是德国最近利用78名说话人的数据库进行详尽研究的结果。

图III.2.9 声带周期相互对照,CFx; 上图为发音人A, 下图为发音人B。

对这两个发音人,CFx都是基于6%格子得来的,这与连贯言语的近似差阈一致。正常嗓音发引人A的CFx的中心对角线覆盖大于95%的数据,这作为例子说明言语产生和感知之间的一致。病理嗓音发音人B的CFx表现出中心频率范围的不规则性,小的复音(diplophonia)就是她嗓音的特点。

图III.2.9 说明这种方法对于发音人A 和 B在图III.2.4a, b上的嗓音数据的应用。发音人B的病理嗓音导致明显的一周一周之间的变化,在主对角线两侧凌乱的分布表明发音人嗓音中的明显的不规则的发音困难成分,以及中心宽对角线显示出的固有的粗糙性。发音人 B 的不规则性是14.4%,与之相比的正常发音人A则为3.3% 。

III.2.3 响度的范围与规则性和嗓音质量

III.2.3.1 响度

图III.2.10 发音人A的DAx 振幅分布和 CAx振幅对照。

这些分析是根据同对DFx 和 CFx 分析一样的原理。它们以同样方式把语音产生和感知联系起来,对于正常嗓音>95%的数据覆盖范围CAx的格子的尺寸较大。实际上,作为病理指标Ax并不像Fx 和 Qx 那样灵敏。

声压是响度知觉的首要相关物,图III.2.10给出一个利用在每一个声带周期中正峰值声压Ax的例子,以便提供有关响度范围的分布和规则性。每一个图形,DAx1、DAx2 和CAx的计算基础是利用和计算DFx1、DFx2 以及CFx一样的方法。它们在概念上直接同颤动测量有效地联系起来。颤动测量是基于持续元音的,

但是它具有能对言语取样分析的动态性质给出一个一般观察的优点。在心理声学研究(Moore, 1997, pp63-88)中发现持续音具有1到2dB的响度差别阈限。对正常说话人发的持续元音的颤动测量给出的范围是0.2dB 到0.4dB (Backen & Orlikoff, 2000, p134),也可参见,例如,表III.2发音人A, 他的颤动值为4.3% 相当于0.36dB。这些观测导致在连贯言语嗓音响度DAx直方图分析中,采用1dB一步;而对DAx1 和 DAx2 相互对照的CAx分析中则采用2dB一步,因为CAx是企图近似听觉机构对连贯言语的操作。

图III.2.11(a) 病理嗓音的响度分布DAx1 和 DAx2,发音人 B。

对于发音人B, DAx并没像预期的那样具有一个第二低振幅方式。对于病理嗓音这是常见的情况,这指出Ax 和 Fx 之间缺乏直接的对应。

图III.2.11(b) 病理嗓音的响度规则性相互对照CAx,发音人 B。

病理嗓音发音人B 比正常发音人A 的CAx具有较大的不规则性,这会产生嗓音粗糙性的感觉,它并不像声带闭合出现时间(closure epoch)和时长不规则性那样显著。

图III.2.11上是发音人B的数据。对发音人B来说,在DFx1中由于一周一周的变化引起的低频振动方式,既对DAx1 也对 CAx 的形状带来了影响。她的CAx不规则性是6.8% 而正常发音人A则为3.3% 。发音人A的数值表明,有96.7%的声带周期,其一周一周的不规则性是落入CAx的中心对角线之内的(如上文对CFx所定义的一样)。对正常说话人这个结果是典型的,这就意味着对连贯言语采用2dB 一步是同知觉处理一致的。

III.2.3.2 嗓音质量

嗓音质量是比响度复杂得多的知觉对象,因为一个说话人嗓音的音色取决于很多因素,而这些因素至今还不完全了解。可是,一个普遍接受的基本的重要因素是,声带闭合相位(vocal fold closed phase)(Howard, D.M., 1995)。借助Lx波形提供的跨声门电导信息,对每一个声带振动周期两片声带接触时的百分率时间,Qx, 声门电阻抗仪ELG为此提供一个方便的基础。在当前的工作中它一直被用来估计嗓音质量的这一重要方面。用它得出来的一些细节的例子示于图III.2.12。

图III.2.12 声带接触的估计。(a) 气声嗓音,(b) 正常形态嗓音。

图III.2.12(a) 用图来说明利用对一个气声取样的跨(声门电)导来估计声带闭合相位。测量Lx波形的“接触”时间宽度,理想地是在它的峰到峰值的70%水平上来做。为了对一个特定周期得出一个Qx值,测得的这个数值用来计算它占声带瞬时周期总时长Tx的比率,正如图III.1.1中定义的那样。图III.2.12(b)表明这种技术应用于一个典型嗓音波形的取样,这里跨导时长和得出的Gx值都比较大。

图III.2.13(a) 接触比范围和规则性DQx1 与 DQx2。

跨导接触时长(transconductance contact duration)与声带周期总时长(total vocal cycle duration)之比Qx% ,用来提供DQx1 和 DQx2 分布,它们是按照和DFx1 和 DFx2 相同的概念来表示整个音域和规则性的。

图III.2.13(b) 接触比范围和规则性相互对照。

对于正常发音人,CQx具有相对良好的中心对角线。对于CQx所用的步长为2%,正常发音数据覆盖>95% 。

应用Qx数据对研究正常嗓音和病理嗓音都有相当的好处。一个演说家的嗓音投射,图III.2.12中指明的一个持续元音两种嗓音之间嗓音质量的差别,对于演讲嗓音在整个听众区都清晰至关重要。较大的声带闭合时长导致较小的共振峰衰减。同时较大的闭合时长声带开始接触的就快,从而给出高次共振峰较强的激励*。在临床上,Qx测量是极为有用的,它既可用来评测平均声带闭时相长度,又考虑到闭时相的变化。对于某些嗓音病症Qx可能显著地不规则,而Fx却相对地与时间上的不规则无关。近来一些根据Qx算法的诊断应用的特殊例子,已经运用到对声带轻瘫(vocal fold paresis)甲状形成(thyroplasty)后的嗓音质量改善(Juian McGlashan在诺丁汉的工作)、电疗后的轻瘫降低(Ptok教授在汉诺威),以及puberphonia(青春期发音困难)治疗后的改善(Lesley Cavalli, London)等方面。

*嗓音声源激励的大小是与声带波的微分(变化率)成正比的,所以声带闭合得快产生的激励就大。---译者注

图III.2.14(a) 一个病理嗓音的DQx1 和 DQx2---发音人B。

发音人B有一个第二低Qx、气声以及在DQx1中一个峰,但在DQx2中没发现有另一个峰。这就是她的声带接触的不规则性的一个指征,也是她的嗓音粗糙性感觉的来源。

图III.2.14(b) CQx声带闭合时长相互对照---发音人B 。

对于这个病理嗓音Qx不规则性是46.5%,而对于发音人A的正常嗓音则为27.8% 。

在图III.2.14(a)中的DQx1 和DQx2是发音人B的数据,正如预期的一样,图形表明这个病理嗓音有一个次要的振动方式影响整个音质。这些图形还指出Qx不规则性的不正常程度,这从采用1%格子步长的DQx1 和DQx2之间的差别,特别是从CQx图的分散程度都可以看出来。根据CQx采用2%格子步长,发音人B的不规则性尺度为23%,而发音人A则是9.6% 。由于目前对于连续言语中(声带)闭时相的差别阈限的知觉参考数据还得不到,所以正常嗓音的CQx不规则性的数值是很有用的,可作为这一技术的简单校准。

III.2.4 跨语种测量

尽管在任何一种语言环境当中,采用连续言语作为主要的诊断数据来源具有相当多的优点,可是想要建立的跨语种的定量的对比现在还不清楚。

持续元音能够提供有用的跨语种比较的基础,因为,正如在III.1节中讨论的那样,门诊医生可以使用差不多全世界的语言当中都有的三个元音:/i/ , /A/ 和/u/。不管连续言语的结构多么复杂,还是具有在语音学上可对比的跨语种特性的,至少在一些广泛使用的口语中是这样。连续言语使得说话人的声带要服从于瞬变的神经-肌肉控制,这种控制有一部分是一种在所用的语言中响音和阻塞音之间的平衡功能。响音是以发音时气流通过声道相对地不受阻塞为特征的。阻塞音的特征是在发音时声道在一段时间里存在闭合或阻塞。如果两种语言之间它们的相对比例显著不同,那在连续言语基础上的临床嗓音测量的定量对比就是不可行的。这是因为在一种语言里的喉残障可能造成的交际损害要比在另一种语言中更大。

表III.5 阻塞音和响音的比例。

根据六中欧洲语言(三种日耳曼语和三种罗曼语)和一种声调语言的语音标注的“北风与太阳”文本(Abberton, 2006)。

基于MATLAB 的声音信号采集系统(论文)

基于MATLAB 的声音信号采集系统 野龙平 (陕西师范大学电子信息科学与技术,陕西) 摘要: 声音是各种信号传递与交流最直接的体现,因此对声音信号的研究有十分重要的意义。本文主要针对Matlab指令系统对声音信号的采集,作者利用Matlab 提供的数据采集工具箱, 介绍了倆种采集方法,简单分析并比较其优缺点。基于matlab的数据采集系统, 具有实现简单、性价比和灵活度高的优点。 关键词: Matlab; 数据采集 0 引言 随着科技的发展,对于语音信号的采集已经有很多种方法,如基于单片机技术、VC,C++等编程、纯硬件电路,本文介绍的方法主要通过一款软件MATLAB。它是MathWorks 公司推出的一种面向工程和科学运算的交互式计算软件, 其中包含了一套非常实用的工具-- 数据采集工具箱。使用此工具箱更容易将实验测量、数据分析和可视化的应用集合在一起。数据采集工具箱提供了一整套的命令和函数, 通过调用这些命令和函数, 可以直接控制数据采集设备的数据采集。 作者简单介绍了一种用声卡进行语音信号采集和MATLAB 的数据采集工具箱进行分析处理的语音信号采集系统。经实验证明, 该系统可实现在线连续采集语音信号并进行分析和处理, 具有实现简单、性价比和灵活度高的特点。 1 语音数据采集系统设计 MATLAB 中提供了强大的数据采集工具箱( DAQ- Data Acquisition Toolbox) , 可满足控制声卡进行数据采集的要求。用户通过调用MATLAB 命令, 可对采集的数据进行分析和处理, 为用户带来了极大的方便。 语音数据采集过程如图1 所示。

图1 声卡采集声音信号有两种方式: 传输线输入方式(LineIn) 和麦克风输入( MicIn) 方式。LineIn 方式是通过传输线把其他声音设备, 如录音机等设备的音频输出信号连接到声卡, 通过声卡记录数据存入计算机。 本系统采用MicIn 方式, 即用麦克风接收语音通过声卡将音频信号存入计算机。利用MicIn 方式通过声卡采集数据有两种方法: 方法一是采用对声卡产生一个模拟输入对象进行采集, 方法二是直接利用MATLAB 数据采集箱中提供的的函数命令进行采集。 1. 1 方法1 本系统是以声卡为对象利用MATLAB 数据采集工具箱提供的环境完成数据采集过程, 麦克风成为数据采集系统中的传感器。数据采集过程与其他硬件设备无关, 只与声卡有关, 因此应对声卡产生一个模拟输入对象(AI) 。 数据采集过程的具体实现: 1) 初始化: 创建设备对象。 ai= analoginput(‘ winsound ’ ) 2) 配置: 根据数据采集硬件设备的特性, 增加通道和控制数据采集的行为。为AI 添加1 个通道, 设置采样频率和采样时间。 addchannel( ai, 1) freq= 8000; % 采样频率fs8000Hz set( AI, sampleRate, freq) %为模拟输入设备设置采样频率 duration= 2; %采样时间为2 秒 set (AI, SamplesPerTriffer, duration* freq) ; % 为模拟输入设备设置触发时间 3) 执行: 启动设备对象, 采集数据。 start( ai) ; %启动设备对象 data= getdata( ai) ; % 获得采样数据 4) 终止: 删除设备对象。 stop( ai) ; % 停止设备对象 语音信号输入 声卡 Matlab 数据采集箱 计算机

声音质量的评价

声音质量的评价 默认分类2007-02-26 10:00:19 阅读6 评论0 字号:大中小订阅 音质标准 所谓声音的质量,是指经传输、处理后音频信号的保真度。目前,业界公认的声音质量标准分为4级,即数字激光唱盘CD-DA质量,其信号带宽为10Hz~20kHz;调频广播FM质量,其信号带宽为20Hz~15kHz;调幅广播AM质量,其信号带宽为50Hz~7kHz;电话的话音质量,其信号带宽为 200Hz~3400Hz。可见,数字激光唱盘的声音质量最高,电话的话音质量最低。除了频率范围外,人们往往还用其它方法和指标来进一步描述不同用途的音质标准。对模拟音频来说,再现声音的频率成分越多,失真与干扰越小,声音保真度越高,音质也越好。如在通信科学中,声音质量的等级除了用音频信号的频率范围外,还用失真度、信噪比等指标来衡量。对数字音频来说,再现声音频率的成分越多,误码率越小,音质越好。通常用数码率(或存储容量)来衡量,取样频率越高、量化比特数越大,声道数越多,存储容 量越大,当然保真度就高,音质就好。 声音的类别特点不同,音质要求也不一样。如,语音音质保真度主要体现在清晰、不失真、再现平面声象;乐音的保真度要求较高,营造空间声象主要体现在用多声道模拟立体环绕声,或虚拟双声道3D环绕声等方法,再现原来声源的一切声象。音频信号的用途不同,采用压缩的质量标准也不一样。如,电话质量的音频信号采用ITU-TG·711标准,8kHz取样,8bit量化,码率64Kbps。AM广播采用ITU-TG·722标准,16kHz取样,14bit量化,码率224Kbps。高保真立体声音频压缩标准由ISO和ITU-T联合制订,CD11172-3MPEG音频标准为48kHz、44.1kHz、32kHz取样,每声道数码率32Kbps~448Kbps,适合CD-DA光盘用。对声音质量要求过高,则设备复杂;反之,则不能满足应用。一般以"够用,又不浪费"为 原则。 音质评价方法 评价再现声音的质量有主观评价和客观评价两种方法。例如: 1.语音音质 评定语音编码质量的方法为主观评定和客观评定。目前常用的是主观评定,即以主观打分(MOS)来度量,它分为以下五级:5(优),不察觉失真;4(良),刚察觉失真,但不讨厌;3(中),察觉失真,稍微讨厌;2(差),讨厌,但不令人反感;1(劣),极其讨厌,令人反感。一般再现语音频率若达7kHz 以上,MOS可评5分。这种评价标准广泛应用于多媒体技术和通信中,如可视电话、电视会议、语音电子 邮件、语音信箱等。 2.乐音音质 乐音音质的优劣取决于多种因素,如声源特性(声压、频率、频谱等)、音响器材的信号特性(如失真度、频响、动态范围、信噪比、瞬态特性、立体声分离度等)、声场特性(如直达声、前期反射声、混响声、两耳间互相关系数、基准振动、吸声率等)、听觉特性(如响度曲线、可听范围、各种听感)等。所以,对音响设备再现音质的评价难度较大。通常用下列两种方法:一是使用仪器测试技术指标;二是凭主观聆听各种音效。由于乐音音质属性复杂,主观评价的个人色彩较浓,而现有的音响测试技术又只能从某些侧面反映其保真度。所以,迄今为止,还没有一个能真正定量反映乐音音质保真度的国际公认的评价标准。但也有报道,国际电信联盟(ITU-T)近期已批准一种客观评价音质的被称之为电子耳的新型测量方法,可对任何音响器材的音质进行客观听音评价,也可用于检测电话通讯语音编码系统的缺陷。 现将乐音音质评价方法综述如下: (1)主观听判音效 通常,据乐音音质听感三要素,即响度、音调和愉快感的变化和组合来主观评价音质的各种属性,如低频响亮为声音丰满,高频响亮为声音明亮,低频微弱为声音平滑,高频微弱为声音清澄。下面结合声源、 声场及信号特性介绍几种典型的听感。

声音与环境测试题及答案

2012—2013学年《声音与环境》测试一 一、填空题(1—11题每空1分,第12题每空3分,共 37分) 1.(2012安徽)成语“万籁俱寂”常用来形容夜晚的宁静,从声音特性分析,这主要是指夜晚声音的__________很小。 2.(2012湖南株洲)“掩耳盗铃”是大家非常熟悉的故事,从物理学角度分析盗贼所犯的错误是:既没有阻止声音的,又没有阻止声音的,只是阻止声音进入自己的耳朵。 3.(2012江苏南京)噪声是由发声体产生的,中考期间,考场附近“禁鸣喇叭”,这是在 _________(声源处或传播途中或人耳处)减弱噪声。噪声也是一种能源,最近科研人员开发一种T恤衫,它能在噪声环境下发电,把机械能转化为电能,为随身携带的小电器及时充电。 4.(2012江苏苏州)敲击鼓面,在听到鼓声时,还可看见鼓面上小纸团在跳动,说明鼓声是由于鼓面的_______产生的;鼓面的_____越大,鼓声的响度越大. 5.(2012山东滨州)汽车上的电子防盗报警装置,在汽车被撬开时能发出报警声,提醒人们车辆被盗,这是利用了声音可以传递。 6.(2012山东德州)音乐会上,演员正在演奏二胡,二胡发生是因为琴弦在?? ??,演奏过程中,演员不断调整手指在琴弦上的按压位置是为了改变声音的??????。 7.(2012山东烟台第13题)如图所示是几种声音输入到示波器上时显示的波形,其中音调相同的 是;响度相同的是。 8.(2012江苏扬州)小明将手机悬挂在密闭的玻璃瓶中,用抽气机抽去瓶中的空气,大电话呼叫瓶内的手机,手机(能或不能)接收到呼叫信号,这说明;你(能或不能听到瓶内手机的声音,)这说明。 9.(2012四川广安) 2.声音是靠物体的产生的,声音能在体、体和体中传播,在________中传播最快,在空气中的传播速度是_________________m/s。 10.(2012四川南允)某种昆虫靠翅膀振动发声,如果这种昆虫的翅膀在10s内振动3500次,则它振动的频率是 Hz,人类听到这种声音(选填“能”或“不能”)11.(2012甘肃兰州)日常用语中声音的“高“与低,有时指音调,有时指响度,含义不是唯一的。例如”一名男低音歌手正在放声高唱“,这里的低是指。高是指。 12.如图,甲是探究声现象常用的装置,请根据要求回答问题: (1)泡沫塑料球被音叉弹起,这个现象说明; (2)泡沫塑料球在实验中起什么作用;

(完整版)声现象单元测试习题(答案)

. 《声现象》专题训练 一、填空题 1.下列与声有关的语句中,所表达的物理含义是: (1)节日里的锣、鼓声“震耳欲聋”,说明锣鼓声的 大。 (2)歌唱家的歌声“悦耳动听”,说明歌唱家的歌声的 好。 (3)小女孩的讲话“脆如银铃”,说明小女孩说话声的 高。 2.东林书院名联“风声、雨声、读书声,声声入耳”表明声音可以在 中传播;用小提琴和二胡演奏“二泉映月”乐曲时,我们可以根据声音的 不同来加以辨别。 3.声音在介质中以___ 的形成向远处传播。声音传播过程中能引起别的物体发生_____,超声波还能粉碎人体内的结石,说明声音具有___________。 4.科学工作者为了探测海底某处的深度,向海底垂直发射超声波,经过3s ,收到回波信号,海洋中 该处的深度为 m (声音在海水中传播的速度是1531 m/s ),这种方法能不能用来测量月亮到地球的距离?为什么? 5.在百米赛跑中,甲、乙两个记时员,分别从看到发令枪冒烟和听到枪声开始记时同一运动员的成绩,则 记录的成绩较准确;若甲记录的成绩为11.3s ,则乙记录的成绩约为 s 。 6.某汽车以10m /s 的速度匀速驶向一座陡峭的高山,司机按了一下嗽叭,经4s 钟听到回声。听到回声时,车与前面高山的距离是 m 。 7.频率为 Hz 以下的声音为次声波;频率为 Hz 以上的声音为超声波。 8.噪声强度如果在 dB 以上,会影响人的正常学习和休息,如果在 dB 以上,长时间会造成对人的听力的伤害。 9.2005年春节晚会上,聋哑人表演的“千手观音”震撼了所有观众。她们是怎样训练的呢?听不见声音,她们将身体紧贴在音箱上,感受音乐的节奏,因为声音是由 产生的。 10.我们生活在声音的海洋里,鸟语、流水潺潺、琴声悠悠。这些声音是由于物体的____ ____而产生的。物体的 停止,发声也停止。悦耳动听的笛声是靠管子里的空气 产生的。我们能够分辨出鸟语和琴声是根据声音的____ ____不同(填“音调”、“音色”或“响度”)。蚊子和牛叫声的区别是:牛叫声音的音调比蚊子 ,而响度比蚊子 。 11. 在图所示的实验中,李明发现硬纸片在木梳上划得快时音调高,划得慢时音调低。这表明: 。 12.2011年 7月14日12时10分,广东省兴宁市罗岗镇福胜煤矿发生透水事故,救援工作迅速展开。下午,事故矿井下发现有生命迹象,原来是被困人员通过敲击钻杆,发出“当当”的求救信号,这是因为 。 13.人在野外说话,为了使声音传得更远一些,通常将手或者一本书合成喇叭状围在嘴边,其目的是1 图8

信号处理实验七音频频谱分析仪设计与实现

哈尔滨工程大学 实验报告 实验名称:离散时间滤波器设计 班级:电子信息工程4班 学号: 姓名: 实验时间:2016年10月31日18:30 成绩:________________________________ 指导教师:栾晓明 实验室名称:数字信号处理实验室哈尔滨工程大学实验室与资产管理处制

实验七音频频谱分析仪设计与实现 一、 实验原理 MATLAB 是一个数据分析和处理功能十分强大的工程实用软件,其数据采集工具箱为实现数据的输入和输出提供了十分方便的函数命令。本实验要求基于声卡和MTLAB 实现音频信号频谱分析仪的设计原理与实现,功能包括: (1)音频信号输入,从声卡输入、从WAV 文件输入、从标准信号发生器输入; (2)信号波形分析,包括幅值、频率、周期、相位的估计、以及统计量峰值、均值、均方值和方差的计算。 (3)信号频谱分析,频率、周期的统计,同行显示幅值谱、相位谱、实频谱、虚频谱和功率谱的曲线。 1、频率(周期)检测 对周期信号来说,可以用时域波形分析来确定信号的周期,也就是计算相邻的两个信号波峰的时间差、或过零点的时间差。这里采用过零点(ti)的时间差T(周期)。频率即为f = 1/T ,由于能够求得多个T 值(ti 有多个),故采用它们的平均值作为周期的估计值。 2、幅值检测 在一个周期内,求出信号最大值ymax 与最小值ymin 的差的一半,即A = (ymax - ymin)/2,同样,也会求出多个A 值,但第1个A 值对应的ymax 和ymin 不是在一个周期内搜索得到的,故以除第1个以外的A 值的平均作为幅值的估计值。 3、相位检测 采用过零法,即通过判断与同频零相位信号过零点时刻,计算其时间差,然后换成相应的相位差。φ=2π(1-ti/T),{x}表示x 的小数部分,同样,以φ的平均值作为相位的估计值。 频率、幅值和相位估计的流程如图1所示。 4、数字信号统计量估计 (1) 峰值P 的估计 在样本数据x 中找出最大值与最小值,其差值为双峰值,双峰值的一半即为峰值。 P=0.5[max(yi)-min(yi)] (2)均值估计 i N i y N y E ∑== 1 )( 式中,N 为样本容量,下同。 (3) 均方值估计 () 20 2 1 ∑== N i i y N y E (4) 方差估计 ∑=-=N i i Y E y N y D 0 2))((1)(

labview声音采集系统

虚拟仪器技术 姓名:史昌波 学号:2131391 指导教师:孙来军 院系(部所):电子工程学院专业:控制工程

目录 1、前言 (3) 2、声卡的硬件结构和特性 (3) 2.1声卡的作用和特点 (3) 2.2声卡的构造 (5) 3、LABVIEW中与声卡相关的函数节点 (5) 4、LABVIEW程序设计 (6) 4.1程序原理 (6) 4.2程序结构 (7) 4.3结果分析 (9) 5、结束语 (9) 6、参考文献 (10)

基于声卡的数据采集与分析 1、前言 虚拟仪器技术是利用高性能的模块化硬件,结合高效灵活的软件来完成各种测试、测量和自动化的应用。在虚拟仪器系统中,硬件解决信号的输入和输出,软件可以方便地修改仪器系统的功能,以适应不同使用者的需要。其中硬件的核心是数据采集卡。目前市售的数据采集卡价格与性能基本成正比,一般比较昂贵1。 随着DSP(数字信号处理)技术走向成熟,计算机声卡可以成为一个优秀的数据采集系统,它同时具有A/D和D/A转换功能,不仅价格低廉,而且兼容性好、性能稳定、灵活通用,驱动程序升级方便,在实验室中,如果测量对象的频率在音频范围,而且对指标没有太高的要求,就可以考虑使用声卡取代常规的DAQ设备。而且LABVIEW中提供了专门用于声卡操作的函数节点,所以用声卡搭建数据采集系统是非常方便的2。 2、声卡的硬件结构和特性 2.1声卡的作用和特点 声卡的主要功能就是经过DSP(数字信号处理)音效芯片的处理,进行模拟音频信号的与数字信号的转换,在实际中,除了音频信号以外,很多信号都在音频范围内,比如机械量信号,某些载波信号等,当我们对这些信号进行采集时,使用声卡作为采集卡是一种很好的解决方案。 声卡的功能主要是录制与播放,编辑与合成处理,MIDI接口三个部分3。 (1)录制与播放

音质标准音质标准与音质评价方法

音质标准音质标准与音质评价方法 ●音质标准 所谓声音的质量,是指经传输、处理后音频信号的保真度。目前,业界公认的声音质量标准分为4级,即数字激光唱盘CD-DA质量,其信号带宽为10Hz~20kHz;调频广播FM质量,其信号带宽为20Hz~15kHz;调幅广播AM质量,其信号带宽为50Hz~7kHz;电话的话音质量,其信号带宽为200Hz~3400Hz。 可见,数字激光唱盘的声音质量最高,电话的话音质量最低。除了频率范围外,人们往往还用其它方法和指标来进一步描述不同用途的音质标准。 对模拟音频来说,再现声音的频率成分越多,失真与干扰越小,声音保真度越高,音质也越好。如在通信科学中,声音质量的等级除了用音频信号的频率范围外,还用失真度、信噪比等指标来衡量。对数字音频来说,再现声音频率的成分越多,误码率越小,音质越好。通常用数码率(或存储容量)来衡量,取样频率越高、量化比特数越大,声道数越多,存储容量越大,当然保真度就高,音质就好。 声音的类别特点不同,音质要求也不一样。如,语音音质保真度主要体现在清晰、不失真、再现平面声象;乐音的保真度要求较高,营造空间声象主要体现在用多声道模拟立体环绕声,或虚拟双声道3D环绕声等方法,再现原来声源的一切声象。 音频信号的用途不同,采用压缩的质量标准也不一样。如,电话质量的音频信号采用ITU-TG·711标准,8kHz取样,8bit量化,码率64Kbps。AM广播采用ITU-TG·722标准,16kHz取样,14bit量化,码率224Kbps。高保真立体声音频压缩标准由ISO和ITU-T联合制订,CD11172-3MPEG音频标准为48kHz、44.1kHz、32kHz取样,每声道数码率32Kbps~448Kbps,适合CD-DA光盘用。 对声音质量要求过高,则设备复杂;反之,则不能满足应用。一般以“够用,又不浪费”为原则。 ●音质评价方法 评价再现声音的质量有主观评价和客观评价两种方法。例如:

八年级物理声音与环境测试题

第二章《声音与环境》单元测试题(新课标) 班级__________ 姓名__________ 得分__________ 一、选择题(每小题3分,共36分,从每小题的四个选项中选出一个符合题目要求的答案) 1、在城市道路常见如图所示的标牌,它表示的意思是:() A.鼓号乐队不能进入; B.禁止鸣笛,保持安静; C.道路弯曲,行车注意安全; D.乐器商店的标志。 2.你的邻居搞装修十分吵闹,干扰你的学习和生活,下列措施中哪一个是无效的:() A.赶快将门窗关紧; C.将窗打开让空气加快流通; B.用棉花塞住耳朵; D.将棉被挂在窗户上。3.在日常生活中,常用“震耳欲聋”来形容人说话声音的:() A.音调; B.响度; C.音色; D.都有可能。4.“女高音歌唱家”和“男低音歌唱家”这里的“高”与“低”指的是:() A.音调; B.响度; C.音色; D.都有可能

5.人们听不到蝴蝶飞的声音,却可以听到蚊子飞来飞去的嗡嗡声,这是由于 ( ) A.蝴蝶翅膀软,声音的响度太小; B.蝴蝶翅膀每秒振动的次数低于20次,超出人的听觉范围; C.蝴蝶翅膀振动时不会发出声音; D.蚊子数量多,蝴蝶数量少。 6.挑选瓷器时,常轻轻敲它一下,由声音来判断是否破损,是根据:( ) A.音调; B.音色; C.响度; D.以上都不对。 7.口琴和笛子同时演奏,我们一听便能从声音中区分出两种乐器发出的声音,这是因为两种乐器发出的声音具有不同的:( ) A.音调; B.频率; C.响度; D.音色。8.下面哪种声音对人体的健康是无害的:( ) A.风吹落叶发出的沙沙声; C.拖拉机开动的轰隆响声; B.电锯工作发出的声音; D.嘈杂公路上汽车的呜叫声。 9.小丽对乐音进行了下列的讲述,你认为其中不正确的是:( )

声单元检测题及答案

《第三章声》单元检测题 一、填空题 1、班级元旦联欢会上,某同学弹奏古筝,优美的琴声是由琴弦________产生的,琴声是通过__________传到其他同学耳中的。 3、小满用手机往家里打电话。他听出是妈妈在接电话,主要是依据声音的不同来判断的。妈妈让他说话大声些,这是要求增大声音的 4、北京时间4月16日,在美国波士顿举行的马拉松比赛中,发生了两起爆炸,造成多人伤亡。巨大的声响甚至将远处建筑物的玻璃都震碎了。其中,巨大的声响是指声音的;玻璃震碎了,说明声音能够传递。 5、交通噪声是城市噪声的主要来源之一,如图6所示,甲、乙两图分别表示了 在和 控制了噪声。 6、如图11城市主要道口设有噪声监测设备。某时刻该设备的显示屏上显示58.60的数字,这个数字的单位是,若此时有一辆大卡车路过此地,显示屏上显示的数据将(增大/减小)。噪声监测设备_______(能/不能)减弱噪声的强度。 7、“掩耳盗铃”是大家非常熟悉的故事,从物理学角度分析盗贼所犯的错误是:既没有阻止声音的,又没有阻止声音 的,只是阻止声音进入自己的耳朵。 8、如图11所示是用一根吸管做的笛子,在吸管上有五个孔,其中一个是吹孔。嘴对着吹孔吹,由于吸管内空气柱发生__________产生笛声。用手指按住其他不同的孔吹笛,可以听到不同的声音,这主要改变了声音的___________。 二、选择题 9、某同学对下列声现象进行分析.其中错误的是() 10、与声音传播速度有关的是 A.声音的音调 B.声音的响度 C.声音的频率 D.传播声音的物质 11、在演奏小提琴之前,演奏员要转动琴弦轴以调节琴弦的松紧,这主要是为了改变声音的 A.响度 B.音调 C.音色 D.振幅 12、有些老师上课时使用便携扩音设备,使声音更加宏亮,这是为了增大声音的 A.音调 B. 音色 C. 频率 D. 响度 13、琴弦发出的声音音调取决于: A.琴弦的长短; B.琴弦的粗细; C.琴弦的松紧; D.琴弦的好坏. 14、针对图中各图,下列说法正确的是() A、甲图中,演奏者通过手指在弦上按压位置的变化来改变发声的响度 B、乙图中,敲锣时用力越大,所发声音的音调越高 C、丙图中,随着向外不断抽气,手机铃声越来越小 D、丁图中,城市某些路段两旁的透明板墙可以减小噪声污染 四、计算题 15、利用回声可以测量声源到障碍物的距离。科学工作者为了探测海底某处的深度,从海面向海底垂直发射超声波,经过4s后接到回波信号。已知声音在海水中的传播速度为1500m/s,请回答下列问题:

matlab频谱分析仪

频谱分析仪 摘要频谱分析仪是研究电信号频谱结构的仪器,用于信号失真度、调制度、谱纯度、频率稳定度和交调失真等信号参数的测量,是一种多用途的电子测量仪器。随着软硬件技术的发展,仪器的智能化与虚拟化已成为未来实验室及研究机构的发展方向。虚拟仪器技术的优势在于可由用户定义自己的专用仪器系统,且功能灵活,很容易构建,所以应用面极为广泛。本文介绍了一种使用GUI工具箱用matlab实现的简易虚拟频谱分析仪的设计方法。 关键词matlab,频谱分析仪,时域分析,频域分析

目录 1概述 (3) 2技术路线 (4) 3实现方法 (5) 3.1搭建GUI界面 (5) 3.2信号输入 (6) 3.2.1选择信号输入 (6) 3.2.2声卡输入 (7) 3.2.3读取wav文件 (7) 3.2.4信号发生器输入 (7) 3.3时域分析 (8) 3.4频域分析 (9) 3.5仿真 (10) 3.5.1声卡输入 (10) 3.5.2读取wav文件 (10) 3.5.3信号发生器 (11) 4存在的问题 (15) 5致谢...................................................................................................... 错误!未定义书签。参考文献 (15)

1概述 MATLAB是矩阵实验室(Matrix Laboratory)的简称,是美国MathWorks公司出品的商业数学软件。可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。图形用户界面(Graphical User Interface,简称GUI,又称图形用户接口)是指采用图形方式显示的计算机操作用户界面。与早期计算机使用的命令行界面相比,图形界面对于用户来说在视觉上更易于接受。MATLAB自带了强大的GUl工具[1]。在本文中,将利用MATLAB的GUI工具,设计出数字频谱分析仪。 频谱分析仪是研究电信号频谱结构的仪器,用于信号失真度、调制度、谱纯度、频率稳定度和交调失真等信号参数的测量,可用以测量放大器和滤波器等电路系统的某些参数,是一种多用途的电子测量仪器。它又可称为频域示波器、跟踪示波器、分析示波器、谐波分析器、频率特性分析仪或傅里叶分析仪等。现代频谱分析仪能以模拟方式或数字方式显示分析结果,能分析1赫兹以下的甚低频到亚毫米波段的全部无线电频段的电信号[2]。目前已经有许多较成熟的频谱分析软件,如SpectraLAB、RSAVu、dBFA等[3]。本文将给出的则是通过MATLAB软件实现的基于FFT的数字频谱分析仪。 FFT(Fast Fourier Transformation),即为快速傅氏变换,是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅立叶变换的算法进行改进获得的。它对傅氏变换的理论并没有新的发现,但是对于在计算机系统或者说数字系统中应用离散傅立叶变换,可以说是进了一大步[4]。 通过此次设计,能进一步掌握MATLAB软件开发过程的基本理论、基本知识和基本技能,熟悉基于MATLAB平台的若干信号处理系统开发及调试方法,且成本低,易于实现,容易修改,并可以进行仿真。该设计的进行可以为我们以后的学习工作奠定一定的基础。

音频信号的种类及其质量特性

音频信号的种类及其质量特性 作者:辽宁广播电视传输发射中心二O三台赵军 数字技术的发展突飞猛进,电视伴音的数字技术也有了长足发展,现就声音方面所涉及的技术知识做一简要介绍。 目前,大部分使用的电声器件都是以模拟方式工作的。传声器输出的是模拟音频信号,扬声器需要的激励信号同样是模拟音频信号。器件的客观情况,决定了音频信号的数字化只能是其传输系统的中间环节。但由于其具有极好的保真度和极强的抗干扰性,所以在数字音频没有进入数字电视之前,就开始了探索研究,并取得了一定成果,已经在传统的音响系统领域得到了广泛应用。现就两方面做一介绍: 一、音频信号的种类 1.按声音传递信息内容区分 人耳可以听到的声波信号的频率范围为20~20KHZ。按声音传递信息的内容不同,音频信号可分为3种类型。 (1)波形声音 波形声音是指声波振动产生的声音。显然,波形声音实际上已经包含了所有的声音形式。 它可以成为人们理解声音的最一般形态,就好像可以把各种类型图像都理解成像素点阵图一样。 (2)语音 语音就是指人讲话的声音,特点就是包含有丰富的语言内涵。传送语音信号的基本要求是既能听清语音的内容,又能辨认出讲话者是谁。 (3)音乐 音乐与语音相比内容更丰富、所占频带更宽,同时表现形式更为规范,也可以说是符号化了的声音,乐谱就是音乐的规范表达形式。也就得出,传输音乐信号对系统的要求有多高,难度有多大。也是最高、难度最大的。 2.按声音所占的频带区分 从音频信号所占的频带、数字化时的抽样频率及量化的比特数不同,音频信号可以分为4类。 (1)窄带语音 窄带语音又称电话频带语音,信号频带为300~3.4KHZ,带宽为3.1KHZ,既能听清语音的内容,也能分辨出讲话人是谁,主要用于各类电话通信。数字化时抽样频率常用8KHZ,每个样值以8bit量化,数码率为64bit/s。 (2)宽带语音 信号频带为54~7KHZ,能提供比窄带语音更好的音质,常用于电话会议、视频会议等。 数字化时抽样频率多为16KHZ。 (3)数字音频广播(DAB)信号 信号频带为20~15KHZ,有较好的音质,主要用于声音广播和电视伴音广播。数字化时抽样频率常用32KHZ。 (4)高保真立体声音频信号 信号频带为20HZ~20KHZ,为人耳听觉的全部频带故称为高保真,用于DVD、VCD、CD、HDTV伴音等。数字化时抽样频率用44.1KHZ或48KHZ,每个样值16bit量化,

第二章声音与环境测试题

声音与环境》测试卷( 满分:100 分)姓名:_______ 学号:______ 成绩: ___________ 一、填空题( 每空 2 分,共26 分) 1.下列与声有关的语句中,所表达的物理含义是: (1) 节日里的锣、鼓声“震耳欲聋”,说明锣鼓声的 _______________ 大. (2) 小女孩的讲话“脆如银铃”,说明小女孩说话声的 _______________ 高. (3) 用小提琴和二胡演奏“二泉映月”乐曲时,我们可以根据声音的 _______________ 不同来加以辨别. 2.2005年春节晚会上,聋哑人表演的“千手观音”震撼了所有观众。她们是怎样训练的呢?听不见声音, 她们将身体紧贴在音箱上,感受音乐的节奏,因为声音是由_______________ 产生的。 3.东林书院名联“风声、雨声、读书声,声声入耳”表明声音可以在_________ 中传播; 4.声音在介质中以_______ 的形成向远处传播.声音传播过程中能引起别的物体发生 _________ ,超声波还能粉碎人体内的结石,说明声音具有 _____________ .5?科学工作者为了探测海底某处的深度,向海底垂直发射超声波,经过3s,收到回波信号,海洋中该处的深度为 __________________ m声音在海水中传播的速度是1531m/s),这种方法能不能用来测量月亮到地球的距离?为什么? ___________________________________ 6.百米赛跑中,甲、乙两个记时员,分别从看到发令枪冒烟和听到枪声开始记时同一运动员成绩,则 __________ 记录成绩较准确。 7 ?频率____________________ HZI勺声音为次声波; 频率_____________________ HZ勺声音为超声波.

初中物理声学习题单元测试doc

新课标初二物理声学练习题及答案 一、单选题:本大题共50小题,从第19小题到第24小题每题1.0分小计6.0分;从 第25小题到第68小题每题2.0分小计88.0分;共计94.0分。 19、通常我们听到的声音是靠________传来的. A.电磁波 B.真空 C.空气 D.耳朵的鼓膜 20、如果回声到达人耳比原声晚________秒以上, 人耳才能把回声跟原声区分开. A.1秒 B.0.1秒 C.0.01秒 D.0.001秒 21、我们能够分辨出各种不同的乐器的声音, 就是由于它们的________不同. A.音调 B.响度 C.音色 D.振幅 22、人们能分辨出胡琴、钢琴、笛子的声音, 是因为它们发出声音的________不同. A.音调 B.响度 C.音色 D.振幅 23、声音是由发声体的________而产生的. A.运动 B.振动 C.温度升高 D.体积膨胀 24、在百米赛跑终点的计时员, 如果在听到枪声后才开始计时, 那么, 他开始计时的时间比运动员起跑的时间晚________秒(V声=340米/秒). A.0.3 B.3.0 C.30 D.300 25、用小提琴、钢琴、长笛、二胡分别演奏同一首曲子.我们完全可以分辨出是哪一种乐器演奏的.因为这几种乐器有[] A.不同的音调B.不同的音色C.不同的响度D.不同的人弹奏 26、关于噪声,下列说法中错误的是[] A.0dB就是没有声音 B.雪后的街道上格外寂静,是因为松软的雪可以吸声 C.特种兵使用的微声冲锋枪射击时,声音很小是因为采取了消声措施 D.城市高速公路两旁放置的隔声板是为了阻隔汽车行驶时发出的噪声

27、闻其声而不见其人,你往往能根据说话声就可以判断出是谁在讲话,这是因为不同的人的声音具有不同的[] A.振幅B.频率C.响度D.音色 28、大型剧场的四壁和屋顶往往用蜂窝状材料来装饰,使其表面凸凹不平,这是为了[] A.减弱声波反射,吸收声波B.增大声音的响度 C.只是为了装饰,使其美观D.增强声波的反射 29、我们去医院看望病人,说话时要“低声细语”.这里的“低”是指[] A.说话音调低一些B.说话响度小一些 C.说话语速慢一些D.说话频率慢一些 30、人在教室里说话听不到回声的原因是[] A.教室的墙壁反射回来的声音互相抵消 B.声音从教室的门窗处传播出去了 C.教室的空间太小,回声与原声混在一起,人耳分辨不出来 D.教室的空间太小,没有产生回声 31、我们能听到物体发出的声音,是因为[] A.有声源B.有物体C.发声体在振动D.有传声介质 32、演奏各种乐器时,人们能分辨出是什么乐器,这是由于各种乐器发出的声音具有不同的[] A.音调B.响度C.音色D.以上三个因素 33、下列说法正确的是[] A.人听声音是靠耳朵接收空气中的声波 B.声波只能通过液体和空气传播,不能在固体中传播 C.声音遇障碍物反射回来时,传播的速度会减慢 D.声音从空气中传入水中,传播的速度减小 34、演唱会上,女高音引吭高歌一首歌曲,其两“高”的意思分别指[]

Adobe-Audition-系列教程(二):频谱分析仪

Adobe Audition系列教程(二):频谱分析仪 频谱分析仪是研究信号频谱特征的仪器,在电子技术一日千里的今天,是研究、开发、调试维修中的有力武器。现代频谱分析仪都趋向于智能化,虚拟仪器技术广泛应用,有些就是以专用的计算机系统为核心设计的。其结果是结构大大简化、性能飞速提高。当然专业的频谱分析仪就比示波器更加昂贵了,业余爱好者更难用上。不过不必灰心,我们可以充分利用AdobeAudition的频谱分析功能,让你拥有精确频谱分析仪的美梦成真!? 1. 频谱显示模式? Adobe Audition本身有一种“频谱显示”模式。先打开一段波形,或用《妙用Adobe Audition:数字存储示波器》一文介绍的方法录制一段波形,即可进行频谱分析。这里我们新建一段20秒的对数扫频信号(本文大多选用直接建立的波形,以便了解信号原始波形的标准频谱特征),然后选择“View=>Spectral View”(视图=>频谱),如图1,或点击快捷工具栏的“Toggle between Spectral and Waveform views”(切换频谱视图/波形视图)按扭,即可将波形以频谱显示的方式显示出来,如图2。扫频的频谱显示见图3。 图1

图2 图3 可以看到,横轴为时间,纵轴为频率指示。每个时刻对应的波形频谱都被显示出来了,可以看到扫描速度是指数增加的,即将频率轴取对数时扫描速度是线性的。如图中光标处18秒处频谱指示约11KHz。实际上频谱指示的颜色是代表频谱能量的高低的,颜色从深蓝到红再到黄,指示谱线电平由低到高的变化。这实际上跟地图的地形鸟瞰显示是比较相似的,看图4频谱复杂变化的声音频谱就更容易理解这点了。 图4

光纤声音采集系统

摘要:科技的发展带来许多电磁干扰或射频干扰的恶劣环境,要想解决电磁干扰问题的,必须从本质上改变麦克风的工作模式。文章提出了利用激光的传输频带宽、通信容量大和抗电磁干扰能力强等优点,研制一种基于光相位干涉的高灵敏度声音采集系统。光纤声音采集能够传送非常高的声音质量,适用于多种恶劣环境下的声音采集。 关键词:光纤声音采集、干涉型光纤传感器 引言: 麦克风在声场和电场中起着重要的沟通界面,它可将声音信号传至任何地方或者记忆装置。传统型的使用电磁场或静电场来产生动作,外部的强电磁场影响会阻绝这些装置的功能。本项目研制的光纤声音采集系统是一种新颖的声音信号传感器,在反射式强度型光纤传感器的原理基础上,利用激光来采集声音信号,由于它与传统的麦克风有着本质的区别,所以在使用方面具有很大的优越性。系统由非导磁材料制成,其主要工作本体是光,即使在强电磁场或高射频环境中也能正常工作。把光纤应用于麦克风,充分利用了光纤传感器体积小、结构简单、灵敏度高、抗电磁干扰且光纤本身低损耗、耐腐蚀、安全可靠等优良特性。 1、系统结构 本系统利用干涉型光纤传感器的原理,开发基于光相位干涉的高灵敏度声音采集系统,由光纤传感探头、光路系统、光信号调制解调器等部分组成。 干涉型光纤传感器通常将被测量转化为光信号的相位,因此,相位测量是该类型传感器信号处理的基本要求。若直接对相位进行测量,那么有两个问题将限制系统的性能:一是系统受到环境的干扰时被测相位会产生随机漂移,从而引入测量误差,此外,相位漂移还会导致信号衰减;二是直接测相意味着直流检测,信号处理易受电路直流漂移的影响。针对这两个问题引出了相位生成载波技术。相位生成载波调制是在被测信号带宽以外的某一频带之外引入大幅度的相位调制,被测信号则位于调制信号的边带上,这样就把外界干扰的影响转化为对调制信号的影响,且把被测信号频带与低频干扰频带分开,以利于后续的噪声分离。 项目研制的光纤声音采集系统,在对传统michelson干涉仪加以改进的基础上,通过构造由光纤耦合器和振动膜组成的动态michelson干涉光路,能够将外界声压对振膜的作用转化为对光路相位的调制,得到的干涉光信号直接光电转换后即可解调还原声音信号。在多种干涉型光纤传感器的解调方法中,相位生成载波解调技术(pgc)由于是一种无源解调技术,并具有高灵敏度、大动态范围和好的线性度而得到广泛的应用。 2、系统原理 2.1光纤传感探头原理: 激光器发出的激光经耦合器到达传输光纤,由光纤出射的光束照射到振动膜上,传输光纤出射端面m1与振动膜构成一个干涉腔,从两表面反射回的光进行干涉,干涉光再经耦合器由光电探测器接收,外界声音信号通过改变干涉腔的光纤出射端面m1和振动膜之间的距离对光相位进行调制。系统中半导体激光器发出的光源光频随输入的调制电流线性变化,振动膜采用硅微技术进行研制。 2.2解调原理: 光纤声音采集系统中的调制解调器是由光源,光电转换器,高增益微弱信号放大电路,背景噪声消除器等组成。 光源向光纤传感头发射一稳定的激光,传感头内的振动薄膜被周围声音振动信号带动,从而对发射到振动薄膜上的激光进行相位调制后再反射回去,被调制的激光在光路系统里发生干涉,形成携带微弱声音强度的激光信号,光电转换系统的探测器将此激光信号转换成电信号,再经高增益微弱信号放大,pgc解调,噪声滤除,后将解调后的电信号还原成声音信号输出。

谈音质的标准及音质评价方法

谈音质标准与音质评价方法鉴别好音质 ●音质标准 所谓声音的质量,是指经传输、处理后音频信号的保真度。目前,业界公认的声音质量标准分为4级,即数字激光唱盘CD-DA质量,其信号带宽为10Hz~20kHz;调频广播FM质量,其信号带宽为20Hz~15kHz;调幅广播AM质量,其信号带宽为50Hz~7kHz;电话的话音质量,其信号带宽为200Hz~3400Hz。可见,数字激光唱盘的声音质量最高,电话的话音质量最低。除了频率范围外,人们往往还用其它方法和指标来进一步描述不同用途的音质标准。 对模拟音频来说,再现声音的频率成分越多,失真与干扰越小,声音保真度越高,音质也越好。如在通信科学中,声音质量的等级除了用音频信号的频率范围外,还用失真度、信噪比等指标来衡量。对数字音频来说,再现声音频率的成分越多,误码率越小,音质越好。通常用数码率(或存储容量)来衡量,取样频率越高、量化比特数越大,声道数越多,存储容量越大,当然保真度就高,音质就好。 声音的类别特点不同,音质要求也不一样。如,语音音质保真度主要体现在清晰、不失真、再现平面声象;乐音的保真度要求较高,营造空间声象主要体现在用多声道模拟立体环绕声,或虚拟双声道3D环绕声等方法,再现原来声源的一切声象。 音频信号的用途不同,采用压缩的质量标准也不一样。如,电话质量的音频信号采用ITU-TG·711标准,8kHz取样,8bit量化,码率64Kbps。AM广播采用ITU-TG·722标准,16kHz取样,14bit量化,码率224Kbps。高保真立体声音频压缩标准由ISO和ITU-T联合制订,CD11172-3MPEG音频标准为48kHz、44.1kHz、32kHz取样,每声道数码率32Kbps~448Kbps,适合CD-DA光盘用。 对声音质量要求过高,则设备复杂;反之,则不能满足应用。一般以“够用,又不浪费”为原则。 ●音质评价方法 评价再现声音的质量有主观评价和客观评价两种方法。例如: 1.语音音质 评定语音编码质量的方法为主观评定和客观评定。目前常用的是主观评定,即以主观打分 (MOS)来度量,它分为以下五级:5(优),不察觉失真;4(良),刚察觉失真,但不讨厌;3(中),察觉失真,稍微讨厌;2(差),讨厌,但不令人反感;1(劣),极其讨厌,令人反感。一般再现语音频率若达7kHz以上,MOS可评5分。这种评价标准广泛应用于多媒体技术和通信中,

新沪粤版《第二章-声音与环境》单元测试卷及答案

~ 新沪粤版《第二章声音与环境》单元测试卷及答案 班级姓名得分 一、选择题(每空只有一个正确答案,把你认为正确答案的序号填写在题后的括号内, 不选或错选得0分) 1. 下列关于声音的说法正确的是()A.声音从空气传到水中后,传播速度将变小 】 B、工人用超声波清洗钟表等精细的机械,属于声的利用 C、人能分辨出二胡和小提琴发出的声音,主要是因为它们的音调不同 D、在医院、学校附近机动车禁呜喇叭属于噪声的利用 2. 关于声现象不正确的说法是()A.只要物体在振动就一定能听到声音 B.听到声音一定有物体在振动 C.一般说来声音在固体中比液体中传播得快 D.声音的传播要介质 3. 流星落在地球上会产生巨大的声音,但它落在月球上,即使宇航员就在附近也听不到声音,这是因为()《 A.月球表面受到撞击时不发声 B.撞击声太小,人耳无法听到 C.月球表面没有空气,声音无法传播 D.撞击月球产生的是超声波 4.在图3中属于减弱噪声的是()

5.下列关于声现象的说法中,不正确的是()A.悦耳动听的歌声是由歌唱家的声带振动发出的 B.声音传播需要介质,真空不能传声 C.声音在固体中的传播速度大于在空气中的传播速度 # D.声音在各种介质中的传播速度是一样的 6.通常,人们会从噪声的产生、传播及接收三个环节控制噪声,下列措施中,属于在产生环节控制噪声的是()A.临街的房屋安装隔音玻璃 B.学校附近禁止汽车鸣笛 C.在高噪声环境下工作的人戴耳罩 D.在公路两侧设置屏障墙 7.医生用听诊器诊病是因为()A.听诊器能改变发声体的频率,使音调变高 B. 听诊器能使振动的振幅增加,使响度增大 | C. 听诊器能缩短听者距发声体间的距离,使传入人耳的响度更大些 D. 听诊器能减小声音的分散,使传入人耳的响度更大些 8.要使二胡发出的声音的音调变高,应采取的办法是()A.把弦拉得紧些 B、把弦放松些 C、增加发声部分的长度 D、用更大的力拉琴 9.将敲响的锣面用手一按,响声马上消失,这是因为()》

相关文档