文档库 最新最全的文档下载
当前位置:文档库 › 低速声码器的发展概况

低速声码器的发展概况

低速声码器的发展概况
低速声码器的发展概况

声码器技术的发展

学院:

班级:

姓名:

学号:

指导教师:

摘要

语音编解码技术的迅速发展,使中低速率语音编码技术广泛应用于现代移动通信。声码器特别适用于以低比特率为首要条件的通信场合, 较典型的应用包括标准电话信道上的保密语言传输和小型化数字存贮器中的语言存贮。在某些长距离无线通信中, 人们宁可使用声码器而不愿意用目前音质低劣的模拟传输系统。目前, 质量令人满意的实用语言编码器的比特率下限为2400bps,这个比特率是由线性预测编码和通道话音编码获得的。现在正在进行大量的研究工作, 其目的是要获得低于2400bps的比特率而又要使语言质量不下降或下降很少。这个研究课题是一个既基本又具有实用价值的课题。声码器正向着速率更低、语音质量更好,延时更短,算法更复杂,抗干扰能力更强,带宽要求更小的方向发展。本文主要介绍国外声码器的发展概况、若干种低速声码器的技术原理和结果, 并推测未来的工作。

关键字:声码器发展、线性预测编码、低比特率

一、引言

自首次成功地尝试建造一台能够模拟人声的机器以来,已经大约有两百年了。两百年中中人们曾建造了各种各样的这类机器, 成功的情况也各不相同, 年轻时的贝尔和他的兄弟就曾致力于建造一台这样的机器, 但取得实质性的进展却是电子系统问世之后的事。1939年纽约世界博览会上,一项叫做“语言合成器”(Voder)的发明引起了轰动。这个语言合成器实质上是一台电子器件, 它通过完全的电子方式分析人类的语言, 然后又把它综合出来。该系统后来称之为“声码器”(话音编码器),声码器标志了语言编码新纪元的开始, 声码器这个名词也一直沿用至今而作为一大类系统的属名。近年来, 声码器的研究变得日益重要了, 这在很大程度上取决于数字化技术和语言编码的大规模应用。

语言数字化有两种根本不同的途径, 一种称之为波形编码, 另一种称之为参数编码。实现参数编码的硬件就是声码器。目前, 降低比特率是一个有重大意义的研究课题,为降低声码器的比特率而采取的所有方式都是利用了如下三个基本思想中的一个、两个或三个。

1)时间多余度压缩:由于在稳态条件下, 帧与帧之间的语言特性相同, 所

以利用帧重复或其它的差分编码技术便可大大地降低比特率。

2)参数组压缩:只要新参数组对于量化并不比原参数组更敏感, 则采用比较节省的参数组便能压缩比特率。另外, 采用比较好的模型如共振峰模型, 或应用某些变换Karhunen-Loeve变换, 可以获得较少的参数组。

3)改进的量化技术:在以低比特率语言传输为目的而广泛开展语言分析技术研究的同时, 量化问题也受到了一定程度的重视。量化问题的研究大体上局限于单独地量化每个参数的技术。基本的量化理论、模式匹配的若干研究以及最近对于LPC矢量量化的研究都证明参数矢量量化具有奇迹般地降低比特率的潜力。

现在国外的低速声码器研究工作非常活跃, 美国、西欧和日本的许多公司、研究所,还有苏联都在进行这方面探索, 有的已获得令人鼓舞的计算机模拟结果, 有的已制成实验室样机。当然, 在研究中不可避免地遇到了这样或那样不易克服的困难, 距实际应用还有一定的差距。

二、低速声码器的发展概况

在低速声码器研究中, 共振峰声码器由于其比特率低曾一度备受青睐。共振峰声码器的概念最早是由J.L.Flanagan在一九五六年提出来的, 并作成试验性质的共振峰声码器样机, 效果虽然不太令人满意, 但却证明其前途是广阔的。五十年代末和六十年代初, 英国、美国和日本的许多公司相继开始研究共振峰声码器, 其研究和开发工作绝大部分都是在政府资助下以军用为目的进行的。如美国通用电气公司在一九六一年研制出共振峰声码器模型, 其比特率为1350bps, 单音清晰度达90%, 另外如美国的Melpar、Philo。通用动力公司及英国的信号研究与开发中心等也曾在六十年代初研制成速率为1000bps以下的共振峰声码器, 英国航空部通信研究所研制的800bps共振峰声码器的清晰度和可懂度都比较好。但是共振峰声码器的研究没有获得如通道声码器那样的成功, 因此它作为实验室里的古董多于作为实际的通信装置。

七十年代初, 大家都公认共振峰声码器概念由于其低比特率编码而颇具吸引力, 但也有它的实际困难。除有通道声码器的基音跟踪和有无声判决间题之外, 共振峰声码器还有恰当的共振峰跟踪、共振峰识别、静止期后的共振峰跟踪搜索及综合, 特别是辅音产生的综合等题, 这样就使得声码器的潜在用户转而对这

种低比特率的话音编码方法持怀疑态度。Moye可作为这种怀疑者的例子, 他说:“虽然这种说法肯定要受到挑战, 但人们却可以说从实用数字语言传输观点来看, 共振峰分析行不通。”其它人如日本的电子和通信工程研究所的Y.Kato等也表明了类似的观点。

七十年代初还报道有另外三种比较有代表性的极低速话音数字化装置, 碰巧它们的速率均为600bps。一是Flanagan在1970年实验论证的一种以600bps 速率工作的共振峰跟踪声码器, 他用唱片表演了他的成果。由于试验句子包括了所有的元音、双元音和流音,所以这是600bps 话音数字化装置的一个非常有限的试验论证。虽然如此, 但其综合语言却非常清晰, 表明共振峰声码法在话音分析综合方面具有潜力。第二种600bps的话音数字化装置则是由空军剑桥研究实验室Caldwell Smith等研制成的, 该装置采用模式匹配技术把通道声码器的输出分类, 系广泛的研究和开发工作的结果。其单一讲话人诊断韵律试验(DRT)的清晰度得分92% , 这对于600bps的话音编码系统可谓是一个非常高的得分。第三种600bps的系统则是Melpar公司所研制共振峰声码器的一种修正型。

一九七六年底, 美国海军研究实验室G.S.Kang和D.C.Coulter等研制成了一种线性预测共振峰声码器。它可以600bps的速率传输语言, 这个数据率还不到原始语言脉码调制传输率的百分之一。这项研究工作是在迫切需要极低速话音数字化装置以满足当时海军某些话音通信需要的前提进行的。600bps系统的综合语言较原始语言有某些损失, 但其清晰度之高却足以允许在某些特定的军用通信场合下使用该系统。

法国也进行了低速音码器的研究。一九七五年法国的Thomson-CSF公司电信部当年的《Thomson-CSF评论》第七卷第四期上报道, 他们研制成一种叫做“Ciphon”的声码器, 即峰线声码器。这种声码器与其说是试图模拟声源的生理特性, 还不如说是致力于模拟人耳并辨别“清晰的声学特性”。它有两个主要特性:

一是能以数字形式传输频带覆盖为300~3400Hz的电话信号, 且恢复话音质量好,懂度也较高。

二是根据编码的复杂性,可获得两种速率:处理时延不超过100ms时为1200bps;处理时延不超过300ms时为600bps。

尽管和其它类型声码器相比原理不大一样, 但峰线声码器在技术上却可与它们媲美。与标准的通道声码器相比, 它可以低得多的速率提供优质语言, 与共振峰声码器相比, 它运算简单。这样, 从实用角度出发, 可以考虑实时工作设备的实现。

峰线声码器可用于无线(尤其是HF)和有线通信。借助于相应的调制解调器, 便可在交换网电话线路上作全双工通信。

一九八二年五月在巴黎IEEE的ASSP国标年会上, 西德赫兹通信技术研究所https://www.wendangku.net/doc/301786815.html,croix和B.Makel提出了一种比特率极低的声码器方案。该声码器以标准LPC 声码器为基础, 由4~5节变长管组成声管模型, 采用带附加近似的自相关分析法计算变长声管模型的参数, 取得了极好的效果。非正式收听测试证明,1000bps 的声码语言质量儿乎与标准的2400bpsLPC声码器的话音相同, 但这个结果仅限于某个人讲话或某个句子。

一九八一年, 美国麻省理工学院Lincoln实验室R.J.Mcaulay提出了一种采用自适应子带振峰分析的低速声码器。该分析技术通过将二阶频谱与已测得频谱的单个子带适配来避免共振峰跟踪所固有的某些问题, 综合采用高质量的通道声码器进行, 所以调制器的增益由有声语言的共振峰分析包络抽样或无声语言的低阶LPC包络抽样来调整。根据固定带宽准则, 只传输三个谐振段的每个段的频率和增益, 再加上对数编码和帧充填法, 便获得了800bps的可懂声码器语言。更仔细地分配6个传输参数的比特数, 还能获得更低的比特率。例如Flanagan就建议可用4比特编码第一和第二共振峰, 而第三共振峰只需3比特。他还觉得3比特足够编码共振峰幅度, 因此, 基音和有无声判决用6比特, 帧充填控制用3比特, 则用28比特编码有声语言谱就应当是能办到的, 在帧速率为25Hz时就相当于只有700bps的速率。如果采用更加先进的帧充填插入算法, 则可以获得更低的速率。

其它如一九八一年TI公司(得克萨斯仪器公司)的 Knn - Shan Lin 和 Ying L.Tsui经过对LPC反射系数特性的仔细研究, 揭示了利用高效参数编码及最佳化帧重复进一步压缩数据率的可能性。他们在探讨中使用了利用对数面积比距离量度的经改进的成本函数及能量加权函数,并在保持频谱失真不超出预定门限值灼同时利用动态规划法使帧长度最大。利用TI公司的TMS 5100或TMS 5200实

施方案, 便可以800~850bps的速率获得高质量的语言。再如一九八年TRW公司国防和空间系统研究组的 T.E.Carter、D. M. Dlugos及D. C. Le Doux等研制成了一种800bps的实时话音编码系统。该系统由TRW公司生产的微程控话音处理器(采用11K字存贮器)实现,DRT和其它的测试结果表明其可懂度和清晰度都令人满意, 完全可以用于话音通信。这种低数据率是通过一种高编码2400bps 的LPC参数的算法获得的, 这种新的算法运用了其它类型通信系统所常见的若干数据压缩方案以获取所需的数据率, 这些方案包括自适应DPCM、K.L.变换、统计最住量化和动态比特分配等。其未来的工作应是进一步改进算法, 提高性能, 其最大的潜力可能在于用各种比特分配方案进行试验。由于要实施系统,对基本2400bpsLPC算法也还须进行若干改进。这些都会直接反映到800bps语言的质量之中。

有一种方法, 刚提出来的时候叫做“模式匹配声码器” , 后来又称作“矢量量化”, 就是在谱形参数组合的全部可能范围内仅仅选择极小部分。在通道声码器、LPC声码器和共振峰声码器中, 谱形参数所确定的多维空间占据极不均匀, 大部分空间根本未利用。根据某种恰当的准则, 选择最接近有限数量的存贮谱形的目前输入,便可能用大约每帧 10 ~ 12 比特而不是每帧40比特来较好地确定谱形。通道声码器和LPC声码器的这种类型的系统已在实验室里证明可采用400 ~ 800bps的数字速率。

在七十年代后期, 以 A.H.Gray Jr.、R.M.Gray和J.D.Markel为首的一些电信研究专家在高效编码LPC参数方面作出了重大突破。在这以前, 系数都被变换为其它的“空间”以去掉其相关性, 然后分别量化。这里说所的重大突破就是将表征特定声音的频谱紧紧地集为一组来实现, 以便用较少的频谱来表征一般人发那个声音的所有可能方式。由于在任何口语中都只有有限数量的声音或音素, 所以可用有限数量的频谱来表征语言中的所有声音。他们发现, 用大约1000种不同频谱或等效的1000个LPC系数矢量就能构成所有成年讲话人的一组有代表性的频谱。

这些频谱应当是什么呢?确定的方法之一就是利用实时数据, 把它们分成若干组, 然后把这些组的重心作为有代表意义的频谱。如果有足够多的组, 则每一组代表一个单一的性质不同的声音。通常为易于计算起见, 人们从几何形状出发,

找出最好的两个频谱, 然后最好的4个, 然后最好的8个等等, 所得的重心称为

1比特, 2 比特, 3比特等的码书。

在利用矢量量化进行LPC分析过程中, 首先实施一般的LPC分析, 然后将输入语言的LPC矢量与码书中的表值进行比较, 频谱距离量度规定了输入LPC矢量和码书表值之间的差值, 选择与原始矢量频谱距离最小的表值作为输出矢量。若采用10系数和10比特的码书的分析, 这就意味着可用10 比特来量化频谱, 平均每个系数仅1比特。

以矢量量化技术为主、再结合其它的高效编码技术研制成低速声码器的例子很多, 这一研究工作也非常活跃。如IEEE的会员和高级研究员 D. Y. Wong、B.

H.Juang和A.H.Gray.Jr等在在一九八二年研制成一种800bps的矢量量化线性预测声码器。他们应用最新形成的LPC矢量量化理论使LPC系数编码的比特率下降到原来的四分之一, 同时应用分支搜索技术分离有声/ 无声码书获得了较好的算法效率。此外, 他们还利用差分编码技术将基音和增益参数的比特率降低了三分之一。

正式的主观评价表明, D.Y. Wong等研制成的800bps声码器保留了LPC系统的绝大部分可懂度, 在各种传输误码和声学环境下都显得非常健全实用。非正式的收听比较表明其音质是令人满意的, 有时还非常接近2400bps的LPC语言。该系统的计算成本相当甚至还低于2400bps的LPC-10的成本, 并保证与LPC -10相兼容, 这是因为800bps声码器的设计仅在量化和编码算法上不同。若压缩或消除声码化参数过程中的帧间多余度, 还可使总比特率减少到400bps以下而保持可接受的清晰度和可懂度。其技术包括压缩无声码书、帧重复编码和新开发的矩阵编码等。一九八三年,D.Y.wong (语言技术实验室)、B.H.Juang(贝尔实验室) 再度和加里福尼亚大学的D.Y.Cheng合作研究帧预测矢量量化,将编码LPC滤波器系数的比特率压缩到 250bps 以下, 同时还利用新的LPC压缩技术—矩阵量化—进一步将LPC滤波器系数压缩到150bps以下。采用DRT进行主观评价证明他们所提出的技术对于以400bps到200bps之间的比特率传输可懂语言是完全可行的, 目前他们正继续其研究工作, 改进矩阵量化技术及时标、基音和增益参数的编码算法, 提高系统质量和健全实用性, 使计算和存贮要求最佳化, 以利实时实现和完全实现以 200~400bps 之间的速率工作的语言编码器。

一九八三年美国麻省理工学院林肯实验室的D.B.Paul 提出了一种采用感觉距离量度的自适应矢量量化算法。这种自适应是通过连续改变样板组使之与目前的讲话人和状况相适应来实现的。距离量度逼近听觉感觉的目的是使样板应用最佳化。同时, 他还设计出了不需要附加信道带宽的自适应规程。应系统800bps 信道上获得了86.8%的可懂度得分( DRT试验),再把这种系统与频谱帧充填技术相结合, 便获得数据率低到500bps而可懂度仅微微有些下降的声码器系统。这里所采用的系统是含Gold基音预估器的频谱包络预测声码器。这些系统证明, 矢量量化声码器或叫样板声码器, 虽然其计算的复杂程度为标量量化声码器的二倍甚至三倍, 但在极低数据率的信道上使用却不愧是一种非常实用的算法。

矢量量化技术己被人们公认为是信号编码的一种高效率的新方法。上面的例子及最近的研究工作都已证明, 把矢量量化概念用于LPC编码技术,能研制出极低比特速率的语言编码器。一九八三年国立台湾大学电气工程系的Shiann-ning Jean和Lin-shan Lee提出了一种进行自相关预估的限幅法, 从而简化了LPC计算, 提高了LPC实际应用的可行性。这种简化LPC的概念是由预先白化语言信号提取基音过程中的限幅技术发展而来的。将这种简化LPC算法与失量量化相结合就容易获得极低的比特率。在此基础他们又研究出了大量去掉帧间多分度而又毫不降低语言质量的高效编码LPC矢量的新算法, 再加上颇为吸引人的帧重复技术, 实现了一种采用简化算法的高效低比特率编码器。模拟结果表明, 要获得极好的语言质量, 声道信息平均有声语言仅需6.87 比特/帧,无声语言仅需3.62比特/帧, 就很容易获得大约550~600比特/ 秒的比特率, 而且计算量大大减少。因此, 这样的结果对语言数字化应用和未来的语言通信网将非常有用。

虽然尚未证实, 但在原理上似乎还找不到什么理由能说明为什么好的共振峰声码器就不应当按模式匹配方式编码。英国联合语言研究中心的J.N.Holrnes 认为, 模式匹配共振峰声码器完全应当以比I P C 型和通道型低得多的数据率产生出比它们高得多的语言质量, 这是因为模式匹配共振峰声码器与语言产生的关系更为密切。

就能够大量节省数据率、实现低比特率语言传输来说, 潜力最大的就是所谓的“语音声器码”。一九七七年, 美国BBN公司J.Makhoul、R.Schwartz、S.Roucos 及C.Cook等在国防部高级研究计划局的资助下, 开始对这种低速型声码器进行

以军用为目的的研究。这种类型声码器的一个共同特点是: 输入语言必须按语音单元编码, 语音符号序列带有时标和基频信息, 以使接收到的语言具有同原始语言一样的音调和时标。然而, 综合语言的频谱包络是由少量的模式序列产生的,或是按产生这样序列的规定由语言编码数据产生的。这种类型的声码器所要求的传输容量仅为100~200bps到目前为止,所作的最好试验仍表明分析和综合都还存在着一定的困难。

有各式各样的方法可以把语言符号综合成语言, 但要求这些语丢符号带有某种基音和时标。这些方法中的最好者已能给出虽然自然度稍差但可懂度却很高的综合语言, 当然, 这种综合语言还不能突出任何个别讲话人的语言特点。然而, 语音声码器更为严重的困难还在于十分可靠地自动识别不同讲话人可能产生出的大量不同语言的语音内容。看来要解决这个问题还需要一种能够“调谐”到各特定人语言特性的方法, 只不过这是若干年以后的事了。

美国E系统公司J.W.Whelan认为,低速声码器的速率不限相当于50bps的音素录制速度。它以英语的42个音素为基础, 要求在6个比特之内被极好地识别,最大讲话率约为每秒10个音素。最新研究表明, 利用现存技术制并以每秒75比特过率工作既音素声码器可以获得能够接受的话音质量, 但叫起来机械声非常明显, 讲话人识别也差, 所以在实施l00bps速率以下的通信之前必须提高该声码器的质量。

低速率语言传输具有重大的商用价值, 这是毫无疑问的。对于噪声环境下的通信,速率低就意味着通--断信号长,可获得较高的比特可靠性而速率低, 功耗也就低,因此可使非法窃收这种传输变得困难, 有利于军用保密通信。再从商用角度看, 低速率语言传输对于象话音邮件这样的应用而言, 则大大降低了它的存贮要求。随着大规模和超大规模集成电路的迅速发展, 人们研究出了各式各样的低速声码器算法。若把以前的情况归结为算法研究推动硬件技术的提高, 而今天则是硬件技术的提高推动着算法研究。

三、几种低速声码器技术的原理和结果

1977年、1980年和1982年,Makhoul,SamPei和https://www.wendangku.net/doc/301786815.html,oroix、B.Ma一kel等先后提出了一种本质相同的比特率极低的声码器方案。该方案以标准LPC声码器为基础, 用串联不同横截面积的均匀无损声管模写声道的不规则形状, 而每个

声管本身又由多级格状滤波器中的相应级来进行电气模拟。当声波穿过两个相邻声管联接处时, 一部分便作为阻抗失配结果被反射回去, 反射的数量由联接处的反射系数确定。格状滤波器的系数, 即部分自相关系数, 实质上就是声道的反射系数, 可由语言抽样或由直接的LPC系数计算出。试验表明, 每个参数都采用最佳字长, 则可用49比特来表征一个帧。由于综合器必须每秒钟校正40次, 所以数据率约为每秒2000比特。再通过消除静止期及重复参数, 数据率可降低到每秒1200~14 00比特。最新研究表明,采用最佳帧重复技术,数据率还可降低到每秒850比特而照样可以获得比较高的语言质量。

一九七六年美国海军研究实验室G.S.Kang 和D.C.Couler研制成600bps的线性预测共振峰声码器。该声码器最吸引人的特点在于它只是2400bps线性预测编码器的简单延伸。从本质上讲,600bps的线性预测共振峰声码器就是在2400bps的线性预测编码器的发端和收端各加上一个处理器, 发端处理器把2400bps的语言数据转变为600bps的语言数据, 收端处理器作相反转换, 再把数据变为2400bps的数据,综合输出。对于由2400bps线性预测编码器传输的参数,600bps线性预测共振峰声码器作了如下变动:

1.参数更新的间隔由22.5ms增加到25 m s,

2.激励参数在本质上与2400bps的线性预测编码器的激励参数相同, 但基音周期是每隔一帧更新一次。传输基音周期及激励功率电平需要260bps,占总数据率的43%。这是获得满意的话音通信所不可少的。

3.声道滤波器参数根据有无声状态采用两种形式, 即有声音的共振峰频率和无声音的预测系数。

该声码器系统较之2400bps的线性预测编码器系统损失了某些语音质量,综合语言鼻音较重,讲话人识别差,但却完全能满足专门军用话音通信的要求。进一步的工作是提高清晰度,消除鼻音重的现象,并在传输误差条件下评价其性能。

一九八二年,美国TRW公司国防和空间系统研究组T.E.Carter、D.M.Dlngos 和D.C.Le Doux研制成一种以高效编码技术为基础的800bps实时话音编码系统。该系统将通信和信号处理领域的高效编码技术极好地结合起来,获得了极低的比特率。该系统分为两部分,上半部分为分析器,下半部分为综合器。首先对输入语言进行LPC分析,产生增益、基音参数和10个反射系数,然后对它们再编

码,从而获得800bps的数据率。

同样在一九八二年,IEEE的D.Y.Wong、B.H.Juang和A.H.Gray Jr.共同研制成一种800bps的矢量量化LPC 声码器。该系统用54比特( 即18比特/决) 编码3个连续的LPC参数帧,滤波器系数30比特( 10比特/帧)。基音和有无声判决12比特,增益11比特,同步1比特。获得800bps速率的关键是通过矢量量化把用于编码每个LPC参数组的41比特压缩为10比特。矢量量化器由两个代码本组成,一个用于有声语言, 一个用于无声语言( 包括无语声的暂停期间和背景噪声)。由于有无声分开,量化LPC系数也同样需要有无声参数。三个LPC 系数帧一次编码,获得三个10比特,基音增益编码是标量的, 每3 帧一个, 余下的两帧则编码差值。有无声参数包括在基音码中。

一九八二年底, 美国BBN公司在美国国防部高级研究计划局资助下研究成实现甚低速话音编码的语音声码器。该系统首先对语言进行分析, 产生一组音素、音素长度及基音值。语言的速率通常是每秒12 个音素。由于每个三要素( 音素、音素长度和基音) 组可编为8 个比特, 所以传输信道上的数据率大约为100比特/ 秒。三要素组在收端解码后, 便由语音综合器恢复出原始语音。

他们在语音声码器中所选用的基本语言模型为双音模型。双音规定为从一个音素的中点到下一个音素中点这样一个区域。因此, 双音模型就能直接地表征一个音素与其相邻音素的相互影响, 语音声码器的分析部分和综合部分都必须有一个大的双音样板数据库。他们由这个究项目得出的初步结论是:这种语音声码器完全可以获得极低的数据率, 但必须大量的人工录制数据才能使音素识别率高达足以使输出语言清晰可懂。该声码器系统利用语音识别进行语音综合的另一个问题是:如果在识别网络中有多个样板,而在语音综合规程中每个双音却只有一个样板, 则不能保证输出语言谱接近于输入语言谱。

四、未来的工作

半导体器件的发展使科学家们能够研制出体积小、性能优的声码器系统。特别是由于数字信号处理片的问世, 使绝大多数编码器实现成本明显下降。这些数字信号处理片子成本低, 通用性好, 已成为实现各种语言编码算法的理想器件。前面所提到的许多低速声码器算法都可以在这些片子上实现。随着数字信号处理

片子的发展, 在表征语言参数的方式上也有了新的重大突破。这些突破使得以较少比特编码语言而获得相同的语言质量, 或用相同的比特数而获得更高的语言质量成为可能。现在已能专门设计超大规模集成硬件以适应算法, 所以人们可以把以前的状况归结为算法研究推动了硬件技术的发展,而今天则是硬件技术的发展正在推动算法研究。

矢量量化是一种高效编码技术, 参数矢量量化对降低比特率具有奇迹般的潜力。在信号参数编码中引入矢量量化技术是在语言参数表征方式上的一大突破, 它开辟了数据压缩的新途径, 再结合许多其它的高效低速技术, 使得许多低速和极低速声码器系统应运而生。目前矢量量化研究正集中于改进码书的设计方法, 提高搜索过程的速度和发展符合语言感觉原理的距离量度等三个方面。

回顾过去的四、五年, 低速声码器系统的研究取得了很大的进展。随着超大规模集成电路技术的发展, 似乎已完全可能买施越来越复杂的算法, 未来发展的重任也似乎落到了算法设计者的身上。有人估计,口述文字的比特率约为50bps(不包括使我们能赖以识别讲话人的任何感觉辅助信号) ,150bps的最新声码器已接近这个下限。很明显, 需要进行研究的一个领域就是提高被降低了比特率的系统的语言质量。

五、结论

声码器, 特别是低速声码器系统对于语言必须通过低容量信道传输, 或编码语言必须用小容量存贮等特殊应用场合非常有用。本文简单介绍了国外低速声码器系统的发展概况, 并列举了儿种有代表意义的低速声码器系统的原理和结果。现存的低速声码器系统种类繁多, 方法各异, 优缺点不同,势必出现交叉渗透影响现象。此外, 随着计算功能的日益提高, 许多新想法也将会出现。科学家们未来的工作就是要完善现存低速声码器系统, 提高它们的话音质量, 并开发新算法。随着超大规集成电路技术的迅速发展, 一定会出现许多新的、实用的低速声码器系统。

六、参考文献

1、SUPPLEE L M,McCree A V. MELP:the new federal standard at 2400bit/s[A]. In:Proc ICASSP'97 [C]. Munich, Germany :1997,1 591-1 594.

2、D. L. Lee、F. H. Loehovsky, “Voice vesponse system” ,Computing Survey, Vol.15, No. 4, PP.351 ~374, Dec. 1983.

3、AD A122838 Nov.1982.

4、《电信快报》作者:陈亮张雄伟 1999 年第7 期

语音编码技术及其在通信系统中的应用

多媒体技术基础期末论文 题目:语音压缩编码及其在通信系统中的应用 专业:通信工程 姓名:张娴 学号: 1 2 3 0 7 1 3 0 4 4 9

2016年5月24日 在现代通信中,随着科学技术的迅速发展,图像、数据等非话音信息在通信信息总量中所占的比例大大提高,而且这种提高的趋势仍然会继续下去。比如说,以前的手机基本上只可以打电话,发短信,不能接收文件,不能观看视频,但是现在的3G手机甚至4G手机,可以看视频,接发文件,还有很多的应用软件。语音信号所占的传输比例的确是大大减小。但是,到目前为止,在大多数通信系统中,传输最多的信息仍然是语音信号。比如说我们经常打电话,用语音发微信,听音乐,看视频等等。在可以预见的未来通信中,尽管语音信号在通信信息总量中所占的比例会有所下降,但仍然会是传输最多的信息。 语音信号是模拟信号,不能直接在数字通信系统中传输,必须先进行模/数转换再进行数/模转换,这种转换就称为语音编译码(简称语音编码),其作用是将语音模拟信号转换为数字信号,到了接收端,再将收到的语音数字信号还原为语音模拟信号。可见,语音编码技术在数字通信中具有十分重要的作用,随着计算机技术与超大规模集成电路技术的飞速发展和广泛应用,信号的数字处理、数字传输和数字存储日益显示出巨大的优越性。数字化技术的应用范围迅速扩大到各个科学技术领域,渗透到工农业生产和社会生活的各个方面。因此,尽量减少信号占有带宽、持续时间和存储容积,以节省信号在传输、处理和存储中的开销,具有巨大的经济价值。所以,语音编码技术,尤其是语音压缩编码技术(编码速率在16kbit/s以下),近年来受到人们的广泛关注和重视,有着极为迫切的客观需求。正是在这种强大的客观需求推动下,近二十几年来,随着计算

低速声码器的发展概况

声码器技术的发展 学院: 班级: 姓名: 学号: 指导教师:

摘要 语音编解码技术的迅速发展,使中低速率语音编码技术广泛应用于现代移动通信。声码器特别适用于以低比特率为首要条件的通信场合, 较典型的应用包括标准电话信道上的保密语言传输和小型化数字存贮器中的语言存贮。在某些长距离无线通信中, 人们宁可使用声码器而不愿意用目前音质低劣的模拟传输系统。目前, 质量令人满意的实用语言编码器的比特率下限为2400bps,这个比特率是由线性预测编码和通道话音编码获得的。现在正在进行大量的研究工作, 其目的是要获得低于2400bps的比特率而又要使语言质量不下降或下降很少。这个研究课题是一个既基本又具有实用价值的课题。声码器正向着速率更低、语音质量更好,延时更短,算法更复杂,抗干扰能力更强,带宽要求更小的方向发展。本文主要介绍国外声码器的发展概况、若干种低速声码器的技术原理和结果, 并推测未来的工作。 关键字:声码器发展、线性预测编码、低比特率 一、引言 自首次成功地尝试建造一台能够模拟人声的机器以来,已经大约有两百年了。两百年中中人们曾建造了各种各样的这类机器, 成功的情况也各不相同, 年轻时的贝尔和他的兄弟就曾致力于建造一台这样的机器, 但取得实质性的进展却是电子系统问世之后的事。1939年纽约世界博览会上,一项叫做“语言合成器”(Voder)的发明引起了轰动。这个语言合成器实质上是一台电子器件, 它通过完全的电子方式分析人类的语言, 然后又把它综合出来。该系统后来称之为“声码器”(话音编码器),声码器标志了语言编码新纪元的开始, 声码器这个名词也一直沿用至今而作为一大类系统的属名。近年来, 声码器的研究变得日益重要了, 这在很大程度上取决于数字化技术和语言编码的大规模应用。 语言数字化有两种根本不同的途径, 一种称之为波形编码, 另一种称之为参数编码。实现参数编码的硬件就是声码器。目前, 降低比特率是一个有重大意义的研究课题,为降低声码器的比特率而采取的所有方式都是利用了如下三个基本思想中的一个、两个或三个。 1)时间多余度压缩:由于在稳态条件下, 帧与帧之间的语言特性相同, 所

各种光纤连接器结构及性能浅析

各种光纤连接器结构及性能浅析 1.引言 在安装任何光纤系统时,都必须考虑以低损耗的方法把光纤或光缆相互连接起来,以实现光链路的接续。光纤链路的接续,又可以分为永久性和活动性的两种。永久性的接续,大多采用熔接法、粘接法或固定连接器来实现;活动性的接续,一般采用活动连接器来实现。本文将活动连接器做一简单的介绍。 光纤活动连接器,俗称活接头,一般称为光纤连接器,是用于连接两根光纤或光缆形成连续光通 路的可以重复使用的无源器件,已经广泛应用在光纤传输线路、光纤配线架和光纤测试仪器、仪表中,是目前使用数量最多的光无源器件。 2.光纤连接器的一般结构 光纤连接器的主要用途是用以实现光纤的接续。现在已经广泛应用在光纤通信系统中的光纤连接器,其种类众多,结构各异。但细究起来,各种类型的光纤连接器的基本结构却是一致的,即绝大多数的光纤连接器一般采用高精密组件(由两个插针和一个耦合管共三个部分组成)实现光纤的对准连接。 这种方法是将光纤穿入并固定在插针中,并将插针表面进行抛光处理后,在耦合管中实现对准。插针的外组件采用金属或非金属的材料制作。插针的对接端必须进行研磨处理,另一端通常采用弯曲限制构件来支撑光纤或光纤软缆以释放应力。耦合管一般是由陶瓷、或青铜等材料制成的两半合成的、紧固的圆筒形构件做成,多配有金属或塑料的法兰盘,以便于连接器的安装固定。为尽量精确地对准光纤,对插针和耦合管的加工精度要求很高。 3.光纤连接器的性能 光纤连接器的性能,首先是光学性能,此外还要考虑光纤连接器的互换性、重复性、抗拉强度、温度和插拔次数等。 (1)光学性能:对于光纤连接器的光性能方面的要求,主要是插入损耗和回波损耗这两个最基本 的参数。 插入损耗(Insertion Loss)即连接损耗,是指因连接器的导入而引起的链路有效光功率的损耗。插入损耗越小越好,一般要求应不大于0.5dB。 回波损耗(Return Loss)是指连接器对链路光功率反射的抑制能力,其典型值应不小于25dB。实际应用的连接器,插针表面经过了专门的抛光处理,可以使回波损耗更大,一般不低于45dB。 (2)互换性、重复性 光纤连接器是通用的无源器件,对于同一类型的光纤连接器,一般都可以任意组合使用、并可以重复多次使用,由此而导入的附加损耗一般都在小于0.2dB的范围内。 (3)抗拉强度 对于做好的光纤连接器,一般要求其抗拉强度应不低于90N。 (4)温度

(完整版)音频基础知识及编码原理

一、基本概念 1 比特率:表示经过编码(压缩)后的音频数据每秒钟需要用多少个比特来表示,单位常为kbps。 2 响度和强度:声音的主观属性响度表示的是一个声音听来有多响的程度。响度主要随声音的强度而变化,但也受频率的影响。总的说,中频纯音听来比低频和高频纯音响一些。 3 采样和采样率:采样是把连续的时间信号,变成离散的数字信号。采样率是指每秒钟采集多少个样本。 Nyquist采样定律:采样率大于或等于连续信号最高频率分量的2倍时,采样信号可以用来完美重构原始连续信号。 二、常见音频格式 1. WAV格式,是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持,压缩率低。 2. MIDI是Musical Instrument Digital Interface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交换音乐信号的方式,规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传

输的协议,可以模拟多种乐器的声音。MIDI文件就是MIDI格式的文件,在MIDI文件中存储的是一些指令。把这些指令发送给声卡,由声卡按照指令将声音合成出来。 3. MP3全称是MPEG-1 Audio Layer 3,它在1992年合并至MPEG规范中。MP3能够以高音质、低采样率对数字音频文件进行压缩。应用最普遍。 4. MP3Pro是由瑞典Coding科技公司开发的,其中包含了两大技术:一是来自于Coding 科技公司所特有的解码技术,二是由MP3的专利持有者法国汤姆森多媒体公司和德国Fraunhofer集成电路协会共同研究的一项译码技术。MP3Pro可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。 5. MP3Pro是由瑞典Coding科技公司开发的,其中包含了两大技术:一是来自于Coding 科技公司所特有的解码技术,二是由MP3的专利持有者法国汤姆森多媒体公司和德国Fraunhofer集成电路协会共同研究的一项译码技术。MP3Pro可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。 6. WMA (Windows Media Audio)是微软在互联网音频、视频领域的力作。WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18。此外,WMA还可以通过DRM(Digital Rights Management)保护版权。 7. RealAudio是由Real Networks公司推出的一种文件格式,最大的特点就是可以实时传输音频信息,尤其是在网速较慢的情况下,仍然可以较为流畅地传送数据,因此RealAudio 主要适用于网络上的在线播放。现在的RealAudio文件格式主要有RA(RealAudio)、RM (RealMedia,RealAudio G2)、RMX(RealAudio Secured)等三种,这些文件的共同性在于随着网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较宽敞的听众获得较好的音质。 8. Audible拥有四种不同的格式:Audible1、2、3、4。https://www.wendangku.net/doc/301786815.html,网站主要是在互联网上贩卖有声书籍,并对它们所销售商品、文件通过四种https://www.wendangku.net/doc/301786815.html, 专用音频格式中的一种提供保护。每一种格式主要考虑音频源以及所使用的收听的设备。格式1、2和3采用不同级别的语音压缩,而格式4采用更低的采样率和MP3相同的解码方式,所得到语音吐辞更清楚,而且可以更有效地从网上进行下载。Audible 所采用的是他们自己的桌面播放工具,这就是Audible Manager,使用这种播放器就可以播放存放在PC或者是传输到便携式播放器上的Audible格式文件

低速率声码器芯片设计

低速率声码器芯片设计 郭从征* ,王 沁 (北京科技大学 北京 100083)摘 要:本文针对清华大学研制的SELP 低速率语音编解码算法设计出一款声码器芯片))) TR600,TR600声码器芯片的核心部件是它的语音编解码处理器。该处理器采用软件和硬件 协同设计的方法使芯片面积和运算速度达到最佳平衡点,在20MH z 低主频下实现了即时语音 通信。 关键词:声码器;SELP ;语音编码;语音解码;处理器 中图分类号:TP368.1文献标识码:A 文章编号:1008-911X(2005)04-0021-04 Low Velocity Vocoder Chi p D esign GUO C ong -zheng ,W ANG Q i n (U n i vers it y of Sci en ce and T echnol ogy Be iji ng ,Be iji ng 100083,Ch i na) Abstract :Th is paper a i m ed at the SELP lo w -ve l o c ity vocoder arith m etic developed by Tsi n ghua u - n i v ersity designed a vocoder ship na m ed TR600.The core co m ponen t ofTR600is its speech voceder processor .Th is processor is designed w ith t h e so ft w are and hard w are ba lance-design -m ethod to m ake the area o f chip and opera tion speed reach the opti m al co m b i n ation .A t the lo w frequency of 20MH z t h e c h ip realized the speech rea l ti m e correspondi n g . K eyw ords :vocoder chip ;SELP ;speech encoder ;speech decoder ;processor 前言 语音传输是目前最主要也是最普遍的通信传输服务。有限的带宽和使用者的增加促使语音编码速率不断降低。随着编码速率的降低,语音的品质就只能由更复杂的算法来维持,这使得即时实现语音编码相当困难。随着语音编码技术的诞生与发展,到上世纪三十年代人们提出了脉冲编码原理(PC M )[7]和声码器(V ocoder)[7]两个重要概念,从此语音编码技术一直沿着这两个方向发展,即语音信号的波形 编码和语音信号的参数编码。本文所讨论的声码器芯片所使用的SELP 语音编解码算法属于参数编码范畴,是一种典型的声码器[7]算法。该算法以被列入我国军用电台语音编码标准。 目前低速率(4Kbps 以下)声码器算法是语音通信领域中研究的热点,有着广泛的应用需求。由清华大学微波和数字通信国家重点实验室研制的SELP(S ine Excitation L inear P red iction )声码器算法,在正弦激励线性预测模型的基础上,引入了多帧参数联合矢量量化 [7]方法,进一步压缩帧间冗余,在0.6Kbps 收稿日期:2005-10-06 *作者简介:郭从征(1980-),男,汉族,硕士生,计算机系统结构专业。第20卷 第4期 2005年12月河北工业大学成人教育学院学报Journal o fA dult Educa tion Schoo l o fH ebei Un i v ers it y o f T echno logy V o.l 20N o .4Dec .2005

编码器详细介绍与编程指导

增量型编码器与绝对型编码器的区分 编码器如以信号原理来分,有增量型编码器,绝对型编码器。 增量型编码器 (旋转型) 工作原理: 由一个中心有轴的光电码盘,其上有环形通、暗的刻线,有光电发射和接收器件读取,获得四组正弦波信号组合成A、B、C、D,每个正弦波相差90度相位差(相对于一个周波为360度),将C、D信号反向,叠加在A、B两相上,可增强稳定信号;另每转输出一个Z相脉冲以代表零位参考位。 由于A、B两相相差90度,可通过比较A相在前还是B相在前,以判别编码器的正转与反转,通过零位脉冲,可获得编码器的零位参考位。 编码器码盘的材料有玻璃、金属、塑料,玻璃码盘是在玻璃上沉积很薄的刻线,其热稳定性好,精度高,金属码盘直接以通和不通刻线,不易碎,但由于金属有一定的厚度,精度就有限制,其热稳定性就要比玻璃的差一个数量级,塑料码盘是经济型的,其成本低,但精度、热稳定性、寿命均要差一些。 分辨率—编码器以每旋转360度提供多少的通或暗刻线称为分辨率,也称解析分度、或直接称多少线,一般在每转分度5~10000线。 信号输出: 信号输出有正弦波(电流或电压),方波(TTL、HTL),集电极开路(PNP、NPN),推拉式多种形式,其中TTL为长线差分驱动(对称A,A-;B,B-;Z,Z-),HTL 也称推拉式、推挽式输出,编码器的信号接收设备接口应与编码器对应。 信号连接—编码器的脉冲信号一般连接计数器、PLC、计算机,PLC和计算机连接的模块有低速模块与高速模块之分,开关频率有低有高。 如单相联接,用于单方向计数,单方向测速。 A.B两相联接,用于正反向计数、判断正反向和测速。 A、B、Z三相联接,用于带参考位修正的位置测量。 A、A-, B、B-,Z、Z-连接,由于带有对称负信号的连接,电流对于电缆贡献的电磁场为0,衰减最小,抗干扰最佳,可传输较远的距离。 对于TTL的带有对称负信号输出的编码器,信号传输距离可达150米。 对于HTL的带有对称负信号输出的编码器,信号传输距离可达300米。

0_8kb_s高质量声码器算法_李军林

I S SN 1000-0054CN 11-2223/N 清华大学学报(自然科学版)J Tsing hua Univ (S ci &Tec h ),2003年第43卷第1期 2003,V ol .43,N o .14/37 12-15   0.8kb /s 高质量声码器算法 李军林, 杜 松, 崔慧娟, 唐 昆 (清华大学电子工程系,北京100084) 收稿日期:2001-08-07 基金项目:国家自然科学基金资助项目(69972020); 清华大学“九八五”基金项目 作者简介:李军林(1978-),男(汉),四川,硕士研究生。通讯联系人:唐昆,教授, E-mail:tangk un@mail.tsin https://www.wendangku.net/doc/301786815.html, 摘 要:随着通信的发展,对极低速率下语音压缩编码算法的需求越来越迫切。为满足极低码率的要求并获得高质量的合成语音,提出了一种高质量的0.8kb/s 声码器算法。此算法基于传统的线性预测模型,利用多帧联合的超级帧参数分模式联合矢量量化技术,以及多带混合激励,子带清浊音参数相关预测,自适应谱增强,脉冲扩散后滤波等技术。主观听觉测试显示,此声码器在0.8kb/s 的速率下其合成语音不仅具有高可懂度而且具有一定的自然度,诊断押韵测试(D RT )的分数为85%,而且此声码器在10-2 的随机误码的信道条件下仍然具有很好的可懂度。 关键词:声码器;线性预测;矢量量化;自适应谱增强中图分类号:T N 912.3 文献标识码:A 文章编号:1000-0054(2003)01-0012-04 0.8kb /s high quality speech coding algorithm LI Ju nlin ,DU Song ,CUI Hu ijuan ,TANG Ku n (Department of Electronic Engineering ,Tsinghua University , Beij ing 100084,China ) Abstract :T his paper presents a 0.8kb /s high quality vocoder to obtain high quality syn th etic s peech at a very low bit rate.T he algorithm is based on a traditional linear prediction model with multi-frame joint vector quantification , multi-b and mixing ex citation,sub -ban d voicing stren gth parameter prediction,ad aptive spectral enhancement,and pulse dis pers ion etc.Sim ulation res ults dem onstrate that the intelligibility of this 0.8kb /s vocoder is quite good and the natural tone is fine.Th e d iagnos tic rh yme tes t (DRT )score is 85%in an in formal test.Furthermore,the vocoder is robus t in a noisy environmen t,and intelligible even w ith a bit error rate of 10-2. Key words :vocoder ;linear prediction ;vector quantization;ad aptive spectral enh ancement 高质量低速率语音编码技术是语音编码领域中重要的研究课题之一。2.4kb/s 及其更低速率的语音编码算法在保密通信、卫星通信和IP 电话等领域有着重要的应用。随着数字通信的迅猛发展,带宽资 源越来越紧张,因此对更低速率的语音编码算法提出了迫切的要求。 2.4kb/s 语音编码算法获得了很大的成功[1~3] ,但是现阶段0.8kb/s 的语音编码算法仍然 是一个巨大的挑战,其中的关键是用有限的比特数有效地表示语音编码参数。在语音编码领域,线性预测(LP )技术获得了广泛的应用,如LPC-10,CELP,M ELP [4] 等,本文提出的声码器算法也以线性预测模型为基础。 为了在0.8kb/s 的极低速率下获得高质量的合成语音,本声码器算法中还引入了编码端参数多帧联合矢量量化、解码端分带合成及部分参数相关预测等新技术,从而有效的降低了传输码率,并获得高质量的合成语音。 1 编码器基本原理 此声码器算法编码器的功能框图如图1所示。 图1 编码器功能框图 对每帧语音分别提取预测系数、基音周期、清浊音标志和短时帧能量等4种参数。所有编码参数均

计算机常见编码

计算机常见编码 一.有关编码的基础知识 1. 位bit 最小的单元 字节byte 机器语言的单位 1byte=8bits 1KB=1024byte 1MB=1024KB 1GB=1024MB 2. 二进制binary 八进制octal 十进制decimal 十六进制hex 3. 字符:是各种文字和符号的总称,包括各个国家的文字,标点符号,图形符 号,数字等。 字符集:字符集是多个符号的集合,每个字符集包含的字符个数不同。 字符编码:字符集只是规定了有哪些字符,而最终决定采用哪些字符,每一 个字符用多少字节表示等问题,则是由编码来决定的。计算机要 准确的处理各种字符集文字,需要进行字符编码,以便计算机能 够识别和存储各种文字。 二.常见字符集的编码介绍: 常见的字符集有:ASCII 字符集,GB2312 字符集,BIG5 字符集,GB18030 字符集,Unicode 字符集,下面一一介绍: 1. ASCII 字符集: 定义: 美国信息互换标准代码,是基于罗马字母表的一套电脑编码系统,主要显示 英语和一些西欧语言,是现今最通用的单字节编码系统。 包含内容: 控制字符(回车键,退格,换行键等) 可显示字符(英文大小写,阿拉伯数字,西文符号) 扩展字符集(表格符号,计算符号,希腊字母,拉丁符号) 编码方式: 第0-31 号及127 号是控制字符或通讯专用字符; 第32-126 号是字符,其中48-57 号为0-9 十个阿拉伯数字,65-90 号为26 个 大写英文字母,97-122 号为26 个英文小写字母,其余为一些标点符号,运 算符号等。 在计算机存储单元中,一个ASCII 码值占一个字节(8 个二进制位),最高位 是用作奇偶检验位。【奇偶校验是指:在代码传送的过程中,用来检验是否 出错的一种方法。】奇偶校验分为奇校验和偶校验。奇校验规定:正确的代 码一个字节中1 的个数必须是奇数,若非奇数,则在最高位添1;偶校验规 定:正确的代码一个字节中 1 的个数必须是奇数,若非奇数,则在最高位添 1。

光纤连接器图解1.

光纤连接器 自从前年开始,基于光缆的千兆以太网有了非常迅猛的发展。在局域网中的主干网 络(backbone)几乎大部分都采用了基于光 缆的千兆以太网。而在千兆网络的光缆链路 中使用的光缆链路连接方式中也发生了新 的变化。 路连接方式传统的光缆链路连接方式主要是ST,SC或。目前它们仍然在大量使用。其形状如图1所示。这式简单方便,所连接的每条光缆都是可以独立使用的。装这些光缆链路时,并不知道在实际中这些光缆是如果道光缆的信号传输方向。在实际使用中,将光缆和网络要首先确定信号在光缆中的传输方向,才能正确地进行缆的连接器的制作也不方便,需要特殊的工具等。

SC插入锁定-------------ST插入锁定---------------- FC旋紧锁定 2.新型的光缆连接方式 大家知道,千兆以太网在连接光缆时都是成对儿使用的,即一个输出(output,也为光源),一个输入(input,光检测器),例

如路由器和交换机的光缆连接。如果在使用时,能够成对一块儿使用而不用考虑连接的方向,而且连接简捷方便,那将会有助于千兆以太网的连接。因此不少光缆布线的厂商推出了各种连接器来满足这种应用。这种新的光缆连接器叫做SFF(Small Form Factor)。目前还没有比较明确的术语来描述,我们一般将其称作微型光缆连接器。 目前市场最主要SFF光缆连接器有四种类型。1)LC类型,它是Lucent公司推出的一种SFF类型的连接器。2)FJ类型,它是由Panduit公司推出的连接器。3)MT-RJ 型,它是由美国AMP公司推出的连接器以及由3M公司推出的VF-45连接器。

各种音频编码方式的对比

各种音频编码方式的对比

————————————————————————————————作者: ————————————————————————————————日期: ?

各种音频编码方式的对比 内容简介:文章介绍了PCM编码、WMA编码、ADPCM编码、LPC编码、MP3编码、AAC编码、CELP编码等,包括优缺点对比和主要应用领域。 PCM编码(原始数字音频信号流)?类型:Audio 制定者:ITU-T 所需频宽:1411.2Kbps?特性:音源信息完整,但冗余度过大 优点:音源信息保存完整,音质好 缺点:信息量大,体积大,冗余度过大?应用领域:voip?版税方式:Free?备注:在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用。因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数bps。一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为44.1K×16×2 =1411.2Kbps。我们常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。 WMA(Windows MediaAudio) 类型:Audio 制定者:微软公司 所需频宽:320~112kbps(压缩10~12倍) 特性:当Bitrate小于128K时,WMA几乎在同级别的所有有损编码格式中表现得最出色,但似乎128k 是WMA一个槛,当Bitrate再往上提升时,不会有太多的音质改变。?优点:当Bitrate小于128K时,WMA 最为出色且编码后得到的音频文件很小。?缺点:当Bitrate大于128K时,WMA音质损失过大。WMA标准不开放,由微软掌握。?应用领域:voip?版税方式:按个收取?备注:WMA的全称是WindowsMedia Audio,它是微软公司推出的与MP3格式齐名的一种新的音频格式。由于WMA在压缩比和音质方面都超过了MP3,更是远胜于RA(Real Audio),即使在较低的采样频率下也能产生较好的音质,再加上WMA有微软的WindowsMedia Player做其强大的后盾,所以一经推出就赢得一片喝彩。 ADPCM( 自适应差分PCM)?类型:Audio 制定者:ITU-T?所需频宽:32Kbps 特性:ADPCM(adaptive difference pulse code modulation)综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。?它的核心想法是: ①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值; ②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。?优点: 算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)?缺点:声音质量一般?应用领域:voip 版税方式:Free?备注:ADPCM (ADPCM Adaptive Differential Pulse Code Modulation),

光纤连接器图解1

光纤连接器图解1

光纤连接器 自从前年开始,基于光缆的千兆以太网有了非常迅猛的发展。在局域网中的主干网 络(backbone)几乎大部分都采用了基于光 缆的千兆以太网。而在千兆网络的光缆链路 中使用的光缆链路连接方式中也发生了新 的变化。 路连接方式主要是ST,SC或者FC的连接方式。目前。这些光缆的连接方式简单方便,所连接的每条光缆都些光缆链路时,并不知道在实际中这些光缆是如果使用际使用中,将光缆和网络设备连接时,就要首先确定信连接。此外,光缆的连接器的制作也不方便,需要特殊

SC插入锁定-------------ST插入锁定---------------- FC旋紧锁定 2.新型的光缆连接方式 大家知道,千兆以太网在连接光缆时都是成对儿使用的,即一个输出(output,也为光源),一个输入(input,光检测器),例

如路由器和交换机的光缆连接。如果在使用时,能够成对一块儿使用而不用考虑连接的方向,而且连接简捷方便,那将会有助于千兆以太网的连接。因此不少光缆布线的厂商推出了各种连接器来满足这种应用。这种新的光缆连接器叫做SFF(Small Form Factor)。目前还没有比较明确的术语来描述,我们一般将其称作微型光缆连接器。 目前市场最主要SFF光缆连接器有四种类型。1)LC类型,它是Lucent公司推出的一种SFF类型的连接器。2)FJ类型,它是由Panduit公司推出的连接器。 3)MT-RJ 型,它是由美国AMP公司推出

的连接器以及由3M公司推出的VF-45连接器。 下图是这几种类型的连接器。这种连接器是一对儿光缆一起连接而且接插的方向是固定的。所以在实际使用中比较方便,也不会误插。 光纤配线箱

语音压缩编码技术

语音压缩编码技术 上传时间:2004-12-22 随着通信、计算机网络等技术的飞速发展,语音压缩编码技术得到了快速发展和广泛应用,尤其是最近20年,语音压缩编码技术在移动通信、卫星通信、多媒体技术以及IP电话通信中得到普遍应用,起着举足轻重的作用。 语音压缩编码技术的类别 语音编码就是将模拟语音信号数字化,数字化之后可以作为数字信号传输、存储或处理,可以充分利用数字信号处理的各种技术。为了减小存储空间或降低传输比特率节省带宽,还需要对数字化之后的语音信号进行压缩编码,这就是语音压缩编码技术。 语音的压缩编码方法归纳起来可以分为三大类:波形编码、参数编码和混合编码。 波形编码比较简单,失真最小,方法简单,但数码率比较高。 参数编码的编码速率可以很低,但音质较差,只能达到合成语音质量,其次是复杂度高。 混合编码吸收了波形编码和参数编码的优点,从而在较低的比特率上获得较高的语音质量,当前受到人们较大的关注。 语音压缩编码技术的发展 自从1937年A.H.Reeves提出脉冲编码调制(PCM)以来,语音编码技术已有60余年的发展历史。尤其近20年随着计算机和微电子技术的发展语音编码技术得到飞速发展。 CCITT于1972年确定64kb/sPCM语音编码G.711建议,它已广泛的应用于数字通信、数字交换机等领域,至今,64kb/s的标准PCM系统仍占统治地位。这种编码方法可以获得较好的语音质量但占用带宽较多,在带宽资源有限的情况下不宜采用。CCITT于80年代初着手研究低于64kb/s的非PCM编码算法,并于1984年通过了32kb/sADPCM语音编码G.721建议,它不仅可以达到PCM相同的语音质量而且具有更优良的抗误码性能,广泛应用于卫星,海缆及数字语音插空设备以及可变速率编码器中。随后,于1992年公布16kb/s低延迟码激励线性预测(LD-CELP)的G.728建议。它以其较小的延迟、较低的速率、较高的性能在实际中得到广泛的应用,例如:可视电话伴音、无绳电话机、单路单载波卫星和海事卫星通信、数字插空设备、存储和转发系统、语音信息录音、数字移动无线系统、分组化语音等。最后共轭代数码激励线性预测(CS-ACELP)的8kb/s语音编码G.729建议已在1995年11月ITU—TSG15全会上通过,并于1996年6月ITU—

光纤连接器的一般结构

光纤连接器的一般结构 1.引言在安装任何光纤系统时,都必须考虑以低损耗的方法把光纤或光缆相互连接起来,以实现光链路的接续。光纤链路的接续,又可以分为永久性的和活动性的两种。永久性的接续,大多采用熔接法、粘接法或固定连接器来实现;活动性的接续,一般采用活动连接器来实现。本文将对活动连接器做一简单的先容。光纤活动连接器,俗称活接头,一般称为光纤连接器,是用于连接两根光纤或光缆形成连续光通路的可以重复使用的无源器件,已经广泛应用在光纤传输线路、光纤配线架和光纤测试仪器、仪表中,是目前使用数目最多的光无源器件。2.光纤连接器的一般结构光纤连接器的主要用途是用以实现光纤的接续。现在已经广泛应用在光纤通讯系统中的光纤连接器,其种类众多,结构各异。但细究起来,各种类型的光纤连接器的基本结构却是一致的,即尽大多数的光纤连接器的一般采用高精密组件(由两个插针和一个耦合管共三个部分组成)实现光纤的对准连接。这种方法是将光纤穿进并固定在插针中,并将插针表面进行抛光处理后,在耦合管中实现对准。插针的外组件采用金属或非金属的材料制作。插针的对接端必须进行研磨处理,另一端通常采用弯曲限制构件来支撑光纤或光纤软缆以开释应力。耦合管一般是由陶瓷、或青铜等材料制成的两半合成的、紧固的圆筒形构件做成,多配有金属或塑料的法兰盘,以便于连接器的安装固定。为尽量精确地对准光纤,对插针和耦合管的加工精度要求很高。3.光纤连接器的性能光纤连接器的性能,首先是光学性能,此外还要考虑光纤连接器的互换性、重复性、抗拉强度、温度和插拔次数等。(1)光学性能对于光纤连接器的光性能方面的要求,主要是插进损耗和回波损耗这两个最基本的参数。插进损耗(InsertionLoss)即连接损耗,是指因连接器的导进而引起的链路有效光功率的损耗。插进损耗越小越好,一般要求应不大于0.5dB。回波损耗(ReturnLoss,ReflectionLoss)是指连接器对链路光功率反射的抑制能力,其典型值应不小于25dB。实际应用的连接器,插针表面经过了专门的抛光处理,可以使回波损耗更大,一般不低于45dB。(2)互换性、重复性光纤连接器是通用的无源器件,对于同一类型的光纤连接器,一般都可以任意组合使用、并可以重复多次使用,由此而导进的附加损耗一般都在小于0.2dB的范围内。(3)抗拉强度对于做好的光纤连接器,一般要求其抗拉强度应不低于90N。(4)温度一般要求,光纤连接器必须在-40oC~+70oC的温度下能够正常使用。(5)插拔次数目前使用的光纤连接器一般都可以插拔l000次以上。4.部分常见光纤连接器按照不同的分类方法,光纤连接器可以分为不同的种类,按传输媒介的不同可分为单模光纤连接器和多模光纤连接器;按结构的不同可分为FC、SC、ST、D4、DIN、Biconic、MU、LC、MT等各种型式;按连接器的插针端面可分为FC、PC(UPC)和APC;按光纤芯数分还有单芯、多芯之分。在实际应用过程中,我们一般按照光纤连接器结构的不同来加以区分。以下简单的先容一些目前比较常见的光纤连接器:(1)FC型光纤连接器这种连接器最早是由日本NTT研制。FC是FerruleConnector的缩写,表明其外部加强方式是采用金属套,紧固方式为螺丝扣。最早,FC类型的连接器,采用的陶瓷插针的对接端面是平面接触方式(FC)。此类连接器结构简单,操纵方便,制作轻易,但光纤端面对微尘较为敏感,且轻易产生菲涅尔反射,进步回波损耗性能较为困难。后来,对该类型连接器做了改进,采用对接端面呈球面的插针(PC),而外部结构没有改变,使得插进损耗和回波损耗性能有了较大幅度的进步。(2)SC型光纤连接器这是一种由日本NTT公司开发的光纤连接器。其外壳呈矩形,所采用的插针与耦合套筒的结构尺寸与FC型完全相同,其中插针的端面多采用PC或APC型研磨方式;紧固方式是采用插拔销闩式,不需旋转。此类连接器价格低廉,插拔操纵方便,参与损耗波动小,抗压强度较高,安装密度高。(3)双锥型连接器(BiconicConnector)这类光纤连接器中最有代表性的产品由美国贝尔实验室开发研制,它由两个经精密模压成形的端头呈截头圆锥

6超低速率的语音编码 翻译

超低速率的语音编码 M.J.Ovens, K.M.Ponting and M.E.Turner 摘要 在很多情况下,短波无线设备用于长距离或者大范围的通信。在强调短波信道的条件下,现有的低比特率语音编码算法可支持把数据速率降低到要求以下。 本文介绍的是在DERA Malvern研究开发一个运用自动语音识别(ASR)和合成技术来实现把语音编码数据率低于300bps的实时语音编码系统。一个持续的语音识别器是用来转录进来的以字为单位声音片断的讲话。韵律信息(音调和音长)结合在语音片断识别码里以形成适合传输的持续的数据流。在接收端一个并行结构的语音识别器利用特定的人的语音建立讲话者的模型来识别语音。 1引言 本文介绍的是在DERA Malvern and 20120 Speech Ltd研究开发一个运用自动语音识别(ASR)和合成技术来实现把语音编码数据率低于300bps的实时语音编码系统。 论文结构如下: ●第二部分描述研究如此低数据率的动机; ●第三和第四部分分别概述在300和75bps超低比特率编码器的结构; ●第五部分描述该体系是基于隐藏的Markov模型; ●第六部分分析迄今所达到的效果。 2为什么要对语音进行超低速率编码? 什么是语音编码? 在很多情况下,短波无线广播设备用于长距离或者大范围的通信。应用范围从遥远的两个城市之间的点对点联系到地对高速的喷气式飞机之间的军事通信。在许多情况下,首选的通信方式是通过语音的,这就要求语音编码算法能够使语音在有效带宽内通信。 短波数据通信 目前这一代短波数据调制解调器的运作的数据传输速率高达2400bps(4800bps 无差错保护编码)。最近技术的发展,使得通信的数据传输速率最高可达9600bps,随着研究工作的深入,现在已经可扩展到和超过16kbps。这些高数据传输率的调制解调器用于提高短波通信管理(AHFCM)系统是可行的。 对于数字语音系统,考虑ARQ协议和长交换技术引入的时间延迟是不可接受的,因此在用高数据率调制解调时只会考虑用最多原始信道。 在另一端的数据传输率的频谱,技术进步已使调制解调器变得相当的强劲。这些调制解调器可用在低数据传输率(75bps),但在拥挤的短波条件下提供高可用性信道。 它大致可显示调制解调器性能(即鲁棒性),是直接关系到数据传输速率,增加了在数据速率从而减少在鲁棒性渠道的条件。在大多数情况下,增加了鲁棒性将导致增加通信的可用性。因此,这是不可取的,以减少数据传输速率的要求,一数字语音系统,以增加系统可用性,如果可以这样做,同时保留可懂度。 2.3传统的语音编码器 其中一种压缩语音信号的方法是利用已知性能的讲话,只传送信息本质内容信号。例如,如果只关心讲话的内容,那么就没有必要对个人特定的发音信号进行编码。

字符编码方式介绍及编码方式测试

第一部分编码方式介绍 一、编码: 美国标准信息交换标准码( , ) 在计算机内部,所有地信息最终都表示为一个二进制地字符串.每一个二进制位()有和两种状态.一个字节()共由八个二进制位来组成,共有种状态,从到. 阿拉伯数字、英文字母、标点符号等这些字符,怎么定义才能让计算机识别呢?因为计算机只识别二进制位和,所以以上这些字符就必须与二进制位(和)建立关系,才能让计算机识别. 年代初,计算机界制定了一套统一地字符编码,来表示字符与二进制位之间地关系.这种统一地字符编码就叫做编码.码一共规定了个字符地编码,比如空格是(二进制),大写地字母是(二进制).这个符号(包括个不能打印出来地控制符号),只占用了一个字节地后面位,最前面地位统一规定为. 在英语国家,个编码足以表达所有字符,但其它非英语国家,字符不是由英文字符组成,这样就需要增加编码以表达这些字符,对于超过个字符地编码被称为非编码.比如:在中国,我们用简体中文,字符编码方式为.个人收集整理勿做商业用途 二、编码: 看到上面地介绍后,我们了解了最早编码是码.它只用个二进制位来表示,由于那个时期生产地大多数计算机使用位大小地字节,因此用户不仅可以存放所有可能地字符,而且有整整一位空余下来.如果你技艺高超,可以将该位用做自己离奇地目地:中那个发暗地灯泡实际上设置这个高位,以指示一个单词中地最后一个字母,同时这也宣示了只能用于英语文本. 由于字节有多达位地空间,因此许多人在想:“呀!我们可以把之间地编码用做个人地应用目地.”问题在于,同时产生这种想法地人相当多,而且在之间地各个位置上应该存放什么这一问题上,真是仁者见仁智者见智.事实上,只要人们开始在美国以外地地方购买计算机,那么各种各样地不同字符集都会进入规划设计行列,并且各人都会根据自己地需要使用高位地个字符.如此一来,甚至在同语种地文档之间就不容易实现互换. 可被扩展,最优秀地扩展方案是,通常称之为.包括了足够地附加字符集来写基本地西欧语言. 最后,这个人参与地终于以标准地形式形成文件.在标准中,每个人都认同如何使用低端地个编码,这与相当一致.不过,根据所在国籍地不同,处理编码以上地字符有许多不同地方式.这些不同地系统称为代码页. 同时,甚至更为令人头疼地事情正在逐步上演,亚洲国家地字符表有成千上万个字符,这样地字符表是用位二进制无法表示地.该问题地解决通常有赖于称为(,双字节字符集)地繁杂字符系统. 不过,仍然需要指出一点,多数人还是姑且认为一个字节就是一个字符,以及一个字符就是个二进制位,并且只要确保不将字符串从一台计算机移植到另一台计算机,或者说一种以上地语言,那么这几乎总是可以凑合.当然,只要一进入,从一台计算机向另一台计算机移植字符串就成为家常便饭了,而各种复杂状况也随之呈现出来.令人欣慰地是,随即问世了.个人收集整理勿做商业用途 字符集(简称为),国际标准组织于年月成立工作组,针对各国文字、符号进行统一性编码.年美国跨国公司成立,并于年月与达成协议,采用同一编码字集.目前是采用位编码体系,其字符集内容与地()相同.于年月通过(),目前版本于公布,内容包含符号个,汉字个,韩文拼音个,造字区个,保留个,共计个.编码后地大小是一样地.例如一个英文字母"" 和一个汉字"好",编码后都是占用地空间大小是一样地,都是两个字节!个人收集整理勿做商业用途 可以用来表示所有语言地字符,而且是定长双字节(也有四字节地)编码,包括英文字

光纤连接器基础知识

光连接器基础知识 一、基本概念(术语) 1、光纤(活动)连接器:是实现将光纤光缆和光纤光缆之间、光纤光缆和有源器件、 光纤光缆和其它无源器件、光纤光缆和系统与仪表进行活动连接的光无源器件(连 接器的作用)。整套光连接器的组成:插头—适配器—插头。 2、光跳线:两端都装有插头的一段光纤或光缆。 3、光纤:是一种利用光全反射原理传导光信号的玻璃纤维。主要成分:SiO2.光纤由纤 芯、包层和涂敷层构成,纤芯的折射率nl大于包层的折射n2.纤芯的作用是传导光 信号,包层的作用是反射光信号,涂敷层的作用是保护光纤,增加光纤的机械强度 和柔韧性。光纤可分为单模光纤(9/125μ)和多模光纤(50/125或62.5/125)。 4、光缆:光缆由护套、加强构件、紧套(或松套)层和涂敷光纤组成。生产跳线采用 的光缆一般有:φ3.0单芯光缆、φ2.0单芯光缆、φ0.9紧套光缆,双芯平行光缆、防水尾缆、束状光缆和带状光缆等。 5、插入损耗:是指光信号通过光连接器之后,光信号的衰减量。一般用分贝数(dB) 表示。表达式为: IL=-10LOG(P1/P0)(d B) 其中P0——输入端的光功率 P1——输出端的光功率 6、回波损耗:也称后向反射损耗,是由于光连接处的非涅尔效应而产生的反射信号, 该信号沿光纤原路返回,会对光源和系统产生不良影响。回波损耗的表达式为: RL=-10LOG(P2/P0) 其中P0—输入端的光功率 P1—后向反射光功率 二、光连接器基本结构原理 图1 光纤连接器精密对中原理 一般均采用精密小孔插芯(Ferrule)和套筒(sleeve)来实现光纤的精确连接。 影响连接器插入损耗的主要因素有: 1、纤芯错位 2、角度偏差 3、连接间隙 4、不同种光纤(数值孔径不同)

相关文档