当前位置：文档库 › 基于能量检测的复杂环境下的鸟鸣识别

基于能量检测的复杂环境下的鸟鸣识别

龙源期刊网 https://www.wendangku.net/doc/9f8168478.html,

基于能量检测的复杂环境下的鸟鸣识别

作者：张小霞李应

来源：《计算机应用》2013年第10期

摘要：针对实际环境噪声使得鸟鸣识别准确率受到影响的问题，提出一种基于能量检测

的抗噪鸟鸣识别方法。首先，对包含有噪声的鸟鸣信号用能量检测方法检测并筛选出有用鸟鸣信号；其次，根据梅尔尺度的分布，对有用鸟鸣信号提取小波包分解子带倒谱系数（WPSCC）特征；最后，用支持向量机（SVM）分类器分别对提取的小波包分解子带倒谱系数（WPSCC）和梅尔频率倒谱系数（MFCC）特征进行建模分类识别。同时还对比了在添加

不同信噪比的噪声下15类鸟鸣在能量检测前后的识别性能差异。实验结果表明，提取的WPSCC特征具有较好的抗噪功能，且经过能量检测后的识别性能更佳，更适用于复杂环境下的鸟鸣识别。

关键词：能量检测；小波包分解子带倒谱系数；梅尔频率倒谱系数；支持向量机；鸟鸣识别

0 引言

复杂生态环境中的鸟类能发出各种多样的鸣叫声，其声音蕴含着与人类生存环境息息相关的丰富信息。人们可以通过检测、分析和识别鸟鸣来获取相关鸟类信息，了解鸟类物种种群的数量、种类以及生活习性，对鸟类进行监控和保护，从而对周围的生态环境或居住环境进行评估与预测。

随着科技的日渐发展，鸟类声音的分类识别技术已经取得了不少的研究成果。文献[1]用

正弦曲线对连续鸟叫声的音节进行建模，进而用得到的参数对大量鸟叫声进行分类识别。文献[2]把声音信号表征成码书帧柱状图，用由贝叶斯风险最小化导出的最大后验概率（Maximum APosteriori， MAP）和基于统计流形的KullbackLeibler散度规则的最近邻分类器来对大量鸟叫声进行识别。文献[3]提出了基于音节分割的鸟叫声分类识别方法，比对了正弦曲线模型特

征、梅尔频率倒谱系数（MelFrequency Cepstrum Coefficient， MFCC）和基音时频特征三种特征，分析了动态时间规整（Dynamic Time Warping， DTW）、高斯混合模型（Gaussian Mixture Model， GMM）和隐马尔科夫模型（Hidden Markov Model， HMM）三种分类器对鸟叫声自动识别的适用性及有效性。考虑到噪声的影响，研究者也探索了噪声中的鸟叫声识别方法。文献[4]通过降噪分段后提取小波包分解（Wavelet Packet Decomposition， WPD）的小波

系数特征，最后用无监督自组织映射（SelfOrganizing Map， SOM）和监督多层感知（MultiLayer Perceptron， MLP）两种神经网络分类器来对不和谐的瞬时鸟叫声进行分类识别。文献[5]在多种鸟声重叠和存在自然噪声的情况下，对两种濒临灭绝的鸟类进行声音检

测，用噪声估计和谱减法去噪，根据鸟叫声监视鸟类种群。文献[6]利用谐音特点提取基于音

调的特征，用GMM进行建模，分别在白噪声和真实噪声环境下对95种鸟类的165段谐音鸟叫声音节进行自动检测和分类识别。