基于GMM的音频分类算法研究
摘要
通过对音频信号特征参数的提取,使用GMM作为分类器,最终实现音频分类,并且获得较高的分类正确率。音频特征信号识别一般采用模式匹配的方法解。首先通过预处理提取音频特征,作为该音频片段的模型。将该模型与已知的参考模型相比较,获得最佳匹配的参考模式作为识别结果,在论文中研究的是基于传统的BP神经网络的音频分类与GMM技术音频分类的仿真实验结果进行比较,对比两者各自优缺点,从而熟悉这两种技术的基本工作原理和算法。通过实验对其性能进行了主观评价和客观数据分析,对于所选音频信号BP网络具有较快的训练速度,但是GMM技术具有较高的识别率。BP网络的学习和记忆具有不稳定性。也就是说,如果增加了学习样本,训练好的网络就需要从头开始训练,对于以前的权值和阈值是没有记忆的。但是可以将预测、分类或聚类做的比较好的权值保存。
关键词:音频识别,特征提取,音频分类,BP网络,GMM
Abstract
The audio signal by extracting feature parameters, using GMM as a classifier, ultimately audio classification and obtain a higher classification accuracy. Audio characteristic signal recognition method for solving general use pattern matching. First extract audio features through pretreatment, as a model of the audio clip. The model with the known reference model is compared to obtain the best matching reference model as a recognition result, research in the paper is based on simulation results of traditional BP neural network technology audio audio classification and GMM classification comparison, Compare the advantages and disadvantages of both, thus familiar with both technology, the basic working principle and algorithms. Its performance through subjective evaluation experiments and objective data analysis, for the selected audio signal BP training network has a faster speed, but GMM technique has a high recognition rate. BP network learning and memory have instability. In other words, if you increase the study sample, the trained network will need to start training from scratch, for the previous weights and thresholds are no memory. But it can be predicted, classification or clustering do better to save weight.
Keywords: audio recognition, feature extraction, audio classification, BP network, GMM
目录
摘要 1
第一章 绪论 3
1.1 音频信号处理发展前景 4
1.2 音频识别技术概述 4
1.2.1 音频识别技术的发展历史回顾 5
1.2.2 音频识别系统的基本原理 6
1.2.3 音频识别的意义 6
1.3 项目的主要研究内容 7
1.4本文的主要章节安排 7
第二章 信号的预处理 7
2.1 信号的预加重 8
2.2音频信号的加窗分帧 9
2.3音频信号的端点检测 10
2.3.1 音频信号的短时能量分析 10
2.3.2 音频信号的短时过零率分析 11
2.3.3 基于短时平均能量和短时平均过零率的双门限端点检测 12
第三章 音频信号的特征矢量提取 14
3.1 信号的倒谱分析 14
3.2 梅尔倒谱参数 15
第四章 基于BP神经网络的音频信号数据分类 20
4.1BP神经网络 20
4.1.1 BP神经网络概述 20
4.1.2 音频特征信号分类 22
4.2BP 网络的MATLAB实现 22
4.2.1 归一化方法及MATLAB实现 23
4.2.2 数据选择选择和归一化 23
4.2.4 仿真结果分析 24
第五章 利用GMM建立分类器来对音频特征信号进行分类预测 27
5.1支持向量机技术简述 27
5.1.1 GMM的原理 27
5.1.2基于GMM的数字音频分类 28
5.1.3实验的仿真结果与分析 29
总结与展望 32
致 谢 33
毕业设计小结 34
参考文献 35
附录1:相关文献的翻译 36