基于支持向量机的语音情感识别（外文翻译）-毕业作品网站

设计任务书文档开题答辩说明书格式模板外文翻译范文资料作品文献课程实习指导调研下载网络教育 计算机 网站网页 小程序 商城购物订餐电影安卓 Android Html Html5 SSM SSH Python 爬虫大数据 管理系统 图书校园网考试选题网络安全推荐系统机械模具夹具自动化数控车床汽车故障诊断电机建模 机械手 去壳机千斤顶变速器减速器图纸电气变电站电子 Stm32 单片机 物联网 监控密码锁 Plc 组态控制智能 Matlab 土木建筑结构框架教学楼住宅楼造价施工办公楼给水排水桥梁刚构桥水利重力坝水库采矿环境化工固废工厂 视觉传达 室内设计产品设计 电子商务 物流盈利案例分析评估报告营销报销会计

首　页

机械毕业设计

电子电气毕业设计

计算机毕业设计

土木工程毕业设计

视觉传达毕业设计

理工论文

文科论文

毕设资料

帮助中心

设计流程

您现在所在的位置：首页 >>理工论文 >> 文章内容

我们提供全套毕业设计和毕业论文服务，联系微信号：biyezuopinvvp QQ：1015083682

基于支持向量机的语音情感识别（外文翻译）

文章来源：www.biyezuopin.vip 发布者：毕业作品网站

毕业设计（论文）

译文及原稿

译文题目：	基于支持向量机的语音情感识别
原稿题目：	Speech Emotion Recognition Using Support Vector Machines
原稿出处：	International Journal of Computer Applications (0975-8887) Volume 1 - No. 20

基于支持向量机的语音情感识别

摘要

在人机交互(HCI)这一广泛的应用领域，自动语音情感识别(SER)是目前较流行的研究课题。比如Mel频率倒谱系数(MFCC)和Mel能谱动力系数(MEDC)这些都是提取与语音表达的语音特征。在Berlin的数据库中，支持向量机(SVM)作为分类器识别不同的情绪状态：愤怒、快乐、悲伤、中性、恐惧。LIBSVM在被用于识别情感中，性别独立的94.73%女性和100%的男性演说试验中，它给出了93.75%的识别率。

范畴与学科描述符

I.5.0【模式识别】:一般

一般术语

性能；实验；认为因素

关键字

语音情感情感识别 SVM MFCC MEDC

1.概述

在人机交互领域(HCI)中，自动语音情感识别是最近开始研究的课题。随着计算机日渐成为我们日常生活中的重要组成部分，语音情感识别的需要已经上升为一种更为自然的人机之间的通信接口。为了达到这样的目标，计算机必须要能够感知到当前的情绪并且为此情绪作出不同的反应。这个过程包括要清楚用户的情感状态。为了使人机交互更加自然，计算机就应该像人类一样有识别情感的能力。

自动情感识别(AER)有两种方式：通过语音或者面部表情。在HCI领域中，比如面部表情和手势，语音是情感识别系统中最基本的方式。在沟通中想要得知对方的动机和情绪，语音是最有力的一种方式。

近年来，大量的研究过工作已经通过语音信息识别到了人的情感[1][2]。很多研究者已经找到了很多识别方法：神经网络(NN)、高斯混合模型(GMM)、隐马尔科夫模型(HMM)、最大似然的贝里斯分类器(MLC)、最邻近算法(KNN)和支持向量机(SVM)[3]，[4]。

支持向量机是因为有达到识别和认知的目的而被用于识别语音情感，。它通过制造一个N维空间的超平面来达到识别的功能。这个分类器的主要思想是通过一个线性和非线性的间隔区的训练样本点集合，利用核函数将原输入设置成一个高维空间的分类函数。

被记录在柏林科技大学里的情感数据库[5]适用于特征提取和训练支持向量机，包括了德语的情感行为，它包括五位男性五位女性的十位专业演员说的在7个不同的情感中的10个句子493个词语。这些情绪包括生气、郁闷、厌恶、恐惧、幸福、悲伤和中性。

语音情感识别可以应用于精神病学的诊断、智能玩具、谎言检测、学习环境、教育软件和在电话呼叫中心的对话中检测情绪状态并及时反馈给操作员和主管监控。

2.系统的实现

人与人的互动中的情感分析在工程和计算机科学中用电脑自动的方式来识别情绪中有着重要的作用。

如图1所示的输入是来自柏林的包含不同情绪情感的.wav语音，之后通过特征提取，在特征提取中有两个特征MFCC[5][6]和MEDC[7]。这些特征及其相应等级标注分别输入到LIBSVM分类型中，分类器输出的每一个标注都代表相应的情感类;有生气、悲伤、高兴、中性和恐惧五种。

2.1特征提取

在以前的研究中提取的都是语音的能量、音调、共振峰频率等韵律特征，这种一般的韵律特征主要的表明了说话者的情感状态。在特征提取中有两种特征：MEL频率倒谱系数(MFCC)和MEL能谱动力系数(MEDC)。

图2是MFCC特征提取的过程，有以下的步骤;

预处理：连续时间信号通过相应的采样频率采样。在MFCC特征提取的第一阶段是在高频中增加一定的能量，即通过一个过滤器对其进行预加重。

分帧：将语音信号通过采样转换为数字信号{ADC}，到帧长为20-40ms的时间范围内分帧能使非平稳语音信号分割为似稳定帧，并能得到通过傅里叶变换的语音信号。这是因为大家都知道，语音信号中的似稳定的周期为很短的20-40ms。

图2.MFCC系统提取

加窗：给信号开始和结束的每一帧加窗是为了减少信号的间断。

快速傅里叶变换：快速傅里叶变换(FFT)算法是用于衡量语音信号的频谱。FFT将长度为N的每一帧从时域变换为频域。

全套毕业设计论文现成成品资料请咨询微信号：biyezuopinvvp QQ：1015083682 返回首页如转载请注明来源于www.biyezuopin.vip

打印本页 \| 关闭窗口
上一篇文章：语音信号中的情感信息处理研究文献综述	下一篇文章：语音信号中的情感信息处理研究毕业论文+任务书+开题报告+文献综述+外文翻译及原文+MATLAB代码

本类最新文章

降低商用飞机的直接维护费用的方法 …	基于注塑模具钢研磨和抛光工序的自 …	基于arduino的智能台灯设计 …
基于多传感器融合的井下装备周边人 …	室温下铁磁过渡金属掺杂ZnO薄膜 …	图像处理报告基于CNN的监控视频 …

| 关于我们 | 友情链接 | 毕业设计招聘 |

Email：biyeshejiba@163.com 微信号：biyezuopinvvp QQ：1015083682
本站毕业设计和毕业论文资料均属原创者所有,仅供学习交流之用,请勿转载并做其他非法用途.如有侵犯您的版权有损您的利益,请联系我们会立即改正或删除有关内容!