目录
1 选题的背景和意义
1.1 选题的背景
随着信息技术的高速发展和人类对计算机技术的依赖性的不断增强,人机的
1.2 国内外研究现状及发展趋势
1、科大讯飞语音技术
2、百度语音
1、Siri
2、微软Cortana
2 研究的基本内容
2.1 基本框架
1、 提出本论文的研究问题、研究内容、研究方案、研究的重点和难点和拟
2、介绍语音库语句的选择和采集,对采集到的语音样本进行听取检定确
3、介绍针对语音信号所采用的预处理算法,主要包括语音信号的偏差校
4、建立模型并验证。
2.2 研究的重点和难点
2.3 拟解决的关键问题
3 研究的方法及措施
4 预期成果
2、 资料收集准备阶段
3、 论文写作及答辩阶段
参考文献
1 选题的背景和意义
1.1 选题的背景
随着信息技术的高速发展和人类对计算机技术的依赖性的不断增强,人机的
交互能力越来越受到研究者的重视。为了使人类与计算机间能够更加智能更加自然地交互,新型的人机交互(Human Machine Interaction,HCI)技术正逐渐成为研究热点。如何实现计算机的拟人化,使其能感知周围的环境和气氛以及对象的态度、情感等内容,自适应地为对话对象提供最舒适的对话环境,尽量消除操作者和机器之间的障碍,已经成为下一代计算机发展的目标。研究表明,在人机交互中需要解决的问题实际与人和人交流中的重要因素是一致的,最关键的都是“情感智能”的能力。计算机要能够更加主动地适应操作者的需要,首先必须能够识别操作者的情感,而后再根据情感的判断来调整交互对话的方式。对于情感信息的处理技术的研究包括多个方面,主要有情感特征分析、情感识别(如肢体情感识别、面部情感识别和语音情感识别等)、情感模拟(如情感语音的合成等)。目前,关于情感信息处理的研究正处在不断深入之中,其中语音信号中的情感信息处理的研究也越来越受到人们的重视。
通过语音相互传递信息是人类最重要的基本功能之一。声音是人类常用的工具,是相互传递信息的最重要的手段。情感在人们生活和交流中起着重要的角色。包含在语音中的情感信息是一种很重要的信息资源,它是人们感知事物的必不可少的信息。例如同样的一句话,由于说话人表现的情感不同,意思就会完全不同,在听者的感知上就可能会有较大的差别。所谓“听话听音"就是这个道理。然而,传统的语音信号处理技术把这部分信息作为噪声给去掉了。实际上,语音信号中不仅包含文字信息,还包含了语调及情感信息。人们同时接受各种信息,怎样有效地利用各种形式的信息达到最佳的信息传递和交流效果,是今后信息处理研究的发展方向。所以分析和研究语音中的情感特征、判断说话人的喜怒哀乐是一个意义重大的研究课题。
1.2 国内外研究现状及发展趋势
近年来,国内外许多学者和企业在语音识别技术方面有了相当大的进展,在国内方面,国内语音技术发展良好,优秀企业众多,此处列出两个代表:
1、科大讯飞语音技术
科大讯飞始终坚持一个方向去做,那就是语音。作为亚太地区最大的智能语音和人工智能上市公司,科大讯飞在智能语音领域拥有国际领先的技术水平与成果。语音识别为文字的精确度极高,语音合成技术优秀,在国内科大讯飞语音技术普及度很高,