撰写内容要求:
1.目的及意义(含国内外的研究现状分析)
目的及意义:
随着信息时代的快速发展,人们已经实现了网上购物,或者完成各种视频会议等日常活动,而相应的数据便是改信息时代的产物,比如阿里巴巴在2015年双十一购物狂欢节甚至达到了591亿的销量。然而,信息时代的产物也就是数据的处理变成了一个头痛的问题,怎么从海量的数据中挖掘到有价值的信息,提供大数据的服务给用户,提供更好的体验给用户,从而挖掘出数据的价值,推荐系统也许就成了一种很好的解决方案。
可是大多数的中小型企业使用的推荐系统都是基于简单地处理算法,处理效率第并且无法对大量的数据进行处理分析。所以,为了推广推荐系统的应用,本论文从实际操作出发,设计开发一种基于大数据的音乐推荐管理系统。
国内外研究现状:
国内研究现状:国内的音乐推荐技术发展相对缓慢。大多数音乐网站采用的技术不够成熟,基本上是针对所有 用户,大数据成分太少。不过,经过一段时间的发展,国内也涌现出了一些优秀的音乐推荐网站,比如 SongTaste、虾米网和豆瓣网等。SongTaste 是一个社交性质的音乐网站。在它的社区中,每一个用户都可以看到大家最近在收听什么音乐、有什么新的音乐推 荐。它的音乐分类相当齐全,而且推荐排行实时更新。另外,根据用户平时推荐的音乐、听歌行为以及音乐收录信息,还能够找到“相似的品味者”,从而更好地做出推荐。豆瓣网也是一个社交性的音乐推荐 网站。它主要通过豆瓣小组、新浪微博、MSN、开心网、人人网等互动平台来分享和传播用户喜欢的音乐。虾米网在注册成为网站会员时会让用户选择至少5位艺人进行收藏,以此来初步确定用户欣赏音乐 的倾向。另外,用户还可以从大家的推荐中搜索自己 喜爱的音乐,或者从品味相似的好友中找到适合自己 的音乐。
国外研究现状:大数据推荐系统的定义是 Resnick 和 Varian 在 1997 年给出的:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。从最初在电子商务网站的深度剖析,到当下在的音乐、电影、学习资料等不同领域的广泛应用。在三十多年的时间里,大数据 推荐系统一直是学术界和工业界的关注的焦点。其优点在于主动性。它能自发地收集并分析用户的行为数据,为用户的兴趣建模,得到用户的兴趣偏好后,匹配系 统中资源的特征,为用户做出有效的大数据推荐。同时,推荐引擎要一直监测系统中的项目变化和用户在不同行为下的兴趣特征变迁,针对不同的变动,做出相应推 荐策略的调整。各平台为增加用户的黏着性,以及用户对推荐结果的准确度要求,使得推荐系统的核心技术层出不穷,比较成熟的推荐技术有:基于内容的推荐、协同过滤(基于相似度的最邻近协同过滤算法、基于潜在因子的矩阵分解推荐算法)、深度学习、基于标签的推荐系统、混合推荐算法等。
发展趋势:由音乐治疗的研究成果和临床案例可以发现,音乐的某些物理属性能够与人的神经系统产生共鸣,进而引发人体生理指标的有益变化。并且,音乐还能 创造出一种心理律动,这种心理律动与人的生理结构及功能是极为一致的。因此,根据不同人的生理心理反应,可以对应出不同疗效的音乐,由此实现大数据的音乐推荐。
针对目前音乐推荐技术存在的问题,从“人文关怀”的角度出发,提出了一种新的音乐推荐技术的研发方向,即把人的生理指标和心理状态同特定的音乐类型联系起来,通过某些生理参数的变化并结合实时的情绪状态来寻求匹配的音乐资源,由“生理-音乐-心理”模型作为依托,实现音乐推荐的功能,从而达到音乐治疗的目的,帮助用户舒缓压力、愉悦 身心。这种推荐模式的建立,需要对大量个体进行实验。
首先,使用医学仪器测量人的生理参数,试图发掘这些参数的变化规律;
其次,通过心理学问卷分析人的心理情绪,由此形成用户信息模型; 再次,对音乐库中的音乐进行人工标注,依据情感特征形成不同分类;
最后,进行音乐试听的主观实验,由统计分析结果得到生理心理和音乐类型之间的关联,由此建立数学模型。这项新技术的研发,可以有效避免音乐推荐的商业化行为。
因为它完全不用比较音乐的点击率、用户关注度和评价信息,因此不会产生冷启动、稀疏性和扩展性问题,而对于用户心理或情绪上的波动又具有明显的针对性,不失为一种大数据的音乐推荐技术。
2.研究(设计)的基本内容、目标、拟采用的技术方案及措施
基本内容:
熟练掌握系统开发的关键技术及常用的推荐算法,网络爬虫技术、JAVA、Python、MySQL、数据可视化技术、推荐算法等。搜集和整理相关资料,掌握推荐系统的设计方法,实现系统基本功能:数据收集模块(收集用户评分、下载、浏览等行为)、分析用户行为,挖掘用户潜在喜欢的音乐,构建特征模型、推荐算法模块产生大数据音乐推荐列表、大数据音乐列表展示模块等功能。
目标:
基于大数据的歌曲推荐管理系统是针对当前火热的大数据技术,在海量歌曲的管理基础上,让用户具有更好的使用体验,对有相同品味的用户,推荐可能喜欢的歌曲,在提升音乐平台的高可用性的同时,通过智能推荐提升用户对此音乐平台的好感度。
拟采用的技术方案:
系统实现用户对音乐评分的搜集(python爬虫爬取数据),后端使用大数据推荐算法构造,前端使用MVC框架搭建大数据音乐推荐系统。系统数据库使用了关系型数据库MySQL和大数据数据库。前端收集过用户行为数据后传到后端使用基于用户的协同过滤算法来推荐出用户可能喜欢的音乐。采用BS架构,使用Java程序设计语言、MySQL数据库、Hadoop离线分析、Java开源工具Eclipse编写程序、Tomcat模拟服务器、Java的JRE运行环境、jsp页面等工具开发而来。
措施:
系统设计上采用Servlet+Jsp+html作为前后台的交互,从而保证构建的系统可以在前台显示信息给用户而对后台的代码进行隐藏。系统设计按标准的软件设计大到各个功能模块,小到所使用的技术支持进行的相应的分析与设计。在构建开发环境方面,我们使用Ubuntu Linux系统作为系统搭载平台,Hadoop+Eclipse两个工具框架为硬性支持,Hadoop是一个免费开源的大数据存储开发工具。在开发环境搭建好之后,就可以开始进行系统的数据库设计与创建,做完相应的准备工作之后,便可以在系统基础的原型上对各种模块及功能进行扩充和完善。
具体开发环境如下:
操作系统:Ubuntu 14.04;
服务器:apache-tomcat-6.0.14;
Java软件: eclipse-jee-neon-x86_64;
网页开发工具:Dreamweaver8;
数据库:Mysql;
浏览器:IE8,IE9,IE10,火狐,谷歌;
语言:Java;
类库:JDK1.8版本的类库;
数据库驱动:ojdbc-connector-java-5.0.8-bin.jar;
单元测试:junit4测试。
3.进度安排
第七学期第7周-9周:完成选题和查阅参考文献等初期准备工作。
第七学期第10周-12周:完成《开题报告》的编写及开题准备工作。
第七学期第13周-16周:完成总体框架设计及各功能模块设计。
第八学期第1周-3周:完成中期设计,编写初稿,进行中期检查。
第八学期第4周-8周:完成毕业设计,查重,修改格式,5月1日前后完成答辩。
4.阅读的参考文献。
[1]刘凤玲.WEB应用技术[T].北京:清华大学出版社,2011:25-28.
[2]闻力欧.网页制作实用教程[T].北京:清华大学出版社出版社.2009:10-24.
[3]孙卫琴.Tomcat与Java Web开发技术详解(第2版)[M].北京:电子工业出版社.2009.
[4]毕建信.基于MVC设计模式WEB应用研究与实现[D].武汉:武汉理工大学.2006.
[5]贺松平.基于MVC模式的B/S架构的研究与应用[D].武汉:华中科技大学,2009.
[6]胡耀民,厉伟.Linux系统及网络管理[M].北京:人民邮电出版社,2019.
[7]阎映炳,刘雪洁.Linux系统与网络管理教程[M].北京:电子工业出版社,2010.
[8]马新强,孙兆,袁哲.Web标准与HTML5的核心技术研究[J].重庆文理学院学报:自然科学版,2010,29(6):61-65.
[9]萨师煊,王珊.数据库系统概论[M].第三版.高等教育出版社,2003。
[10]李刚.疯狂Ajax[M].电子工业出版社,2009.
5.指导教师意见
指导教师(签名):
年