开题报告内容与要求
一、本课题的研究意义、研究现状和发展趋势(文献综述)
1.研究意义
互联网在如今的爆发式发展已经改变了我们的生活方式。在很大的程度上,互联网已经改变了我们的生活。互联网上资源的爆发时增长让获取有效信息成为了新的难题。用户接触到的信息非常有限。于是很多提出帮助用户快速精准找到所需信息的解决方案诞生了,例如搜索引擎,推荐系统等。
目前大型的音乐门户类网站的歌曲库规模往往包含上千万首的歌曲,这些歌曲被划 分成不同的语种、流派、年代、主题、心情、场景等,包含的信息非常的丰富,存在着 严重的信息过载。对于系统中每一位音乐用户来说,都不可能去收听曲库内的每一首歌, 很多时候用户的需求往往是“一首或几首好听的歌曲”这种模糊的需求,如何根据用户 在系统中产生的行为信息去庞大的歌曲库中挖掘出用户可能感兴趣的音乐,这就需要个 性化音乐推荐系统综合考虑用户偏好、时间、地点、环境等各种复杂的特征,准确的从 上千万的海量歌曲库中挑选出此时此刻最适合这个用户聆听的个性化音乐,给广大的用 户带来美的享受,真正做到众口可调。
2.研究现状
国外研究现状:个性化推荐系统的定义是 Resnick 和 Varian 在 1997 年给出的:“它是利用电 子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销 售人员帮助客户完成购买过程”。从最初在电子商务网站的深度剖析,到当下在 的音乐、电影、学习资料等不同领域的广泛应用。在三十多年的时间里,个性化 推荐系统一直是学术界和工业界的关注的焦点。其优点在于主动性。它能自发地 收集并分析用户的行为数据,为用户的兴趣建模,得到用户的兴趣偏好后,匹配系 统中资源的特征,为用户做出有效的个性化推荐。同时,推荐引擎要一直监测系统 中的项目变化和用户在不同行为下的兴趣特征变迁,针对不同的变动,做出相应推 荐策略的调整。各平台为增加用户的黏着性,以及用户对推荐结果的准确度要求, 使得推荐系统的核心技术层出不穷,比较成熟的推荐技术有:基于内容的推荐、协同过滤(基于相似度的最邻近协同过滤算法、基于潜在因子的矩阵分解推荐算法)、深度学习、基于标签的推荐系统、混合推荐算法等。
国内研究现状:国内的音乐推荐技术发展相对缓慢。大多数音乐网站采用的技术不够成熟,基本上是针对所有 用户,个性化成分太少。不过,经过一段时间的发展,国内也涌现出了一些优秀的音乐推荐网站,比如 SongTaste、虾米网和豆瓣网等。SongTaste 是一个社 交性质的音乐网站。在它的社区中,每一个用户都可 以看到大家最近在收听什么音乐、有什么新的音乐推 荐。它的音乐分类相当齐全,而且推荐排行实时更 新。另外,根据用户平时推荐的歌曲、听歌行为以及 歌曲收录信息,还能够找到“相似的品味者”,从而更 好地做出推荐。豆瓣网也是一个社交性的音乐推荐 网站。它主要通过豆瓣小组、新浪微博、MSN、开心 网、人人网等互动平台来分享和传播用户喜欢的音乐。虾米网在注册成为网站会员时会让用户选择至 少 5 位艺人进行收藏,以此来初步确定用户欣赏音乐 的倾向。另外,用户还可以从大家的推荐中搜索自己 喜爱的音乐,或者从品味相似的好友中找到适合自己 的音乐。
3.发展趋势(文献综述)
3.1发展趋势
由音乐治疗的研究成果和临床案例可以发现,音乐的某些物理属性能够与人的神经系统产生共鸣, 进而引发人体生理指标的有益变化。并且,音乐还能 创造出一种心理律动,这种心理律动与人的生理结构及功能是极为一致的。因此,根据不同人的生理心理反应,可以对应出不同疗效的音乐,由此实现个性化的音乐推荐。针对目前音乐推荐技术存在的问题,从“人文关怀”的角度出发,提出了一种新的音乐推荐技术的研发方向,即把人的生理指标和心理状态同特定的音乐类型联系起来,通过某些生理参数的变化并结合实时的情绪状态来寻求匹配的音乐资源,由“生理 - 音乐 - 心理”模型作为依托,实现音乐推荐的功能,
从而达到音乐治疗的目的,帮助用户舒缓压力、愉悦 身心。
这种推荐模式的建立,需要对大量个体进行实 验。首先,使用医学仪器测量人的生理参数,试图发掘这些参数的变化规律; 其次,通过心理学问卷分析人的心理情绪,由此形成用户信息模型; 再次,对音乐库中的音乐进行人工标注,依据情感特征形成不同分类; 最后,进行音乐试听的主观实验,由统计分析结果
得到生理心理和音乐类型之间的关联,由此建立数学模型。
这项新技术的研发,可以有效避免音乐推荐的商业化行为。因为它完全不用比较音乐的点击率、用户关注度和评价信息,因此不会产生冷启动、稀疏性和扩展性问题,而对于用户心理或情绪上的波动又具有明显的针对性,不失为一种人性化的音乐推荐技术。
二、主要设计(研究)内容
1.设计内容
本次设计的主要内容是:
1)用户对音乐评分的搜集(python爬虫爬取数据)
2)Hadoop大数据平台及其相关组件的搭建(Linux的搭建、安装hadoop、安装spark、安装mysql、下载安装IDE、安装scala插件、安装kettle、安装Node.js、)
3)调研与分析,确定系统需求。
4)实现个性化音乐推荐系统的基本功能:用户管理、音乐信息管理、音乐上架下架管理、用户评分信息统计、个性化音乐推荐。
2.本系统所要实现的主要功能模块如下:
2.1 用户管理
用户管理子模块主要实现系统操作者的维护工作, 其主要的功能有:修改密码、操作员管理、操作员权限分配等。(暂定用户角色为:管理员、音乐创作者、用户)。
2.2 音乐信息管理
音乐信息管理模块主要实现音乐创作者的维护工作,其主要的功能有:音乐上架、音乐下架、音乐信息录入。
2..3 用户评分信息统计
用户评分信息统计模块主要实现用户评分的统计工作,其主要功能有:不同用户对不同音乐的评分统计。
2.4 个性化音乐推荐
个性化音乐推荐模块主要实现系统推荐页面正常更新工作,其主要功能有:用户喜好预测、推荐界面更新。
三、研究方案及工作计划(含工作重点与难点及拟采用的途径)
本系统在ubuntu16.04系统环境下编写
开发语言:Java,C++,shell,python,html等
编译工具:code:block,Mysql,Kettle,Node.js,Hadoop等
编译环境(使用环境):全平台
后台数据库:Mysql数据库
1.本次设计的主要难点
1.1.hadoop大数据平台的搭建。在课题开始之前需要安装Hadoop大数据平台,其中大数据框架安装时需要配置正确的参数和安装环境,这里的参数配置是相对困难的。
1.2。Python数据爬取。系统里的数据从网易云中获取,网易云网页版爬取时有反扒机制,并不容易获取。
1.3.推荐算法的实现。系统选择使用协同过滤算法。算法的正确实现是推荐页面实时更新的关键。算法实现不仅要求数据格式正确还要求算法代码的正确编写。
1.4.推荐页面实时更新。前端页面能够运行起来是很容易的,在后端数据推荐算法的实现后,前端的信息能够及时变化是非常必要的。在系统开发完成之后,一位用户获取一次推荐是比较容易的,多位用户获取多次推荐,且要得到及时反映是比较困难的。
2.本次设计的主要步骤
2.1课题了解
此处的课题了解包括但不限于:分析用户听歌的行为,为广大用户提供可能符合他们的兴趣爱好的歌曲。
2.2可行性分析
可行性分析包括:经济可行性,到网上寻找可用的数据;技术可行性,系统开发人员是否可以完成所定下的需求;操作可行性,是否可以方便熟练使用本系统;社会可行性,本系统的实施是否可以切实的为用户推荐用户喜爱的音乐;法律可行性,本系统开发的所有功能是否会违反国家相应的法律文献。
2.3需求分析
需求分析主要分析,音乐数据采集方面需要我们完成哪些功能,同时所开发的系统需要分析哪些数据信息,方便系统推荐。并绘制相应的功能模块流程图、系统流程图、ER图等。
2.4系统开发
根据上述所提出的需求进行系统开发设计。
2.5系统测试
对所开发的系统编辑相应的测试用例,并依据需求说明一一对系统进行功能测试。
2.6撰写报告
设计(论文)进度计划
学院
|
计算机与信息学院
|
姓名
|
胡豪雷
|
学号
|
3160703130
|
专业班级
|
信管161
|
指导教师
|
严轶群/高金新
|
课题名称
|
个性化音乐推荐系统
|
日期
|
工 作 内 容
|
1.20-3.24
|
(1)了解课题需求,分析课题内容收集资料和查阅相关文献。
(2)熟悉开发平台及开发工具
(3)根据查阅资料,了解开发课题的意义、现状及其发展趋势,分析系统所需功能模块
(4)撰写开题报告。
|
3.25-4.7
|
(1)对研究课题进行调查分析
(2)根据调查分析结果进行需求分析并撰写需求说明
(3)根据需求分析结果进行功能模块设计
|
4.8-4.28
|
(1)系统基层应用的搭建
(2)系统各个功能模块单独开发
|
4.29-5.26
|
(1)系统功能模块整合
(2)系统调试
(3)毕业论文撰写
|
5.27-6.15
|
(1)请指导老师检阅文档及系统,后期功能调试
(2)完成答辩
|
四、阅读的主要参考文献(不少于10篇,期刊类文献不少于7篇,应有一定数量的外文文献,至少附一篇引用的外文文献(3个页面以上)及其译文)
【1】Yuan Xie,Lei Ding.A Survey of Music Personalized Recommendation Syste[J].International Conference on Network, Communication, Computer Engineering (NCCE),2018,147:852-857.
【2】艾笔.个性化音乐推荐系统的设计与实现[D].成都:电子科技大学,2018年6月.
【3】邓腾飞.个性化音乐推荐系统的研究[D].广州:华南理工大学,2018年4月.
【4】谢宛辰.基于领域本体的个性化音乐推荐系统的设计与实现[D].杭州:浙江大学,2018年4月.
【5】谭学清,何珊.音乐个性化推荐系统研究综述[J].现代图书情报技术,2014,9:22-32.
【6】张燕,唐振民,李燕萍.面向推荐系统的音乐特征抽取[J].计算机工程与应用,2011,47(05):130-133.
【7】李瑞敏,闫俊,林鸿飞.基于音乐基因组的个性化移动音乐推荐系统[J].计算机应用与软件,2012,29(09):27-30+56.
【8】刘珊珊. 音频特征与社会标签相结合的音乐推荐系统[D].华中科技大学,2011.
【9】孔云. 基于混合模式的个性化音乐推荐系统的研究与实现[D].华中师范大学,2016.
【10】李世旭. 音乐推荐系统的设计和实现[D].电子科技大学,2014.
【11】徐淮杰,张二芬.基于关联规则与奇异值分解的音乐推荐系统[J].电子设计工程,2013,21(01):17-19.
【12】邓爱林,朱扬勇,施伯乐.基于项目评分预测的协同过滤推荐算法[J].软件学报,2003(09):1621-1628.
【13】陈清.基于Python的网站爬虫应用研究[J].通讯世界,2020.
【14】李冲.基于用户的协同过滤推荐算法MapReduce并行化实现[J].软件导刊,2018,17(10):76-80.
【15】张海燕.计算机软件开发的JAVA编程语言应用[J].电子技术与软件工程,2019(15):35-36.
【16】徐淮杰,张二芬.基于关联规则与奇异值分解的音乐推荐系统[J].电子设计工程,2013,21(01):17-19.