项目名称:音乐流派预测
一、项目背景
随着网络技术和大规模数据库技术的不断发展,今天人们已经可以通过互联网访问包含数以百万计的音乐的在线乐库。这些音乐不仅数量庞大,而且风格各异,如何有效地管理这些音乐库,提供协助用户访问和检索的功能,使他们能够从大量不了解的音乐中有效地找到他们所喜爱的,是目前急需解决的一个重要课题。通常使用的方法是通过可以区别音乐的标志性信息,如风格流派、音乐家姓名、所使用的乐器等。但是这些信息往往并不完整,而通过听者的意见来添加这些标志性信息所需要的工作量也过于庞大。更先进的方法是运用信号处理和模式识别技术,借助计算机的处理能力来自动分析音乐文件,提取出标志性信息。在这类技术中,以音乐流派自动分类技术发展地较为成熟。
二、项目需求
2.1. 业务需求
• 结合行业相关知识,挖掘出各特征与音乐流派之间的关系。
• 识别出音乐所属的流派。
2.2. 开发周期
两周
三、数据说明
该数据包含完整音乐流派“电子”“动漫”“爵士”“另类”“乡村”“说唱”“蓝调”“摇滚”“古典”“嘻哈”等的详细信息,其中包括17个特征标签,1个类别标签,数据存放在“music_genre.csv”文件中,数据量约为5万条。
特征
|
说明
|
instance_id
|
每个音乐的唯一ID
|
artist_name
|
艺术家的名字
|
track_name
|
曲目名称
|
popularity
|
受欢迎程度
|
acousticness
|
原声程度,值介于0到1之间,代表音乐所含非电子音程度
|
danceability
|
律动感,值介于0到1之间
|
duration_ms
|
音乐的持续时间(毫秒)
|
energy
|
冲击感,值介于0到1之间,代表对音乐强度与节奏的感知,该值越高代表音乐越快节奏、大声且嘈杂
|
instrumentalness
|
歌唱部分占比,值介于0~1之间,1代表纯音乐
|
key
|
曲调,如音阶中的CDEFGAB
|
liveness
|
现场感,值介于0~1之间
|
loudness
|
响度(分贝)
|
mode
|
调式
|
speechiness
|
朗诵比例
|
tempo
|
分钟节拍数
|
obtained_date
|
获取日期
|
valence
|
“积极”程度,值介于0~1之间,该值越高表示音乐给人的感受更正向,积极
|
music_genre
|
音乐流派类别
|
四、交付内容
在项目结束时,应该提供以下交付内容:
1. 需求文档(.docx):包括但不限于以下内容
– 封面、目录。
– 项目背景、项目目标、现状分析、解决思路及流程、项目落地计划。
– 分点分级描述,格式美观,统一字体。
2. notebook文件(.ipynb):包括但不限于以下内容
– 项目实现过程步骤的完整代码、运行结果。
– 关键步骤操作原因说明、阶段成果分析解读。
– 项目内容总结。
– 良好的编码规范,充足的文字描述和代码注释。
3. 项目报告(.docx):包括但不限于以下内容
– 将需求文档及notebook文件内容合并为项目报告。
– 包含封面、目录、项目背景、项目目标、现状分析、解决思路及流程、项实现过程、项目总结。
4. 项目汇报(.PPT):包括但不限于以下内容
– 项目背景目标。
– 项目实现过程、思路。
– 项目成果展示、内容分析解读。
– 各阶段遇到的问题及解决方案。