抖音热门音乐特征分析
目录
1. 摘要 3
2. 引言 3
3. 研究方法 3
3.1 数据获取 4
3.1.1 获取当下最热门的400首音乐 4
3.2 音频处理 5
3.2.1 音乐格式转换与时长处理 6
3.2.2 midi生成 7
3.3 音频特征 7
3.3.1 基础音频信息 8
3.3.2 统计特征提取 12
3.4 数据降维及归一化 17
3.4.1 PCA主成分分析 17
3.4.2 数据归一化 17
3.5 聚类算法 18
3.5.1 K-Means聚类 18
3.5.2 MiniBatch k-Means 20
3.5.3 评价聚类模型 20
3.6 分类算法 22
3.6.1 HMM算法(隐马尔可夫模型) 22
4. 案例实践 25
4.1 数据爬取以及处理 26
4.2 波形分析 28
4.2.1 音乐波形图 28
4.2.2 音乐语谱图 31
4.2.3 音乐音调变化图 34
4.2.4 音乐自相似矩阵图 37
4.2.5 光谱过零率以及质心变化 39
4.3 音乐特征分析聚类 41
4.3.1 统计特征处理 41
4.3.2 特征筛选 42
4.3.3 归一化和降维处理 44
4.3.4 K-Means聚类 45
4.4 音乐风格分类 50
4.4.1 HMM模型训练 51
4.4.2 音乐分类预测 53
4.5 midi文件生成 55
5. 结论 56
6. 反思与不足 57
7. 参考文献 57
1. 摘要
本次毕业设计选取了抖音当下最热门的400首音乐,通过一系列方法提取每首歌的波形特征,再经过降维以及机器学习等手段,进行无监督学习对音乐数据进行聚类的同时训练并使用监督学习分类器进行音乐流派分类,并通过可视化方法呈现分类聚类效果。
关键词:特征提取,PCA主成分分析,Normalization归一化,sklearn机器学习,pytorch神经网络,k-means聚类,Librosa音频处理,HMM隐马尔可夫模型,midi音序