大数据背景下综艺明星分析系统的设计与实现
本科生毕业设计任务书
一、设计主要内容
在互联网时代,伴随着各种社交媒体的盛行,公众人物的一言一行也被无限放大,对于广大群众的价值导向作用也被进一步的激发。由此从大数据的角度对综艺节目进行分析和研究,实现一个基于Python的综艺明星分析系统。该系统可得出不同嘉宾的受众程度,最终分析出影响力大的公众人物,进行正向的舆论引导,稳定社会秩序。
本系统要具备公众人物分析、观众分析、节目分析、观众反馈、数据采集、数据预处理等功能。把综艺节目的数据作为数据源,利用大数据相关技术,用Python进行爬取弹幕数据和数据预处理,经过数据预处理之后最终存储到MySQL数据库中,然后经由Django框架来搭建后台,利用Axios将网页与后台进行交互获取数据,使用CSS、HTML、JavaScript语言对网页进行布局和实现动态效果。
在整个系统生命周期的开发实现过程中,先对系统进行需求分析,力求详尽具体,涵盖每个功能性需求和非功能性需求;再设计系统的功能和选择实现的算法;再对系统的总体结构和模块进行设计、实现和测试。
2.设计的基本内容、目标、拟采用的技术方案及措施
(1)设计的基本内容
本设计拟实现综艺明星分析系统,本系统要具备公众人物分析、节目分析、观众反馈、数据采集、数据预处理等功能。对公众人物的静态数据、动态数据、影响力等进行分析,对某名特定公众人物的粉丝群体进行分析,采集系统分析的数据,包括综艺节目的弹幕、评论以及用户的内部数据,对采集到的数据进行缺失值及异常值处理、文本处理,通过数据可视化技术生成词云图等图表,来将基本的内容呈现出来。
(2)设计的目标
实现一个基于Python的综艺明星分析系统。该系统可得出不同嘉宾的受众程度,最终分析出影响力大的公众人物,进行正向的舆论引导,稳定社会秩序。
拟采用的技术方案及措施
本系统把综艺节目的数据作为数据源,利用大数据相关技术,用Python进行爬取弹幕数据和数据预处理,经过数据预处理之后的数据和用户的注册信息最终存储到MySQL数据库中,然后经由Django框架来搭建后台,利用Axios将网页与后台进行交互获取数据,使用CSS、HTML、JavaScript语言来设计系统注册、登录与显示页面的样式布局和实现动态效果。
二、完成的主要任务及要求
1. 积极查阅文献资料,明确确定毕业设计题目的意义和目的;
2. 学习数据采集,数据处理,数据可视化,数据分析,前后端分离技术;
3. 完成对于综艺明星分析系统的设计与实现;
4. 设想多个可行性方案,分析对比后,选择其中一个方案进行实现;
5. 在实现过程中,对公众人物数据进行详细分析,对系统进行需求分析;
6. 撰写毕业设计说明书及毕业设计简介;
7. 设计文档撰写。
三、完成任务的时间节点
第七学期第5周-8周:查阅参考文献,与指导老师沟通,初步确定选题。
第七学期第9周-10周:确定选题,指导教师下达任务书。
第七学期第15周-16周:阅读大量参考文献,形成自己设计方案,完成开题答辩。
第八学期第1-2周:完成综艺节目弹幕信息的研究。
第八学期第3-4周:完成总体框架设计及各功能模块设计。
第八学期第5-6周:细化研究子模块,调试代码,测试数据。
第八学期第7-9周:完成毕业设计文档撰写工作,并对文档进行查重,完成毕业设计定稿。
第八学期第10周:将毕业设计提交指导教师评审,评阅人评审。
第八学期第11周:进行毕业答辩并公布成绩。
四、必读参考文献
[1]黄传祥.习近平新闻舆论思想研究[D].湖南:湖南师范大学,2018:20-22.
[2]李夏.社交媒体数据分析平台的设计与实现[D].北京:北京交通大学,2014:1-31.
[3]刘珂.浅析国内社交媒体的发展现状[J].艺术科技,2019,032(007):123.
[4]宋振文.新媒体:公共危机舆情管理的机遇与挑战[J].学术论坛,2011,034(012):195-199.
[5]程军祥,颜家梁.舆论监督与公众人物[J].新闻知识,2005(07):32-34.4-7.
[6]佚名.大数据时代[J].中国电子科学研究院学报,2013,8(1):2-2.
[7]闫成印.物联网带动大数据发展[J].互联网天地,2012,000(011):29-31.
[8]林立志.大数据对当代技术体系的影响及意义探析[D].哈尔滨:哈尔滨工业大学,2018:11-12.
[9]杜悦.从明星真人秀节目看受众的使用与满足——以《奔跑吧兄弟》为例[J].新闻世界,2014,12:196-197.
[10]李俊华.基于Python的数据分析[J].电子技术与软件工程, 2018(17):167.
[11]李俊华.基于Python的数据可视化[J].新型工业化,2021,11(3):69-70.
[12]钟如秀.基于Django框架的在线视频学习系统设计与实现[J].电脑编程技巧与维护,2019(08).
[13]Alcalde-Barros A , Diego García-Gil,Salvador García,et al.DPASF:a flink library for streaming data preprocessing[J]. Big Data Analytics,2019,4(1):4.
[14]Salvador García, Julián Luengo, Herrera F. Data Preprocessing in Data Mining[J]. Computerence,2000,72.
[15]Yao Q ,Tian Y,Li PF, et al. Design and Development of a Medical Big Data Processing System Based on Hadoop[J]. Journal of Medical Systems, 2015, 39(3):1-11.
指导教师签名: 年 月 日
专业带头人签名: 年 月 日
二级学院院长签名(章): 年 月 日