毕业设计题目
|
热点舆情分析预测及可视化的设计与实现
|
设计目标:
对微博中各大新闻官方微博进行内容爬取并放入mysql数据库中,对所爬取的数据进行清洗并进行分类。按照事实发生状态(突发性新闻、持续性新闻、周期性新闻)、事实发生与报道的时间差距(事件性新闻与非事件性新闻)、新闻发生的地区与影响范围(国际性新闻、国内性新闻、地方性新闻)、反映社会生活的内容(政治新闻、经济新闻、法律新闻、军事新闻、科技新闻、文教新闻、体育新闻、社会新闻)进行分类。预测各类新闻的趋势,并将结果利用可视化技术进行展示。
|
设计任务:
通过Python对微博中各大新闻官方微博进行爬取并导入mysql数据库中,使用Python中numpy、matplolib进行散点图拟合和Excel中进行简单线性回归和多元线性回归分析,最后用Python中的numpy、pandas、matplolib等对数据进行分析处理及数据可视化,该作品主要将新闻类的话题进行分类并统计其热度,为研究微博新闻类话题的对社会的影响力提供基础。
|
设计实施步骤和方法:
微博舆情分析和预测技术主要包括网络数据采集、舆情数据清洗、数据分析和预测、数据可视化等关键步骤。
(1) 网络数据采集:通过Python爬虫进行搜集抓取新闻官方微博账号发布过的内容话题;
(2) 舆情数据清洗:对所获取的数据存入数据库中并进行去除噪声数据处理;
(3) 数据分析:对处理后的数据进行分类,按照事实发生状态、事实发生与报道的时间差距、新闻事实的材料组合、新闻发生的地区与影响范围、反映社会生活的内容进行分类;
(4) 舆论预测:将该类中包含的话题用matplotlib绘制成散点图并进行拟合和将数据导入Excel中进行简单线性回归和多元线性回归分析该类话题的基本趋势;
|
设计时间进度及安排:
时间
|
工作内容
|
2022年10月16日-30日
|
制订工作方案,组织学生选题
|
2022年11月1日-12日
|
进入毕业设计各环节
|
2022年11月13日-19日
|
开题报告答辩
|
2022年11月20日-25日
|
毕业设计作品与成果报告撰写
|
2022年12月26日-30日
|
毕业设计预答辩
|
2023年1月1日-4月30日
|
毕业设计与作品制作提高完善阶段
|
2023年5月1日-20日
|
进入毕业设计评阅阶段、组织毕业答辩工作
|
2023年5月30日
|
毕业设计总结阶段
|
|
设计成果表现形式:
毕业设计成果报告表、毕业论文及答辩PPT。
|
指导老师签字:
年 月 日
|
教研室
审核意见
|
专业带头人(负责人)签字:
教研室主任签字:
年 月 日
|
学院审批意见
|
学院领导签字:
年 月 日
|
备注:若专业带头人和教研室主任为同一人,则只需要签一次。