4.1 研究任务
(1)美国男子职业篮球比赛数据分析与展示的设计与开发。
(2)完成毕业设计报告撰写。
4.2 工作内容
完成项目的需求分析、系统设计、测试、部署等开发过程,采用Django、机器学习、Hadoop大数据分析技术和Pycharm来实现。
通过爬虫对http://www.stat-nba.com/网站的爬取,获取美国男子职业篮球比赛数据(下简称NBA), 美国男子职业篮球比赛数据包括:比赛信息、球员信息、教练信息。比赛信息包括:比赛球队名称、比赛日期、比赛比分、每支球队每节得分、每支球队每个球员的表现(本场得分、投篮命中率、篮板数、抢断数)、每支球队是否为主客场、每支球队本场的主教练。球员信息包括:球员中文译名、球员英文名、球员出生日期、球员身高、球员体重、球员出生地区、球员生涯表现(生涯得分、生涯篮板、生涯抢断、生涯出场数、生涯首发数)、球员生涯荣誉。教练信息:教练中文译名、教练英文名、教练执教时常、教练执教胜率。爬取以json格式保存,最后统一保存到数据库。
由Hadoop生态圈中的spark,通过对球员数据进行分析,得出球员的三维图(包括球员进攻得分、球员防守得分、球员组织得分),通过三维图,得出球员的总得分。由三维图以及总得分得,通过K-means算法得出球员是那个类型的球员。通过对教练数据的分析得出教练的三维图(包括球队进攻得分、球队防守得分、球队传球得分),通过三维图,得出教练的总得分。由三维图以及总得分得,通过K-means算法得出教练是那种风格的教练。由教练得分、球员得分、球员是否首发、球队历史战绩,通过线性回归算法预测两支球队的胜率分别为多少。
数据展示本系统采用Django框架,前端通过Html+JavaScript实现数据的传输以及展示。后台由Django实现数据的传输处理。数据库将会采用MYSQL或者HBASE。
本系统将会有两个角色实现:用户以及管理员,用户可以查询:球员数据、球员评分、球员三维图、教练数据、教练三维图、教练评分、球队历史数据、球队历史评分等等。管理员负责对用户和数据进行管理,对整体网站进行维护。
本系统是通过对美国男子职业篮球比赛历史数据得采集,采用Hadoop生态圈中的Spark对数据进行分析,通过其分析数据采用机器学习的K-means和线性回归算法对数据进行合理的分析和预测。得到的最终结果将通过Django+Html+JavaScript的方式到前端展示。
(1)项目的主要功能
①系统基础信息管理。
如:角色管理、用户管理、权限管理。
②用户信息管理。
如:添加用户,用户信息维护。
③蛋糕信息管理。
如:添加蛋糕,蛋糕信息维护。
④店铺管理。
如:添加店铺,店铺信息维护。
⑤预订交易单管理。
如:顾客对选定的蛋糕进行预订,付款等;
⑥系统统计分析。
如:每日或每周、月等的交易额等信息。
(2)设计报告大纲目录
摘要
1 绪论
1.1 研究目的及意义
1.2 国内外研究现状
1.3 论文的组织结构
1.4 小结
2 关键技术
2.1 Spring
2.2 SpringMVC
2.3 MyBatis
2.4 MySQL
2.5 Tomcat
2.4 小结
3 需求分析
3.1 业务建模
3.2 系统角色分析
3.3 用例图
3.4 非功能性需求
3.5 小结
4 系统分析与设计
4.1 系统架构
4.2 系统功能设计
4.3 数据库设计
4.4 小结
5 系统实现
5.1系统实现概述
5.2 功能模块实现
5.3 小结
6 系统测试
7 系统部署
8 总结与展望
致谢
参考文献
4.3拟解决的重点和难点
重点:预订交易单管理、蛋糕信息展示、系统统计分析。
难点:预订交易单管理。
4.4研究方法及技术路线
(1)文献调研法,通过知网、万方、维普等文献网站查询本课题相关的文献,认真阅读并归纳总结,得出问题解决研究方案。
(2)实践研究法,以软件工程理论为导向,实践项目开发,其思路及方法见图1所示。
图1 研究思路
4.5 工作计划
2020年11月-2020年12月:毕业设计开题,完成文献资料查阅,制定开发技术路线。
2020年12月-2021年01月:开展业务调研,完成项目需求分析、系统设计,系统主体功能实现。
2021年01月-2021年02月:完成系统的实现与测试。
2021年01月-2021年03月:撰写毕业设计报告,完成初稿。
2021年04月-2021年05月:完成毕业设计报告终稿,参与答辩。
|
[1]张欣 ,张雄.众教头畅谈新赛季——'96—'97赛季NBA形势分析(一)[J].篮球,1996(11):8-23.
[2]张伟建,邓飞.中国男子篮球甲级联赛(CBA).职业联赛(CNBA)和美国NBA联赛的比较研究[J].体育学刊,1998(03):96-97.
[3]蒋雪辰,左小五,陈胜,沈昱明.基于因子分析和K-Means算法对NBA得分后卫的功能性分析[J].体育研究与教育,2020,35(05):73-79.
[4]王翔宇,高扬,耿迪,王晓昀,杨铃春.NBA球员季后赛生涯总得分影响因素与回归分析——基于1948—2017年NBA季后赛面板数据[J].内江师范学院学报,2020,35(06):101-105.
[5]任昕.基于机器学习的NBA常规赛MVP投票分析与预测[J].竞争情报,2020,16(01):9-23.
[6]Inderpal Bhandari,Edward Colet,Jennifer Parker,Zachary Pines,Rajiv Pratap,Krishnakumar Ramanujam. Advanced Scout: Data Mining and Knowledge Discovery in NBA Data[J]. Data Mining and Knowledge Discovery,1997,1(1).
[7]Brad R. Humphreys,Candon Johnson. The Effect of Superstars on Game Attendance: Evidence From the NBA[J]. Journal of Sports Economics,2020,21(2).
[8]Justin Ehrlich,Shane Sanders,Christopher J. Boudreaux. The relative wages of offense and defense in the NBA: a setting for win-maximization arbitrage?[J]. Journal of Quantitative Analysis in Sports,2019,15(3).
[9]Song Yan,Siyuan Meng,Qiwei Liu,Jing Li. Design and Implementation of NBA Playoff Prediction Method Based on ELO Algorithm and Graph Database[J]. Journal of Computer and Communications,2019,07(11).
[10]Zach Branson,Maxime Rischard,Luke Bornn,Luke W. Miratrix. A nonparametric Bayesian methodology for regression discontinuity designs[J]. Journal of Statistical Planning and Inference,2019,202.
|