选题来源:
根据校内指导教师与企业导师的综合意见并结合实训课程内容与行业需求,确定本题目。
国内外研究现状及意义:
一.国外研究现状:
国外的二手车市场已经进入成熟阶段。综观美、英、德、日等发达国家的二手车市场,国家法规的政策导向和新旧车市场的协调发展。日本,其二手车行业在其本国来看,也是其买卖市场变化中重要的一个影响因素,这其中离不开其本国交易方面的体制特点,其不同地域可进行交叉交易,形成一张网,流通速度较快,行业发展前景较好。美国,拥有庞大的汽车市,近些年,其二手车辆每年的销售量大约是新车的2-3倍。因此,也同样存在众多的二手车购买网站,例如:Car Soup、The car connection、CarsDirectet等。不仅如此,他们在销售的同时也非常注重售后,更加迎合客户的消费需求。其二手车市场前景光明,势必会得到更好的发展。因此,网络平台的销售模式同二手车市场相结合,更加会激发人们的消费欲望。但对于二手车源信息的数据分析,尽管是市场发展已经很成熟的发达国家,他们的设计却几乎是一个等待开发的新领域,并没有像交易网站一样普遍和成熟。因此基于此的数据分析平台的开发将会是未来竞争的一个重要领域,研究符合大众需求的车源信息,才会抓住未来行业发展的先机。
二.国内研究现状:
我国的二手车市场在正在随着我国的政策力度加强的同时变得繁荣起来,不论是在车源发布量方面还是交易量方面,都在呈现上升的趋势变化。2016年,中国二手车交易量为1039万辆,突破千万,2018年,全国二手车市场交易量保持增长,全年二手车累计交易达1382万辆,同比增长11.5%,累计交易金额达8603.57亿元,同比增长6.3%。随着经济建设不断加强,我国二手车行业势必会得到更快的发展。中国汽车市场的进一步发展,新车保有量持续增加,消费者换车需求也不断增加,未来二手车交易量与新车销量的距离将继续减小。二手车市场发展前景广阔,特别是当下我国网民数量很大,其中二手车网民数量也尤为突出。该分析系统的完成将直观地把当下的网络平台中二手车市场的车源信息情况展示出来。对该行业的经营者以及有购车需求的消费者来说,都有很大的帮助。本系统在数据分析和整体系统的完成的结合是通过MySQL数据库实现的,大量数据的分析结果以及系统基础数据均保存在了数据库中,因此系统的正常工作,数据库是不可缺少的一部分。系统的完整实现采用的是Spring Boot核心框架,该框架简洁方便,易操作易执行易维护,其已经是目前软件开发等项目的首选。同时,基于B/S的开发模式使得该分析系统更易操作,对使用该分析系统的用户更友好。
三.课题研究的意义:
我国的二手车市场发展处于初期阶段的现状,由于电子商务快速发展,线上看车购车已经成为一种消费趋势。这样的模式极大地促进了互联网行业的发展,大量的二手车辆信息供客户在线选择。因此,若对大量的车辆数据进行挖掘分析,得出规律,这对今后二手车市场的行业发展有较大的帮助。同时,客户的浏览痕迹,购买记录等行为都有很大的分析潜力,如果可以掌握二手车辆的自身属性规律,那么就可以在对平台进行筛选推荐二手车时提供参考标准。同样,若掌握客户行为规律,可以对不同类型客户的进行精准推荐车辆,把握商机。本文的核心模块是二手车数据分析模块,将对二手车的车龄、价格、磨损程度、已行驶公里数、品牌、车系等属性信息进行分析。其中会看到二手车的车龄、价格、磨损程度等信息主要分布在那个范围,还可以看到车挡类型、品牌、年份款式等占比情况,通过分析大致可以判断出目前网络平台中二手车源信息的情况。这对行业的管理者来说,可以帮助其对接下来的经营管理提供方向参考。对于有购车需求的消费者来说提供参考依据,更方便有效率的进行看车购车。
研究内容:
此次基于大数据二手车数据分析系统会展示二手车源信息数据分析结果。经营者通过该分析,能够快速地发现消费者的需求变化和网络平台中二手车市场发展趋势,从而帮助经营者及时做出正确的决策,提高自身竞争力。本系统具有如下功能:
1、数据采集功能
此功能是获取网络平台中的二手车源信息,即在二手车数据分析系统中用于分析的源数据信息。数据源是数据分析系统的基础支撑,不可缺少的一部分。
2、数据清洗功能
此功能是为数据分析系统过滤有效数据。该功能不仅对重复、缺少字段等数据进行基础清洗,还会从车龄、磨损程度、已行驶公里数等方面进行自定义数据清洗。
3、基于车龄分析功能
此功能针对二手车辆的属性之车龄信息进行分析,包括对二手车辆的车龄分布范围情况、车龄排序统计情况等数据分析结果。
4、基于价格分析功能
此功能针对二手车辆的属性之价格信息进行分析,包括对二手车辆的价格分布范围情况、不同品牌车系车辆均价情况等数据分析结果。
5、基于已行驶公里数分析功能
此功能针对二手车辆的已行驶距离进行分析,包括对二手车辆的已行驶距离分布范围情况、已行驶距离排序统计情况等数据分析结果。
6、基于磨损程度分析功能
此功能针对二手车辆的磨损程度情况进行分析,包括对二手车辆的磨损程度分布范围情况、磨损程度排序统计情况等数据分析结果。
7、基于品牌车系分析功能
此功能针对二手车辆的品牌车系进行分析,包括对二手车辆的不同品牌占比情况、价格总额top5的品牌情况、不同品牌车系受欢迎情况等数据分析结果。
8、数据可视化功能
此功能将对前期数据分析工作过程中产生的分析结果进行图形化展示,将在此功能中看到柱状图、折线图、饼状图等分析结果展示图。
研究思路和方法:
本系统拟采用Python技术对网络平台中发布的二手车源基本信息进行获取。其次将分析数据信息,初期将对数据进行清洗,将过滤不符合研究条件的数据信息。将清洗后的数据信息拟采用spark-数据批处理计算框架进行分析,此部分拟采用scala语言进行代码编写,数据分析结果拟保存至Oracle或MySQL数据库中,为下一步数据可视化做准备。最后将展示数据分析结果,拟采用SpringBoot核心框架整合MyBatis、Thymeleaf等技术进行数据结果展示,展示效果主要以图表为主,拟采用柱状图等。本系统的设计前期将进行充分的需求调研,概要描述等工作,节省开发时间,实现高效开发。
主要参考文献:
[1] 林子雨,赖永炫,陶继平.Spark编程基础[M].北京:人民邮电出版社,2018.
[2] 朱运乔.基于SpringBoot+SSM框架的Web应用系统搭建与实现[J].电脑编程技巧与维护,2019(10).
[3] 黄红梅,张良均.Python数据分析与应用[M].北京.人民邮电出版社,2018.
[4] 杨项坤.互联网+背景下国内二手车市场商业模式创新研究[D].山东:山东师范大学,2019.
|