1.1课题名称
重庆地区美团外卖店铺分析系统的设计与实现
1.2课题来源和选题依据
本课题来源于生产实际,本系统基于美团外卖店铺自营的商业模式,并且在校期间有做过类似于基于Hadoop大数据平台下的用户喜好推荐分析而进行课题研究,重庆地区美团外卖店铺分析系统解决的是消费者选择到自己合意的商品,同时扩大了外卖店铺的知名度和提高外卖销量,被更多的用户所选择,而不仅仅局限于以往的大海捞针。
1.3选题的背景
近年来,随着我国经济与科技的飞速发展,人们的生活水平正在不断提高。人们在追求高质量的生活质量的同时,也试图寻求一种更加方便快捷的生活方式,网上订餐方式应运而生。网上订餐方式对我们来说并不陌生,可以说是与我们的生活息息相关。随着网上订餐方式给我们的工作与学习生活带来了巨大的便利,这种订餐方式也得到了越来越多人的认可和接受。随着时间推移,人们对餐外卖饮的要求也越来越高,不仅要求解决温饱,更要追求味觉的享受。针对消费者这一需求,同时使消费者更加清晰明了的掌握重庆所在外卖的信息情况,在基于大量数据的前提下,对重庆地区的外卖信息数据进行分类的处理,并以图像化的结果展示在用户面前。我们依次通过理论研究、算法设计、系统实现以及实验验证等阶段,最终来完成该查询系统。该系统可根据用户的查询行为,查询处所需要的外卖数据;希望在总体误差的约束内获得近似的查询结果,以权衡查询结果的准确性和误差率。同时在信息化的今天,数据信息已经成为了这个时代发展的重要标志之一,外卖商家等数据在日常订餐生活中不可缺少,本系统就是为了让用户体验到查看外卖商品及数据的方便性和直观性。
|
2.1国内研究现状
人民收入水平的上升,各行各业都取得了蓬勃发展,而其中最为引起人民关注的,就是饮食行业行业的发展。对于“吃”这个话题,可是从千年前的古代就铭刻在每个人骨髓深处。餐饮行业的发展形势一片大好,国内的市场份额也是逐年增长且越来越迅速,特别是外卖的发展也越来越快。根据近年来的国家统计局统计数据显示,2018全年中国餐饮累计收入突破4万亿元,接近4.22万亿元,同比增长达到9.5%。从2015年至2018年,全年3万亿到4.22万亿的突破,仅用了3年时间,破万亿时间越来越短,而这两年的发展,就更加迅速了。
由于餐饮行业的快速发展,在外就餐的性价比增高,消费者自己开火做饭的机会越来越少,更多的是选择在外就餐。O2O(Online To Offline)模式是当今互联网行业发展的一种趋势,在互联网+、转型升级等热词下,相应的诞生了餐饮外卖市场。将传统餐饮业融入到互联网的浪潮中,基本实现了线上与线下的无缝对接。[1]这一新模式的出现意味着传统餐饮业的升级转型已经不可逆转。随着互联网的进步,以及智能手机的普及,外卖成为了餐饮业中的新贵。中国外卖市场经过几年的迅速发展,外卖产业链逐步完善,餐饮外卖市场逐步成熟。iiMedia Research(艾媒咨询)数据显示,2018年中国外卖用户规模较2017年增长17.4%,达到3.58亿人,2018年外卖市场规模突破2400亿元大关,其市场发展已进入稳定增长期。
外卖行业蓬勃发展的良好局面之下,以往所忽略的一些问题也就会随之被放大。由于其不同于传统餐饮行业,因此传统餐饮领域中影响商家销量的因素不能很好地解释外卖行业商家销量影响因素,所以作为外卖平台商家仍迫切想了解选购外卖流程中影响消费者做出取舍选择的关键因素,以便制定更为有效的营销对策[2]。然而线上消费往往存在信息不对称问题,对商家而言,食品的种类、定价、配送时间等多种因素都将影响消费者的购买意愿,从而影响店铺的销量。对消费者而言,面对数量繁多的外卖商家,如果不能充分了解商家信息,很难做出满意的购买决策[3]。而不同的人群在选择外卖时的侧重点也不同,方便、可以足不出户用餐是他们选择外卖订餐的最主要原因,价格便宜、有促销活动也是重要的考虑因素。传单和朋友推荐是他们获取外卖平台信息的主要渠道,美团外卖和饿了么是他们目前最常使用的外卖平台,简单直接的降价促销最受欢迎[4]。在《基于K-MEANS聚类的电商店铺经营策略分析》一文中指出,电商店铺商品价格、相关商品数和月销量等数据的挖掘中,建立基于K-MEANS的店铺聚类研究模型,深入分析电商店铺的经营策略和效果[5]。同时罗琴在她的餐饮外卖企业顾客满意度影响因素的研究中将外卖企业顾客满意度的七个市场营销的影响因素:信息可靠性、网站服务水平、网站设计、在线支付、商品营销、商家服务水平、顾客合法权益维护[6]。基于此,本论文选取重庆市线上市场交易额最大的美团外卖平台,采用python网络爬虫获取重庆地区美团外卖商家信息,在基于大量数据的前提下,对重庆地区的外卖信息数据进行分类的处理,并以图像化的结果展示在用户面前,为商家和消费者提供决策参考。
2.2 国外研究现状
相较于国内,国外对于电商或者外卖的供应点并不多,大多是品牌自营外卖,如德克士、肯德基等,因此关于外卖线上预订等需求也较少,通常是线下电话预订下单。相对于国内,西方国家更加关注对于数据和技术的使用,可视化技术正受到许多领域的关注[7]。在2020年11月的一篇关于数据挖掘与分布式计算的研究文献中介绍道:“虽然数据挖掘揭示了金融模型,但它也日益对隐私构成威胁。因此,如何在高效的挖掘过程中防止隐私泄露对数据挖掘技术提出了新的挑战[8]。Nguyen Thi Dieu Anh在《A New Approach Item Rating Data Mining on the Recommendation System》其中基于协同过滤算法的推荐中提到利用用户的习惯、行为和项目评分来推荐符合客户需求的产品。因此,分析用户评分数据是提高推荐系统效率的重要因素之一[9]。随着现代科学技术的发展,利用数据挖掘技术对消费者的消费行为进行分析已成为可能[10]。业内学者普遍认为,可视化不仅可以在大量数据中显示基本信息,而且可以驱动复杂的分析。大数据分析和发现为计算机图形和可视化社区提供了新的研究机会。这些理论与技术与作者的思想不谋而合,即为了解决当前外卖商家和消费者对外卖选择最优化的问题。
综上所述,重庆地区美团外卖店铺分析完美迎合了市场需求,这是一个软件系统开发的立足之本,目前国内外市场外卖订单的需求量急剧增长,更要求其质量、品类、价格各个方面,而重庆地区美团外卖店铺分析系统正是在安全、价格、预览等各方面提供了便利,通过外卖商家店铺分析,促进外卖商家之间的良性竞争。
2.3发展趋势
社会的发展、科技的进步以及互联网技术应用的不断拓展,互联网早已成为人们日常生活的一部分。其中"互联网+外卖"由于其特有的方便快捷性而被人们所认同并接受,"互联网+"给外卖行业带来了很大发展契机[11]。随着外卖市场的越来越正规化,影响外卖商家销量与评价的不再只是价格优势,消费者更加看重外卖口味与性价比。在哈尔滨工业大学的一篇专门研究外卖平台商家销量的影响因素的研究中指出,在价格促销、口碑评分、品牌对商家销量的直接作用分析中,三者均可对商家销量产生显著正向影响,从总体上看,品牌对商家销量的影响程度最大;在价格促销、口碑评分、品牌任意两者交互作用的分析中,任意两个因素的交互作用均可对商家销量产生显著正向影响[12]。一切都显示着一方面外卖商家们必须跟随时代潮流,改变现有的营销侧策略,增强自己的综合竞争力。重庆地区美团外卖店铺分析系统的实现,可以充分解决消费者的选择难的问题和商家不知道如何把握消费者消费趋势的难题。具有实际意义。因此重庆地区美团外卖店铺分析系统必将有长远的发展前景。
|
3.1 课题目的
随着外卖行业蓬勃发展,为了满足商家需要及时了解消费者的消费需求,以及消费者能够找到直观了解外卖商品的信息并且能更好更准确的为顾客服务,因此开发一个完善的重庆地区美团外卖店铺分析系统十分必要。本课题的主要目的是开发一个实用的完善的重庆地区美团外卖店铺分析系统,以满足广大消费者和商家的需要。
3.2 课题意义
(1)解决了商家渴望了解何种因素影响自家商品销量的问题。
通过调查法、案例分析法、数据归纳法,分析互联网餐饮外卖商家的现有数据。得出当前影响消费者对于外卖选择的因素,分清哪些是正面影响继续保持,哪些是负面影响迅速改进。使商家明白消费者的需求,从中设计出有效的销售策略,增强店铺综合竞争力。
(2)解决了消费者面临众多外卖商品不知如何选择的问题。
消费者对于外卖的选择不再是大海捞针式的海选,更加直观的了解到不同商家的特点以及其他消费者对商家的评价,从而做出自己的决断。
|
4.1 研究任务
(1)完成重庆地区美团外卖店铺分析系统的设计与开发。
(2)完成毕业设计报告撰写。
4.2 工作内容
按照软件工程开发规范进行课题的设计、实现、测试和部署发布,编写对应的设计和测试文档、创建课题的运行环境,完成课题所需的数据库创建和源代码编写。
①项目前期阶段
美团外卖作为现阶段外卖市场的龙头老大,其数据也具有普遍代表意义。确定数据来源为美团外卖重庆地区店铺、用户评价、用户好评率、商品销量、商品种类、数据。
②数据采集阶段
通过python的scrapy框架对美团重庆地区店铺、用户评价、评论等数据的爬取,考虑到所爬取数据内容复杂且数据为json格式,初始阶段爬取到的数据采用MongoDB数据库进行存储。
③数据清洗阶段
对所采集的大量数据进行数据清洗、集成、规约等处理,通过填补遗漏数据、消除异常数据、平滑噪声数据,以及纠正不一致数据,去掉数据中的噪音、填充空值、丢失值和处理不一致数据,确保数据的完整性、唯一性、权威性、合法性、一致性,经过预处理之后的、具有一定价值的数据训着存储在MySQL数据库中。
④数据分析阶段
1.基于Numpy、Pands函数库使用统计学分析方法,分析并展示重庆地区用户外卖种类喜好分布、商家销量排名。以及时间和空间维度上的外卖销量数据。
2.基于C4.5算法的消费者选择模型构建。以商家销售量和消费者好评率为指标,将K-means聚类结果划分为两类。推荐商家、不推荐商家将其作为分类属性基于C4.5算法建立决策树模型得到配送费、店铺评分和好评率是影响是否推荐消费者选择商家的主要因素然后从决策树中提取分类规则。
3.基于K-means聚类的店铺分类模型构建。初步选取影响店铺分类的主要指标使用主成分分析将其降维然后使用K-means聚类算法得到外卖商家分类。并使用ROC曲线、查准率、精准率方法对算法模型进行评估。
⑤数据展示阶段
基于Django搭建网站框架,图形化展示外卖店铺的特点以及用户的喜好情况
4.3研究方法及技术路线
(1)文献调研法,通过知网、万方、维普等文献网站查询本课题相关的文献,认真阅读并归纳总结,得出问题解决研究方案。
(2)比较分析法,在确定店铺腿甲算法时,通过对多累算法的分析和运算,选出适合商家和消费者推荐的算法或模型。
(3)数据分析法,通过收集美团商家数据,分析其特点,从而找到适合的模型或算法。
(4)实验分析法,通过大量的实验计算,验证相关算法,并以此为基础,完成原型系统的开发实现。
|
计算机:一台能够支持K-means聚类模型训练的计算机,内存32G,I5CPU
开发环境:jdk 10.0 , python 3.7 , tomcat 9.0 , mysql 5.7.23
数据需求:近年来美团外卖重庆地区的店铺、用户评价等数据。
|
[1] 李洪磊,姜珊.O2O模式下的“餐饮外卖”对餐饮业的影响[J].电子商务,2017(07):1+67.
[2] 温玥. 外卖平台商家销量的影响因素研究[D].哈尔滨工业大学,2020.
[3] 杨文雅. 基于数据挖掘的美团外卖商家评分研究[D].山东师范大学,2020.
[4] Zhao Yuhao. Research on wireless distributed financial risk data stream mining based on dual privacy protection. 2020, 2020(1)
[5] 夏名首,刘玉林.基于K-MEANS聚类的电商店铺经营策略分析[J].商业经济研究,2017(05):52-54.
[6]王丹. 餐饮外卖O2O物流服务质量顾客满意度影响因素实证研究[D].西安电子科技大学,2019.
[7] 박선희, 김정호, 유현배. Implementation of public data contents using Big data Visualization technology - Map visualization technique -. 2017, 18(7):1427-1434.
[8] 罗琴.餐饮外卖企业顾客满意度影响因素的研究——以美团外卖为例[J].商场现代化,2016(28):30-31.
[9] Nguyen Thi Dieu Anh, Vu Thanh Nguyen, Le Tuan Dinh. A New Approach Item Rating Data Mining on the Recommendation System. 2020, 2(1)
[10] 徐治平.基于数据挖掘的零售企业营销策略分析[J].中国商论,2017(05):6-7.
[11] 敬小玲.“互联网+”背景下外卖行业发展分析[J].市场研究,2018(01):10-12.
[12] 杜春娥.O2O模式下餐饮外卖市场大学生消费群分析——基于河北师范大学的实证研究[J].新闻知识,2015(04):23-24+27.
|