设计 任务书 文档 开题 答辩 说明书 格式 模板 外文 翻译 范文 资料 作品 文献 课程 实习 指导 调研 下载 网络教育 计算机 网站 网页 小程序 商城 购物 订餐 电影 安卓 Android Html Html5 SSM SSH Python 爬虫 大数据 管理系统 图书 校园网 考试 选题 网络安全 推荐系统 机械 模具 夹具 自动化 数控 车床 汽车 故障 诊断 电机 建模 机械手 去壳机 千斤顶 变速器 减速器 图纸 电气 变电站 电子 Stm32 单片机 物联网 监控 密码锁 Plc 组态 控制 智能 Matlab 土木 建筑 结构 框架 教学楼 住宅楼 造价 施工 办公楼 给水 排水 桥梁 刚构桥 水利 重力坝 水库 采矿 环境 化工 固废 工厂 视觉传达 室内设计 产品设计 电子商务 物流 盈利 案例 分析 评估 报告 营销 报销 会计
 首 页 机械毕业设计 电子电气毕业设计 计算机毕业设计 土木工程毕业设计 视觉传达毕业设计 理工论文 文科论文 毕设资料 帮助中心 设计流程 
垫片
您现在所在的位置:首页 >>毕设资料 >> 文章内容
                 
垫片
   我们提供全套毕业设计和毕业论文服务,联系微信号:biyezuopin QQ:2922748026   
基于Hadoop的电商用户分析系统设计与实现 开题报告
文章来源:www.biyezuopin.vip   发布者:毕业作品网站  

一、选题的背景和意义

(一)选题背景

互联网电子商务的商业模式一般来分为线上拉客、线下消费以及线上拉客人、线上消费,其核心理念就是通过在线的营销互动,将潜在的消费用户群体引导到电子商务网站上,同时整合在线购物、在线支付功能,完成整个线上线下消费闭环,这样的消费模式,依靠线上的推荐引擎来拉动线下的消费,并且提高商户参与度,增加用户体验,产生的价值十分巨大[1]。在各种应用中分析转化率和访问者数量,或者本网站成员使用哪些浏览器等,根据我们分析的数据,可以进行有针对性的广告销售,让我们做很多事情,比如用户行为画像。

同时,各电商网站可能会根据本网站的支付订单数和支付成功的数量进行业务分析,这对于提高点击量、浏览量和支付成功率至关重要[2]。电商网站这些用户产生的信息然后不可避免地被我们的日志收集系统收集,然后存储在最终的收集中。非常准确,反之亦然。换句话说,电子商务网站应该设计一种能够提供良好用户体验的产品,帮助用户准确找到他们想要购买的东西,并提高用户和广告的转化率[3]。

(二)选题目的和意义

在现在这个信息的时代中生活的我们,每天每个人都会在网上产生大量的点击流数据,用户的各种行为动作信息被网站的web服务器的日志系统所收集,这些信息在我们这个信息时代就是流动的黄金,谁掌握的用户行为信息多,谁掌握的用户信息维度广,谁就是这个大数据时代的先锋领头者,现在谁都想掌握大量的数据信息,那么现在我开发研究的这个系统就是来通过各种途径来收集到用户的信息,然后通过这个我所研究的系统处理,把我们需要的用户行为信息收集到然后把这些信息存储起来,这样我们就会有很大量的信息,那么在这个信息时代我们就有了我们的核心的竞争力,我们就可以在这个大数据的时代下占有自己的一席之地[4-7]。

所以我所研究的这个电商用户行为分析系统可以很好的收集到原始数据,并且处理这些收集来的这些原始数据,把这些数据中有用的部分我们清洗提取处理,做成我们需要的用户行为的这种指标信息,然后给我分析,也可以给后面做用户画像,广告的精准投放等一些项目做一些基础的数据提供者,所以我的这个系统在当前这个时代是很有研究价值的[8-10]。

(三)国内外研究现状和发展趋势

目前越来愈多的企业开始搭建各自电子商务平台,国内包括顺丰、苏宁等都较早的从线下投入到线上平台建设,而在用户行为分析系统方面由于不同的企业有其数据的特殊性和敏感性,虽然包括谷歌、百度等都提供了用户行为分析工具及插件,但也通常作为网站流量数据分析,对于网站内部用户分析还是需要通过内部搭建系统,因此提供一套能够结合电子商务平台自身业务的用户行为分析系统是十分有必要的[11]。

1.国内研究现状

2012年开始,我国互联网电商企业进入爆发增长期,行业竞争十分激烈,各企业也纷纷开始对用户行为数据的分析和研究,但仍处于初步阶段。分析方法主要都是通过记录用户查询、搜索、点击等信息,通过统计分析,实现网站优化、预测网络行为以及保障网络安全等[12]。目前国内较为主流的思想是使用Hadoop平台作为用户数据存储的平台,在MapReduce计算框架中部署用户行为分析模型,对用户数据进行离线计算[13]。

该系统的弱点:对离线计算和实时计算没有做到有效融合,网站整体统计数据与单个用户数据没有产生有价值的关联。

局限于对网络在线数据的处理,对用户实际行为日志的分析较少,不能产生精准的用户行为分析预测。不能做到分析结果的实时反馈,往往采用T+1或T+n的形式输出报告[14]。

就如国内电子商务巨头淘宝内部的用户行为分析系统,天梯系统,在发布初期的用户属性分析是通过每天在其云梯系统上定时运行的数据分析任务来完成的,分析完成以后将分析结果导入到在线存储中,淘宝的搜索引擎通过查询在线存储中的数据获取用户属性来为用户返回个性化的结果,而目前淘宝己经开发了实时分析系统Time Tunnel实现了实时分析。由此可见,任何互联网电商无论是淘宝还是新兴电商对于用户行为分析的系统的搭建是非常迫切的[15]。

2.国外研究现状

国外对用户行为数据分析的研究起步于20世纪80年代,主要是通过研究用户的行为特征和规律来实现用户分析和网站优化。现在,在国外,用户行为分析己经可以通过对特定人群的行为特征分析,实现对网站和用户的精准聚合和分类,从而完成对网络体系的资源分配的优化[16]。

在电子商务市场中,亚马逊(Amazon.com)被公认为世界的领导者。它的成功并非偶然。亚马逊有大量有特色的购物体验。其中就有基于大数据上的用户行为分析。亚马逊也是最早实现购物推荐引擎的公司[17]。推荐引擎便是一个典型的案例。特别是实时的购物推荐体验,能够极大的增加客户的粘度。更能更快的产生收益。消费者在Amazon(亚马逊)购物时,页面点击行为都会被后台采集。Amazon根据这些数据,进行用户画像,勾画用户的特征轮廓和需求,为精准营销提供依据[18]。Twitter也发布新开发的数据实时分析平台Heron。每天在Twine:上处理着数十亿的事件。分布式流系统Storm也正是Twine:公司研发出来的[19]。

国外在大数据实时分析处理上还是处于领先地位的。也代表了未来大数据的发展趋势。引领着大数据技术潮流。

二、研究的基本内容和拟解决的主要问题

(一)研究基本内容

电商用户行为分析系统需要对电商网站的用户行模型进行分析,分析系统的实行性和稳定性是本课题的重要目标。本文旨在综合分析用户行为模型的特点以实时系统解决方案的基础上,设计并研发一套基于Hadoop的电商实时用户行为分析系统,并在实际的电商网站中进行使用。

(二)拟解决的主要问题

本课题主要解决:对电商网站中的用户行为进行分析和研究;分析用户行为分析系统的应用场景并针对实际的应用场景设计一套基于Hadoop的实时用户行为分析系统;开发JAVAEE框架下的实时用户行为分析系统;将实时用户行为分析系统在电商网站中进行投入使用。

三、研究方法及措施

本次毕业设计的课题是基于Hadoop的电商用户用户行为的分析系统,那么研究的方向就是大数据中的Hadoop方向,在我的课题中我主要研究的方向是数据的采集来源,通过Flume埋点来采集日志信息,或者通过Nginx反向代理服务器来收集日志信息,来采集到我们需要的用户浏览网页的信息,然后就是研究的大数据的存储问题。

本次设计用的Hadoop这个框架里面中的HDFS的一个重要的(分布式文件存储系统)来存储大量有需要用到的数据,它有一个很大的好处就是,存储的数据很安全,不会丢失,然后重点的就是数据的清洗和分析,主要用的是hive和HBase两种数据库来存储分析数据的,然后用Map Reduce计算数据模型来将原始数据清洗成需要的用户行为记录存储到Hive和HBase中让它们可以分析数据,然后前端的展示我用Java的SSM三大框架,加上前端的一个好看方便简洁的大数据的展示框架ECharts框架,完成本次的毕业设计内容。

四、研究工作的步骤、进度

1. 2021年12月28日前下设计任务书。

2. 2022年1月11日前完成开题报告并提交开题报告给指导教师审阅、批复。

3. 2022年1月12日~2022年4月19日(寒假+第8学期1~8周)系统设计,撰写论文。

其间:

(1)毕业设计的开题答辩在第8学期第1周;

(2)毕业设计的期中检查在第8学期第5周;

(3)2022年4月13日~2022年4月19日(第8学期第8周)指导教师评阅论文,学生修改论文;

4. 2022年4月20日~2022年5月3日(第8学期第9~10周)答辩小组内交换评阅论文,学生制作PPT进行答辩准备。

5. 2022年5月12日(第8学期第11周周日)前进行公开答辩和普通毕业答辩。

6. 2022年5月24日(第8学期第13周周五)前进行二次答辩。

五、主要参考文献(其中外文文献不少于2篇)

[1] 陈伟. 基于Hadoop的电商用户行为分析系统设计与实现[J]. 宿州教育学院学报, 2021, 24(3):6.

[2] 赵东昕. 基于Hadoop的电商实时用户行为分析系统[D]. 上海交通大学, 2016.

[3] 王电轻. 基于Hadoop的网站用户行为分析系统设计与实现[D]. 中国科学院大学, 2016.

[4] 郝增勇. 基于Hadoop用户行为分析系统设计与实现[D]. 北京交通大学, 2014.

[5] 王颖颖. 基于Hadoop的用户行为分析系统的设计与实现[D]. 北京工业大学.

[6] 李文海, 许舒人. 基于Hadoop的电子商务推荐系统的设计与实现[J].  2022(1).

[7] 林昆山. 基于Hadoop的电商离线数据挖掘系统的设计与实现[D]. 湖南大学, 2019.

[8] 郝增勇. 基于Hadoop用户行为分析系统设计与实现[D]. 北京交通大学.

[9] 张冬梅. 基于Hadoop的电商日志分析系统的设计[J].  2021.

[10] 严春景, 谢胜利. 基于Hadoop平台的用户网络行为系统设计[J]. 电脑知识与技术:学术版, 2016(1X):2.

[11] 魏斐翡. ECLHadoop:基于Hadoop的有效电子商务物流大数据处理策略[J]. 计算机工程与科学, 2013, 035(010):65-71.

[12] 韩岩. 基于Hadoop平台对交易记录的数据分析系统设计与实现[J].  2015.

[13] 严春景. 基于Hadoop平台和查询日志的用户行为分析系统设计与实现[D]. 广东工业大学, 2016.

[14] 刘媛媛. 基于Mahout的电子商务个性化推荐系统的设计与实现[D]. 中国科学院大学(中国科学院工程管理与信息技术学院).

[15] 李子森. 基于电信DPI数据的电商用户行为分析. 北京邮电大学.

[16] Wen-Hai L I,Shu-Ren X U.Design and implementation of recommendation system for E-commerce on Hadoop[J].Computer Engineering and Design, 2014.

[17 Guan J,Su Y,Xu C,et al.Design and Implementation of Network User Behaviors Analysis Based on Hadoop for Big Data[C]//International Conference on Applications and Techniques in Information Security. Springer Berlin Heidelberg, 2014.

[18] Yao D,Y Chen. Design and Implementation of Log Data Analysis Management System Based on Hadoop[J]. 2020, 2(2):7.

[19] Cui X . Design and Implementation of Data Analysis System Based on Hadoop[C]//2019 7th International Conference on Machinery, Materials and Computing Technology (ICMMCT 2019). 2019.

六、指导教师评语:

签字:                 年      月      日

  全套毕业设计论文现成成品资料请咨询微信号:biyezuopin QQ:2922748026     返回首页 如转载请注明来源于www.biyezuopin.vip  

                 

打印本页 | 关闭窗口
本类最新文章
台式数控等离子切割机机械结构设计 台式数控等离子切割机机械结构设计 台式数控等离子切割机机械结构设计
基于PLC的罐装加工过程为全自动 基于Python电影推荐系统设计 基于西门子S7-200PLC四层
| 关于我们 | 友情链接 | 毕业设计招聘 |

Email:biyeshejiba@163.com 微信号:biyezuopin QQ:2922748026  
本站毕业设计毕业论文资料均属原创者所有,仅供学习交流之用,请勿转载并做其他非法用途.如有侵犯您的版权有损您的利益,请联系我们会立即改正或删除有关内容!