一.研究目的及意义
1.1研究目的
随着互联网时代的到来,网络业务也随之产生,并逐渐地取代了传统业务模式。如今人们的很多行为都可以借助网络足不出户的实现,例如交话费、交水电费、购买各种商品。各大购物网站的应运而生,更是颠覆性的改变了人们的日常消费模式,而随着大量店铺和商品的涌入,在给用户带来便利的同时也带来了一些负担,最为典型的就是信息过载。大量的、各式各样的商品和服务不断出现,使用户想要找到自己真正需要和满意的商品变得越来越困难,本来是为了帮助用户节省时间的消费方式却往往使用户花费了更多的时间和精力还是没能找到自己满意的商品。如何更有效的对用户进行个性化推荐成了当前电子商务领域的热点话题。
总的来说,互联网中的电子商务为推荐系统的应用提供了平台,而推荐系统推荐效果的不断提高也促进了电子商务的快速发展[1]。
1.2研究意义
在今天的互联网上,用户每时每刻的行为都会产生大量的数据,据统计,每秒会产生上百万次的查询,千万次的浏览。规模较大的电商企业都会采集用户的行为数据(比如用户访问、用户画像、搜索行为),但是这些企业都不知道采集用户的行为数据与商业数据(如销售额、订单转换)之间有什么联系,如何使这些纷繁复杂的数据产生价值。要想让这些数据真正成为一个公司的家当,及时从中发现实用的价值,那么通过数据分析技术对数据进行挖掘与分析则变得极其重要。
二.国内外研究现状
2.1国外研究现状
二十世纪九十年代,电子商务在国外发展开来,很多人们开始进行网上购物。随着电子商务网站中商品信息数量的剧增,可供人们选择的商品越来越多,这些大量的信息进入用户的视野,对用户造成了一定的困扰。用户如何快速地找到自己感兴趣的商品已经变得尤为重要。在这种时代潮流下,便出现了搜索引擎和推荐系统。
随着Web2.0时代的到来,互联网技术得到了进一步的发展,特别是电商网站大量普及和应用。为了效仿传统购物超市中营销员这一角色,解决如何用机器更精准的向用户推荐商品这一难题,出现了许多著名的推荐算法。协同过滤则属于其中最为成功的算法之一,协同过滤受到了许多学者的关注并不断加以优化,如今已经在很多领域都取得了不错的成果。
亚马逊是最早使用推荐系统的电子商务平台,基于物品的ItemCF算法(协同过滤算法)于1998年正式上线,这一算法将用户推向了一个电子商务领域发展的新高度[2]。个性化推荐算法陆续在各大电子商务网站中得到了应用,展现出了其显著功效。传统的、单一的推荐算法往往存在着冷启动、数据稀疏性、拓展性等问题[3]。随后,一大批优秀的学者开始对其性能进行优化并且开始研究各类推荐算法的结合使用。使用推荐系统已经成为了信息技术企业之间互相竞争的必备工具[4]。
2.2国内研究现状
我国电子商务技术相比国外起步较晚,而对推荐系统的研究更是晚于国外。在国内,豆瓣网是最早开始使用个性化推荐的网站之一,它通过记录客户对于电影、音乐、书籍等的浏览历史和评价,然后分析用户的浏览喜好,从而为用户提供相应的资讯和相似作品的推荐。而提到国内的推荐系统,今日头条无非是其中的佼佼者,其独特的推荐算法能够精准预测用户喜好,极大地提高了用户的使用体验,在短短几年内就吸引了数亿的用户。除此之外,腾讯的QQ看点、淘宝的猜你喜欢、抖音的短视频推荐等都很好的发挥了个性化推荐的作用,且取得了很不错的效果。
目前推荐系统已成为国内学者研究的热点之一,国内研究者在资源数据处理的准确度、智能数据挖掘等涉及到推荐系统的各个方面都取得了丰硕的成果[1]。
西安电子科技大学的孔德卫为了解决了协同过滤算法存在的矩阵稀疏性和可拓展性的问题提出了一种新的混合协同过滤推荐算法[5]。
南京邮电大学的沈鹏和李涛中将协同过滤算法与内容属性过滤的优点结合,提出了一种改进的混合推荐算法[6]。张玉叶教授用Python的序列字典代替了二维数组存放稀疏矩阵,有效提高了算法的效率[7]。
广州大学王敏针对个性化精度的问题,采用K-means算法对协同过滤进行了优化,有效提高了精度[8]。
天津理工大学的石京京等人重新对物品相似度的计算做了定义,加入了物品间联系的计算,进一步提高了推荐的准确率[9]。在推荐系统中,协同过滤因其推荐范围广、算法较为简单、易于实现等优点,受到越来越多学者的关注[10]。
虽然目前和国外相比,我国的研究水平还有很大不足,但是毫无疑问,未来国内推荐系统必将在各个领域大量应用和快速发展。
三.本课题要研究或解决的问题和拟采用的研究手段(途径)
3.1本课题研究的主要内容
本系统利用大数据技术,针对已有的电商行为数据,对其进行分析和可视化,让数据有不同于传统展示方式的丰富呈现,给出更加直观简洁且高效及时的数据可视化结果。引导用户更加高效率的进行决策,对其下一步商业行为进行指导,将数据可视化融合到不同的实际应用场景中,从而做出有效且有用的可视化结果。
实现的功能模块有:基于电子商务大数据领域的数据可视化分析系统设计进行研究,对系统主要模块,后台查询模块及页面数据请求进行设计。设计并开发完成一个智能商务数据的“神策数据系统”。该系统的设计是前后端分离的,并且使用图表的方式实现数据的可视化,提供电商相关数据的分析,从而对商业行为的辅助决策提供有效解决方案。
3.2本课题要解决的问题
本系统主要置于数据的分析模块和数据的可视化模块。数据可视化模块通过HighChart图表对分析好的数据进行展现。实现对电商企业庞大数据的处理与分析,挖掘有商业价值的数据,并用前端可视化网站展现处理的数据,如3D饼状图,条形图,柱形图,梯形图等,这可以让企业很直观地获取到运营的重要信息。
3.3拟采用的研究手段(途径)
本系统主要研究内容如下:
(1)hadoop集群的环境搭建:
去apache官网下载hadoop,在VMware上搭建4台虚拟机,其中一台做 namenode,其他三台做datanode。
(2)登录与注册模块:
使用简单的B/S体系结构,创建多个用户去购买商品,记录下来作为离线数据,以后用来做数据挖掘。
(3)推荐算法模块:
利用所学的数学知识,要求商品与商品之间的亲密度,我们可以用欧氏距离也可以用共线矩阵,在这里我选用的是共线矩阵。
(4)系统界面的设计:
我准备用html做几个页面出来,然后用相对路径把它们联系起来,然后把它们与数据库相连,读数据库。
(5)数据库模块:
我准备使用mysql数据库,因为它是免费的,而且非常好用,还有客户端支持。
四.工作进度安排
|
设计(论文)各阶段名称
|
起 止 日 期
|
1
|
查阅资料,撰写开题报告,完成开题答辩
|
2021年 12月 30日~2022年 1月 10日
|
2
|
智能商务平台的功能需求分析
|
2022年1月11日~2022年1月31日
|
3
|
系统架构和数据库以及表的完成与实现
|
2022年2月1日~2022年2月28日
|
4
|
web设计的整体设计
|
2022年3月1日~2022年3月31日
|
5
|
推荐算法设计及功能测试的修改
|
2022年4月1日~2022年4月30日
|
6
|
完成毕业论文的书写以及答辩工作
|
2022年5月1日~2022年6月11日
|
五.参考文献
[1] 张恒玮. 基于协同过滤技术的电子商务推荐系统的研究与实现[D]. 华北电力大学, 2012.
[2] 颜颖. 个性化推荐系统在电子商务中的应用研究[J]. 太原城市职业技术学院学报, 2019(11):35-37.
[3] 吴汉. 基于混合过滤的推荐算法研究及其应用[D]. 南京邮电大学, 2018.
[4] 董文远. 基于混合过滤的推荐系统开发研究[D]. 吉林大学, 2011.
[5] 孔德卫. 基于协同过滤混合推荐系统的研究与实现[D]. 西安电子科技大学, 2015.
[6] 沈鹏, 李涛. 混合协同过滤算法在推荐系统中的应用[J]. 计算机技术与发展, 2019,29(03):69-71.
[7] 张玉叶, 宿超. 基于Python的协同过滤算法的设计与实现[J]. 山东广播电视大学学报, 2019(02):82-85.
[8] 王敏. 基于协同过滤的电子商务个性化推荐系统设计和实现[D]. 广州大学, 2019.
[9] 石京京, 肖迎元, 郑文广. 改进的基于物品的协同过滤推荐算法[J]. 天津理工大学学报, 2019,35(01):32-36.
[10] 项阳,徐浩楠,赵显基.近十年协同过滤研究热点和前沿分析[J].产业创新研究,2020(06):86-87.
[11] Goldberg D, Nichols D A, Oki B M, et al. Using collaborative filtering to
Weave an information TAPESTRY[J]. Communications of the Acm, 1992,35(12):61-70.
[12] RESNICK P. GroupLens : An open architecture for collaborative filtering of netnews[J]. Proc Cscw, 1994.
[13] Resnick P, Iacovou N, Suchak M, et al. GroupLens: An Open Architecture for Collaborative Filtering of Netnews[J]. 1994.
[14] 吴步祺. 电子商务推荐系统中协同过滤技术的研究[D]. 南昌大学, 2010.
[15] 张琳. 电子商务网站个性化推荐的多样性对推荐效果的影响研究[D]. 北京邮电大学, 2017.
[16] 布海乔, 高媛.基于协同过滤技术的电子商务推荐系统[J]. 电子制作, 2013(17):91.
|