设计 任务书 文档 开题 答辩 说明书 格式 模板 外文 翻译 范文 资料 作品 文献 课程 实习 指导 调研 下载 网络教育 计算机 网站 网页 小程序 商城 购物 订餐 电影 安卓 Android Html Html5 SSM SSH Python 爬虫 大数据 管理系统 图书 校园网 考试 选题 网络安全 推荐系统 机械 模具 夹具 自动化 数控 车床 汽车 故障 诊断 电机 建模 机械手 去壳机 千斤顶 变速器 减速器 图纸 电气 变电站 电子 Stm32 单片机 物联网 监控 密码锁 Plc 组态 控制 智能 Matlab 土木 建筑 结构 框架 教学楼 住宅楼 造价 施工 办公楼 给水 排水 桥梁 刚构桥 水利 重力坝 水库 采矿 环境 化工 固废 工厂 视觉传达 室内设计 产品设计 电子商务 物流 盈利 案例 分析 评估 报告 营销 报销 会计
 首 页 机械毕业设计 电子电气毕业设计 计算机毕业设计 土木工程毕业设计 视觉传达毕业设计 理工论文 文科论文 毕设资料 帮助中心 设计流程 
垫片
您现在所在的位置:首页 >>计算机毕业设计 >> 文章内容
                 
垫片
   我们提供全套毕业设计和毕业论文服务,联系微信号:biyezuopin QQ:2922748026   
基于python爬取母婴用品评论的数据分析 毕业论文+开题报告+源码及数据分析
文章来源:www.biyezuopin.vip   发布者:毕业作品网站  

摘  要
近年来,随着人们生活品质的不断提高,消费观念亦在不断升级。自2016年国家开放二胎政策以来,母婴市场愈来愈繁荣,母婴商品种类也在不断地增多,人们在进行电商浏览母婴用品时,常常是通过店铺销量和已购买用户的评论进行选购的,面对如此繁多地商品以及网络购物中的不确定性,对大量的评论进行整合和处理,帮助消费者进行客观的判断从而选购到合适的母婴用品是十分有必要的。
对于大量评论的热销母婴商品,消费者如果靠阅读评论得到某母婴商品全面性的分析,工作量极大,耗时长,获取的信息也有限。网络爬虫作为一个自动提取网页的程序,可以高效地从数据库的海量信息中挖掘出有效的信息,大量数据可以得到处理和分析。而爬虫系统可以不断抓取网页数据到本地,经过一系列的分析、过滤,从而得到高质量的数据。
本文主要从用户ID、评论内容、会员级别、点赞数、回复数、评价星级、购买时间、母婴品牌多维度进行分析,收集官网提供的数据集与Python爬取的日志信息,利用MySQL对数据进行预处理与存储,使用python进行分析与可视化呈现,最终对分析结果进行说明并提供相应意见。
关键词:Python;MySQL;电商平台;母婴商品;数据分析
Abstract
In recent years, with the continuous improvement of people's quality of life, the consumption concept is also constantly upgrading.Since 2016 national policy open 2 children, maternal and baby market, more and more products are increasing, people in electricity browsing maternal and baby products, often through store sales and have the comments to buy users to choose and buy, in the face of such a variety of goods and in the uncertainty in the network shopping, a large number of comments integration and processing, help consumers to make objective judgment to choose and buy to the appropriate mother and baby products is very necessary.
For a large number of hot-selling maternal and baby products, if consumers get a comprehensive analysis of a mother and baby product by reading reviews, it is a huge workload, time-consuming and limited information.As a program for automatically extracting web pages, the web crawler can efficiently excavate effective information from the large amount of information in the database, and a large amount of data can be processed and analyzed.The crawler system can constantly grab the web page data to the local, after a series of analysis, filtering, so as to get high-quality data.
This article mainly from the user ID, comment content, member level, thumb up, reply number, star rating, purchase time, maternal and infant brand multidimensional analysis, collect the data set and Python crawl log information provided by the official website, using MySQL, analyze and visualization using python, and finally explain the analysis results and provide corresponding opinions.
Key words: Python; MySQL; e-commerce platform; maternal and child products; data analysis
目录
摘  要 I
Abstract II
1 绪论 4
1.1 背景及意义 4
1.1.1 背景 4
1.1.2 目标及意义 4
1.2 应用现状 4
1.3 数据模型及主要板块 5
1.3.1数据模型建立 5
1.3.2 主要板块 5
1.4 主要方法及技术路线 6
1.4.1 主要方法 6
1.4.2技术路线 6
2开发环境及技术 7
2.1硬件设备 7
2.1.1 CPU及操作系统 7
2.1.2 其他 7
2.2软件及IDE 7
2.2.1 MySQL 7
2.2.2 IDE 8
2.3主要技术 8
2.3.1 MySQL 8
2.3.2 Python 9
3 可行性分析与模块设计 10
3.1 可行性分析 10
3.1.1 技术可行性分析 10
3.1.2 数据可获得性分析 10
3.2 各模块设计 10
3.2.1 数据获取方法 10
3.2.2 数据预处理设计 10
3.2.3 数据分析思路设计 12
4 系统实现与结论 13
4.1数据采集 13
4.1.1确定待采集数据 13
4.1.2确定采集对象及采集思路 13
4.2采集准备 14
4.3开始采集数据 14
4.3.1分析网页 14
4.3.2思考 19
4.4数据清洗与分析 20
4.4.1清洗过程简述 20
4.5 可视化与分析 20
4.5.1消费时段分析 21
4.5.2月消费与会员等级分析 23
4.5.3评论内容分析 25
5 设计过程中存在的问题和解决过程 27
5.1问题1描述 27
5.2解决办法 27
5.3问题2描述 27
5.4解决办法 28
6 总结 31
致  谢 32
参考文献 33













  全套毕业设计论文现成成品资料请咨询微信号:biyezuopin QQ:2922748026     返回首页 如转载请注明来源于www.biyezuopin.vip  

                 

打印本页 | 关闭窗口
本类最新文章
基于Python的在线自主考试系 基于腾讯云的个人知识库管理系统 基于Android的酒店预定系统
基于matlab变频器控制交流电 基于微信小程序的家校联动平台管理 基于时频分析与自适应滤波技术的多
| 关于我们 | 友情链接 | 毕业设计招聘 |

Email:biyeshejiba@163.com 微信号:biyezuopin QQ:2922748026  
本站毕业设计毕业论文资料均属原创者所有,仅供学习交流之用,请勿转载并做其他非法用途.如有侵犯您的版权有损您的利益,请联系我们会立即改正或删除有关内容!