目录
一. 系统概述 3
二.所用工具 3
2.1运行环境 3
2.2前置库 3
三、数据采集 3
3.1确定待采集数据 3
3.2确定采集对象及采集思路 3
3.3采集准备 4
3.4开始采集数据 5
分析网页 5
思考 9
四.数据清洗与分析 9
4.1清洗过程简述 9
4.2 可视化与分析 10
消费时段分析 10
月消费与会员等级分析 10
评论内容分析 11
五.设计过程中存在的问题和解决过程 12
问题1描述: 12
解决办法: 12
问题2描述 12
解决办法: 13
六、心得体会 14
七、参考文章 15
一. 系统概述
对评论所含内容进行简单的分析,初步确定所需要抓取的内容。首先,在京东商城手机信息界面的用户评价中含有昵称、会员等级、评价星级,评价内容、手机型号、购买时间等等。
其中通过分析会员等级与购买的关系,可以给为不同会员提供不同的产品做参考。分析评价内容可以大概可以推断出消费者对该产品的态度、以及哪些回复关注度比较高等等。分析购买时间可以了解到消费者集中的购买时间段。这些分析对商品广告的精准投放以及为消费者提供更个性化的服务提供了重要参考。
二.所用工具
2.1运行环境
• Chrome 版本 72.0.3626.109(正式版本) (64 位)
• Python 3.5.2 :: Anaconda 4.2.0 (64-bit)
2.2前置库
• json
• time
• numpy
• requests
• BeautifulSoup
• fake_useragent
三、数据采集
3.1确定待采集数据
用户ID、评论内容、会员级别、点赞数、回复数、评价星级、购买时间、手机型号