主要参考文献(要求至少外文二篇,中文三篇):
[1]安子建. 基于Scrapy框架的网络爬虫实现与数据抓取分析[D].吉林大学,2017.
[2]赵绿草,饶佳冬.基于python的二手房数据爬取及分析[J].电脑知识与技术,2019,15(19):1-3.
[3]孙瑜. 基于Scrapy框架的网络爬虫系统的设计与实现[D].北京交通大学,2019.
[4]丁忠祥,杨彦红,杜彦明.基于Scrapy框架影视信息爬取的设计与实现[J].北京印刷学院学报,2018,26(09):92-97.
[5]韩贝,马明栋,王得玉.基于Scrapy框架的爬虫和反爬虫研究[J].计算机技术与发展,2019,29(02):139-142.
[6]李刚.疯狂Python讲义[M].电子工业出版社,2018,12(01).
罗安然,林杉杉. 基于Python的网页数据爬虫设计与数据整理[J].信息科技,互联网技术2020,19:94-95+31.
[7] 王从瑜,石弘利,赵炜,基于Python及商业智能的百年奥运会数据可视化分析[J].社会科学Ⅱ辑; 信息科技.2021,5:89-91.
[8] 刘珍. 大数据环境下基于Spark的油藏经营管理系统研究[D]. 西安石油大学.2020.
[9]Thusoo A, Sarma J S, Jain N, et al. Hive: a warehousing solution over a map-reduce framework[J]. Proceedings of the VLDB Endowment, 2009, 2(2): 1626-1629.
[10]Information Technology-Data Analytics; Reports Outline Data Analytics Study Findings from Xianyang Normal University (Research on Massive Data Analysis and Processing Platform Based on Hadoop)[J]. Computers, Networks & Communications, 2018, 07(05):3-7.
|