目录
requests是一个简单的请求库,其中的get方法可以像指定服务器发送get请求 9
headers参数。作为请求的请求头。 9
在完成面向豆瓣电影的知识图谱的设计与实现这个项目的过程中,我感觉到学到了很多的知识,对于web的相关知识有了一定的了解,对于html文件的格式有了一些粗浅的认识,在遇到问题的过程中,要积极去查阅相关的资料,去想办法解决问题。 45
附录一 46
系统规格说明书 46
附录二 48
需求分析说明书 48
附录三 50
概要设计说明书 50
附录四 52
详细设计说明书 52
附录五 65
测试说明书 65
附录六 66
部分源代码 66
douban.py 66
i = ''.join(i) 108
i = i.split('分钟')[0] 109
x = [i for i in range(1, 11)] 113
neo4j_test.py 116
摘要:
本文介绍了python面向豆瓣电影的知识图谱的设计与实现。该设计是一个集爬虫、GUI、多线程、知识图谱、NLP基础文本分析的多功能应用。本文介绍了用面向对象软件工程方法对其进行分析、设计、编码、测试的过程,以及对设计的评估。并提供了相关文档及部分源代码。
关键字:
软件工程,面向对象,爬虫,知识图谱,文本分析