目录
0. . 目录结构 1
1. . 项目设计 2
1.1 系统功能 3
1.2 数据量 3
1.3 使用算法 3
2. . 数据分析 4
2.1 up主连续投稿行为分析 4
2.2 up主个人简介长度与播放量关系 5
2.3 B站播放量中的“二八定律” 7
0.. 目录结构
/code
data.json 为 爬 虫 存 储 的 数 据get_data.py 为爬虫程序1(具体两个程序的区别见后文) 大作业2设计文档.pdf
/creator 为爬虫爬取的up主头像
/data_analyzation 为数据分析相关代码 具体文件对应内容见后文
/my_website 为django文件所在的文件夹
data.json 复制自上级目录
db.sqlite3 自动创建文件
manage.py 自动创建文件
/my_website部分自动创建文件忽略不写urls.py url匹配
settings.py 设置
views.py 数据处理、前往网站
/static
/creator 复制自上上级目录
/pic 复制自上上级目录
/templates
creators.html up主列表页homepage.html 主页-视频列表页
search.html 搜索页search_result_up.html up主搜索结果页search_result_video.html 视频搜索结果页up_information.html up主信息页
video_information.html 视频信息页
/new_data 为爬虫程序2
/pic 为爬虫爬取的视频封面