第一章 需求分析
现如今阅读、观影、听歌已成为人们日常生活的一部分,每个人手机里或多或少的都有与这些相关的软件。在每一次的欣赏、聆听的背后,都隐藏着数据的奥秘。比如一部电影每个评分数量的多少,反映了大众对于它的直接评价。每年音乐的发行量,反映了彼时音乐创作人的创作量以及音乐市场的火爆程度。
基于以上认识,我们的项目旨在分析与电影、图书、音乐有关的数据去了解一部电影、一首音乐的市场反响,亦或是对多数电影、音乐等综合分析其背后整个市场的情况。因为需要大量的数据集,由此我们便想到了豆瓣这个平台。
我们这个平台主要是爬取豆瓣平台的信息,通过对数据的爬取、存储、读取、处理与分析、可视化等一系列操作,对数据进行了多维度的分析和展示,同时选取了几个热门条目作为例子,进行单个分析,从中得到了许多有效的信息,这些信息一方面可以帮助大众更好的去了解电影、图书、音乐,另一方面也能够为投资者以及从业者带来便利,更好的为他们展示哪些是符合当前市场的。很多人在学习中也会进行相关的案例分析,但本作品与其他竞品有以下区别:
|
本作品
|
其他竞品
|
数据集的获取
|
本作品的数据集均由团队进
行爬取
|
其他竞品中的数据集多来自
于教学团队或他人给予
|
数据集的数量以及质量
|
本作品的数据集来自豆瓣相对于学习案例的数据集更加
丰富且更有实际意义
|
其他竞品中的数据集相对单一且数据量小
|
数据集的分析
|
本作品对数据的分析更加完
整,更加多元化,能够对数据进行系统的分析
|
其他竞品中的数据分析角度较单一
|
数据分析几个的过程
|
本作品集成了几个步骤为一
体话从数据获取直至数据可视化自动完成
|
其他竞品中一般为分步骤完成
|