目录
1. 研究问题: 1
2. 开源地址: 1
3. 研究方法(数据分析方法) 4
(1) 数据获取 4
(2)数据筛选:实现数据集从 30W 到 1W 的精确化重点化 4
基于评论字长的筛选:我们认为字长小于 10 的评论是无效的评论 22W-->11W 4
(3)心态字典构建: 原始资料: 6
(4)数据可视化: 7
4. 案例分析 13
大的方向上: 13
小的方向上: 13
确实与疫情态势有一定的相关性, 14
5. 对本课程意见与建议 14
1.研究问题:
计算社会学——心态分析
认识:计算社会学(computational sociology)不同于以往借助社会调查抽样数据进行描述和经典模型回归分析的定量研究,而是借助复杂模型和社会计算工具对复杂社会现象与过程进行描述、解释和预测的定量社会学新领域。作为社会学研究的一种全新范式,计算社会学研究的对象主要集中在复杂的网络现象与社会过程的联系之中。在如今社会的进程中,每个人都会在网络上留下自己的痕迹,而对于痕迹的把握,在一定程度上也可以反映某种角度下的社会结构特征。当利用计算社会学进行心态分析的时候,首先需要把握的是传统社会学如何对社会的总体心态进行把握,不难发现,传统社会学的心态分析,底层逻辑是在研究个体的言语描述,但因为传统社会学研究的能力范围有限,无法掌握大量的具体数据,所以往往更多是其抽象化后的社会舆论。但借助于计算社会学,我们可以轻易地获取每个人的网络言论,即获取了心态分析中的大量基础数据,较之传统社会学更加精准且科学化。计算社会学也有其不能及之
处,由于网络平台的分化,个人言论基于网络和现实中的分歧,计算社会学——心态
分析这个方法所得到的基本数据,并不一定能完全描述社会的总体面貌,但正如前文所说,这只是提供某种角度下的社会结构特征,计算社会学不能一次解决传统社会学遗留下的问题,但其可贵之处也在于能提供新颖的角度。
出发点:本次实验中,我们也多方面获取了众多的评论数据,力求能够尽量全面地把握疫情期间社会群体的网络言论。我们从疫情期间的各种社会新闻下的网络评论出 发,探寻这些大量言论下构成的社会心态总体样貌。