心脏衰竭致死相关因素的研究
目录
心脏衰竭致死相关因素的研究
1 基本介绍
12 个特征进行了汇总解释。
2 数据可视化
3.1 变量相关性分析
3 数据预处理
3.2 LASSO 回归
4.1 逻辑回归
4 预测
1 + e−(wXT +b)
4.2 支持向量机 (SVM)
4.3 随机森林
4.4 结果
参考文献
参考文献
数据来源及代码
摘要:心脏衰竭对于人类健康构成了重大威胁,研究心脏衰竭致死的相关因素对于疾病的治疗和预防具有重要意义。基于原始数据集,本文关注了 12 个相关因素,从三个角度递进式的进行分析。首先,对数据进行可视化处理,直观的展现相关关系;其次,利用统计学方法分析了各因素与致死之间的相关性关系,并利用 Lasso 方法得到了更为重要的因素。最后,分别使用机器学习中的逻辑回归方法, 支持向量机(SVM)和随机森林三种模型构建分类器,训练得到用于预测的模型。
关键词: Lasso 方法,逻辑回归,支持向量机
1 基本介绍
心脑血管疾病是人类健康的第一大威胁,每年约有 1790 万人死于该病,占据了全球总死亡人数的
31%。心血管疾病导致易导致心脏衰竭,对人体健康构成直接威胁,分析心脏衰竭致死相关因素,预测心脏衰竭的致死率具有重要价值。相关因素包括年龄,患病时间,各种生理化学指标等等。
本文基于 Davide Chicco, Giuseppe Jurman 的研究调查的数据集,包括了约 300 个病人的信息,对于每个病人,关注了 12 个不同的因素,最后还包括了是否死亡这一重要信息。在下表中我们对
12 个特征进行了汇总解释。