目录
第一章 引言 3
1.1研究背景及意义 3
1.2研究现状 3
1.3行文思路及框架 4
第二章 数据探索性分析 6
2.1目标变量 6
2.2特征分布 6
2.3特征与标签相关性分析 8
2.4离群点分析 9
第三章 数据预处理与特征工程 10
3.1数据预处理 10
3.2特征工程 10
3.3特征选择-PIMP 12
第四章 异常点检测办法 14
4.1孤立森林算法简介 14
4.2实验验证 15
4.3异常点检测的使用建议 16
第五章模型设计与分析 17
5.1LightGBM 17
5.1.1LightGBM 原理 17
5.1.2模型优化思路 17
5.1.3实验结果 18
5.2神经网络 20
5.2.1神经网络原理 20
5.2.2神经网络搭建 21
5.2.3实验结果 22
5.3Catboost 22
5.3.1Catboost 原理 22
5.3.2实验结果 22
5.4Logistic 回归 23
5.4.1Logistic 回归原理 23
5.4.2实验结果 24
5.5模型运行时间对比 24
5.6模型的融合示意图 25
总结 26
参考文献 27
1.1 行文思路及框架
本文对信用卡交易过程的中的欺诈行为进行预测,使用 AURPC 作为评估模型对欺诈概率的预测的效果。主要经过数据探索、特征工程、异常点检验、模型建立、模型评
估的过程完成文章报告的撰写。整体的框架如下图 1.1 所示。
图 1.1 行文思路