一、毕业设计(论文)的内容
恶意域名通常是诱导用户访问不安全的网址,这类网址通常被植入木马、病毒程序等恶意代码,在用户不知情的情况下,利用伪装的网站服务内容诱导用户访问。在网络环境中需要及时排查和处理。本毕业设计利用深度学习技术,设计一种能够检测和防御恶意域名的系统,提高网络用户对恶意域名的识别和防范能力。
(1)构建或下载安装一个包含恶意域名和正常域名的数据集,并进行标注。其中可以借助公开的恶意域名数据库或黑名单来获取恶意域名样本,同时也需要收集一定数量的正常域名样本作为对比。
(2)能将域名转化为计算机可处理的数值形式,如使用词袋模型、字符嵌入(character embedding)或者其他自然语言处理技术将域名转化为特征向量。
(3)选择合适的深度学习模型用于恶意域名检测,例如卷积神经网络(CNN)、长短期记忆网络(LSTM)或者Transformer等。根据实际情况,可以设计多层模型或者多任务模型。
(4)进行模型训练与优化,使用构建好的数据集对深度学习模型进行训练,并使用合适的优化算法(如梯度下降法)对模型进行优化。
(5)开展模型评估与性能优化,使用一些评估指标(如准确率、召回率、F1值等)来评估模型的性能,并根据评估结果对模型进行进一步的优化和调整。
(6)在完成模型训练和优化后,需要将模型嵌入到一个具体的恶意域名检测与防御系统中,进行验证或部署应用。
二、毕业设计(论文)的要求与数据
1、预备知识
(1)熟悉机器学习相关模型与算法等。
(2)掌握域名原理等,了解恶意域名的特征,包括域名长度、字符组合、域名结构等实现恶意域名特征提取,可以使用常规的字符串处理和特征工程方法来提取这些特征。
(3)注意法律法规与合规性要求。
(4)相关工程需求与数学模型的程序设计。
2、收集相关信息(数据)
(1)收集和阅读与(恶意)域名、深度学习等相关的参考文献。
(2)本毕设工作所需的开源程序素材。
(3)其他可能需要的数据。
3、技术要求
(1)域名的特征向量表示、用于恶意域名检测的深度学习模型训练等过程。
(2)对模型进行优化,并能应用于具体的检测与防御系统中。
(3)相关工程需求与数学模型的程序设计过程。
(4)遵守《网络安全法》、《数据安全法》、《个人信息保护法》等法律法规。
三、毕业设计(论文)应完成的工作
1、毕业设计开题报告一份。
2、英文翻译材料一份(包括不少于2万字符的英文原文和译文)。
3、毕业论文一份(中文摘要建议500字左右,英文摘要应与中文摘要内容保持一致,正文建议1.5万字;参考文献不低于15篇,须包含中、英文文献)。
4、相关软件系统一套(包括程序清单、用户使用说明书)。
四、应收集的资料及主要参考文献
[1] 姚健康,王胜开,吴秀诚. 互联网域名国际化与安全技术导论[M]. 电子工业出版社, 2020.
[2] 赵眸光. 深度学习与神经网络[M]. 电子工业出版社, 2023.
[3] 姚远,樊昭杉,王青,等. 基于多元时序特征的恶意域名检测方法[J]. 信息网络安全, 2023,23(11): 1-8.
[4] 褚冰融,付海艳,刘梦. 基于改进的CNN-LSTM的DGA域名检测算法[J]. 海南师范大学学报(自然科学版), 2023,36(3): 237-248.
[5] 高宁康,王小英,梁嘉烨. 基于随机森林和深度神经网络的恶意域名检测方法[J]. 科学技术创新, 2023(11): 115-118.
[6] 刘子雁,李宁,张丞,等. 基于深度学习的虚假域名检测[J]. 济南大学学报(自然科学版), 2022,36(2): 148-154.
[7] 王志强,李舒豪,池亚平,等. 基于深度学习的恶意DGA域名检测[J]. 计算机工程与设计, 2021,42(3): 601-606.
[8] 王媛媛,吴春江,刘启和,等. 恶意域名检测研究与应用综述[J]. 计算机应用与软件, 2019,36(9): 310-316.
[9] 杨路辉,白惠文,刘光杰,等. 基于可分离卷积的轻量级恶意域名检测模型[J]. 网络与信息安全学报, 2020,6(6): 112-120.
[10] Shaheetha L, Vadivazhagan K, Mohamed Parvees M Y. Detection of Malicious Domains in the Cyberspace using Machine Learning & Deep Learning: A Survey [C]. 11th International Conference on System Modeling and Advancement in Research Trends (SMART 2022), Moradabad, India: CSI 2022: 1540-1543.
五、试验、测试、试制加工所需主要仪器设备
1、硬件要求:
2.5GHz以上CPU,8G内存,100G硬盘。
2、软件要求:
操作系统:Windows系统。
编程语言:Python