目录
1 选题的背景和意义
1.1 选题的背景
1.2 国内外研究现状及发展趋势
2 研究的基本内容
2.1 基本框架
2、 简述基于遗传算法的聚类算法的理论发展与应用。
2.2 研究的重点和难点
2.3 拟解决的关键问题
3 研究的方法及措施
4 预期成果
2、 资料收集准备阶段
3、 论文写作及答辩阶段
2021年1月中旬-2021年5月下旬
2月上旬-3月中旬 撰写论文初稿;
5月上旬-5月下旬 论文答辩,材料装订
参考文献
1 选题的背景和意义
1.1 选题的背景
在研究样品或指标分类问题时,往往需要用到聚类算法,同时作为一种重要的统计分析算法,聚类算法也常常在数据挖掘中被使用到。
聚类分析最早起源于分类学,起初人们面对分类问题时,很少使用数学工具,更多凭借经验或者专业知识来为样品或指标划分类别。但随着科学技术的发展,对于分类的要求越来越高,通过经验或者专业知识划分的类别往往不够准确,难以满足要求。因此,在分类问题中人们逐渐引入数学工具帮助分类,这便产生了数值分类学,等到多元分析再被引入到数值分类学后,聚类分析正式产生。
聚类分析的用途十分广泛,比如许多网站会分析用户浏览数据,并从中为用户划分类别,它们概括出每一类用户的浏览习惯,针对不同类别的用户,推送不同的内容。而随着互联网的快速发展,网络信息的迅速膨胀,大数据逐渐走进人们的视野,作为如今火热的大数据重要算法之一,聚类算法具有很高的研究价值。
遗传算法最早由John holland于20世纪70年代提出,该算法模拟自然界生物遗传优胜劣汰原则,是一种利用遗传算子解决复杂优化问题的算法。遗传算法主要具有以下几个特点:同时处理群体中的多个个体,对搜索空间中的多个解进行评估,减少了陷入局部最优解的风险,同时使算法本身易于实现并行化;算法从问题解的串集开始搜索,而不是单个解开始,利于全局择优;遗传算法基本上不用搜索空间的知识或其它辅助信息,而仅用于适应度函数值来评估个体,在此基础上操作,适应度函数不受连续可微的操作,而且其定义域也可以任意设定,使其具有应用范围大的特点。
基于遗传算法的聚类算法的核心思想是将遗传算法和传统聚类算法有机结合起来,使传统聚类算法具备遗传算法的优势,从而达到改进传统聚类算法的目的。
1.2 国内外研究现状及发展趋势