模式识别 K-means、Fuzzy C-means
目录
模式识别 K-means、Fuzzy C-means 1
一、动态聚类算法介绍 1
1.1 介绍 1
1.2 K均值算法(K-means) 2
二、实验数据集介绍 6
2.1 Iris数据集介绍 6
2.2 Sonar数据集介绍 6
三、实验设置 6
四、实验结果展示与分析 8
4.1 K-means聚类结果与分析 8
4.2 FCM聚类结果与分析 12
五、Python代码 16
5.1 iris数据集 16
5.2 sonar数据集(与iris相差无几) 26
一、动态聚类算法介绍
1.1 介绍
聚类就是按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。即聚类后同一类的数据尽可能聚集到一起,不同数据尽量分离。这种基于相似度度量的聚类方法也是实际中更常用的方法,其中,根据算法设计的不同又可分为动态聚类法和分级聚类法等。
动态聚类方法是一种普遍采用的方法,它具有以下3个要点:
①选定某种距离度量作为样本间的相似度度量。
②确定某个评价聚类结果质量的准则函数。
③ 给定某个初始分类,然后用迭代算法找出使准则函数取极值的最好聚类结果。