费舍尔判别分析法(FDA)方法综述
0.引言
随着现代工业过程中生产工艺的不断发展,特别是计算机技术和控制科学的引入,现代化设备的结构越来越复杂,自动化系统的规模越来越大[1]。这类系统一旦发生事故就可能造成人员、财产、环境的巨大损失。为切实保障工业过程的安全性和可靠性,建立一个有效的监控系统,实时监测系统的运行状态,对故障做出及时准确的诊断是十分重要的。对历史数据进行多元统计分析处理就是一种常用的数据分析方法。[2]
1. FDA的引入与定义
费舍尔判别分析法(Fisher discriminant analysis,FDA),是一种新发展起来的降维技术。Fisher判别分析方法能够将高维的历史数据投影到低维数据空间,利用低维的代表信息作为历史数据的特征信息。FDA 在降维时考虑了系统中各类之间的信息,除了考虑同类数据之间的相关性,还考虑了不同数据类之间的关联信息。因而,它可以通过极小化同类数据的组内离差,极大化不同数据类之间的组间离差来实现故障模式与正常模式,以及不同故障模式之间的分类分析[3]。因此 FDA 在区分空间中几种数据类时是最有效的。FDA 在用于故障识别时,可以将全部数据分类到不同故障类内。因而,Fisher判别分析法在故障诊断、模式识别等领域得到了研究者的广泛关注。
2. FDA的发展历史
Fisher判别分析作为一种有效的分类手段,最先用于二分类问题。在此基础上,Wilks[4]和Duda[5-6]分别提出了判别矢量集概念,通过寻找由一组巧别矢量构成的投影子空间,将数据持征投影到该子空间,实现了多分类问题,该方法也被称为经典的Fisher判别分析。由于Fisher判别分析需要对参数进行训练,所以在进行分类前必须利用给出的样本进行学习。FDA方法首先被Chiang等 [7] 应用到工业系统故障诊断中。
3. FDA的特点
Fisher判别分析算法应用到模拟电路故障诊断时,不需要对测试对象建立精确的模型,也不需要知道测试对象的相关特性,只需要在预处理后的故障特征样本中选取相应的训练样对算法进行训练和学习,选取最大的特征值对应的特征向量,根据累积贡献率确定投影方向个数,进而实现故障的定位。[8]
基于Fisher判别法的模拟电路故障诊断方法,主要思想是选择使Fisher准则函数具有极值的向量作为最优投影方向,将采样信息向该方向进行投影,从而使同类模式之间的距离最小而不同模式类别之间距离最大,根据新投影的特征进行数据识别和分类。从本质上说,它是一种局域数据分析处理的方法,其故障诊断能力强弱、效率高低在很大程度上与数据有关,而其模型建立是对数据间关系的表现。因此,数据特征提炼程度的高低在很大程度上影响所建统计模型的准确性和通用性。若是提供较高精度的故障特征向量样本,则可以改善Fisher判别分析法的训练过程,提高准确率。
因为Fisher判别分析法优点[9-12]特别突出而得到学者们关注,其优点主要包含:当总体的均值向量共线性程度较高时,Fisher判别法比较简单,可W根据几个判别函数就可W判别;没有对总体的分布提出什么特定的要求,应用比较广泛;Fisher判规法通进降维可以从图形上使用目测法直接判。然而,正是由于FDA同时需要正常和故障工况下的数据,在故障数据不易获取或者没有进行数据归类的工业场合,该方法的应用受到了限制。
4. FDA的研究现状及应用
目前Fisher判别分析已经在模式分类领域中得到了广泛的应用,如故障诊断、语音识别等。文献[13]基于小波变换与Fisher判别分析方法研究了人脸特征提取问题;文献[14]结合主成分分析方法研究了汽油分类分析过程;文献[15]基于Fisher判别分析方法研究了柴油机的故障诊断方法;文献[16]基于Fisher判别分析方法应用于非线性目标识别研究。文献[17]基于分维LLE和Fisher判别分析方法研究了非线性系统的故障特征方法。文献[18-19]分析了同组数据在不同量纲条件下不同的协方差特征及其在主元选择上造成的影响。基于统计学的Fisher判别分析方法,作为多元分析中的一个分支,判别分析已经得到广泛的应用。比如在考古学上,根据出止物品判断墓葬年代、墓葬主人身份、性别等;在医学上,根据患者的临床症状和化验结果判断患者疾病的类型;在经济学上,根据各项经济发展指标判断一个国家经济发展水平所属类型;在模式识别领域,用来进行文字识别、语音识别、图像识别[20-23]等。
5.结论
FDA 能将各类之间最大程度地分离,因此理论上是最优的。Fisher是近年来发展起来的一种新的机器学习方法,它克服了神经网络的不足,在解决小样本、非线性及高维模式识别问题中表现出结构简单、全局最优泛化能力强等特有的性能。
参考文献
[1] 周东华, 胡艳艳等. 动态系统的故障诊断技术. 自动化学报, 2009, 35(6):748-758.
[2] 周福娜, 乔芃喆. 基于相对Fisher判别分析理论的故障诊断方法. 计算机与应用化学, 29(7):843-846.
[3] 李晗, 萧德云等.基于数据驱动的故障诊断方法综述. 控制与决策, 2011, 26(1):1-9, 16.
[4] Duda R, Hart P. Pattern Classification and Scene Analysis. New York: Wiley, 1973:78-102.
[5] FoleyD H, Sammon J W Jr. An optimal set of discriminant vectors. IEEE Transactions on Computer, 1975, 24(3):281-289.
[6] 白云飞, 邓建, 董陳军, 李响. 费歇判别分析方法在采空区塌陷预测中的应用. 矿业研究与开发, 2008,28(5):74-75.
[7] Chiang L H, Russell E L, Braatz R D. Fault diagnosis in chemical processes using Fisher discriminant analysis, discriminant partial least squares, and principal component analysis. Chemo metrics and Intelligent Laboratory Systems, 2000, 50(2):243-252.
[8] 于辉. 基于Fisher判别法的模拟电路故障诊断. 湖南: 2014:8-20.
[9] Mauris G, Foulloy L. A fuzzy symbolic approach to formalized sensory measurement an application to a comfort sensor.2001:1413-1417.
[10] 赵丽娜. 引入权重因子的Fisher判别法的研究. 哈尔滨师范大学自然报.2012,28(5):24-26.
[11]高全华, 张士勇, 孙锋利. 基于Ksher准则特征融合策略的PNN车牌汉字识别. 现代电子技术,2010, 8(319): 106-110.
[12] Duda Richard O, Hart Peter E, Stork David G. Pattern Classification. Li H D, Yao T X, Beijing: China Machine Press, 2004:123-226.
[13] 赵韩, 姜康, 曹文钢, 孙丙宇等. 用小波变换和Fisher判别对人脸进行特征提取. 哈尔滨工业大学学报, 2009, 41(11): 278-280.
[14] 王荣辉, 宗若雯, 王正洲, 廖光煊等. 主成分分析法和Fisher判别方法在汽油分类分析过程中的应用. 中国科学技术大学学报, 2006, 36(12): 1331-1335, 1341.
[15] 和延滨, 黄荣华, 李育学等. 柴油机故障诊断的Fisher判别分析方法. 华中科技大学学报, 2002, 30(2): 43-44.
[16] 李映, 焦李成等. 基于Fisher判别分析的目标识别. 西安电子科技大学学报, 2003, 30(2): 179-182.
[17] 张伟, 周维佳, 李斌等. 基于分维LLE和Fisher判别的故障诊断方法. 仪器仪表学报, 2010, 31(2): 325-333.
[18] 王天真, 陈志国等. 相对主元分析及其在数据压缩和故障诊断中的应用研究. 自动化学报, 2008, 34(9): 1128-1139.
[19] 胡静. 相对主元分析理论及其应用研究. 河南大学, 2008.
[20] 吴立洲, 晋欣桥, 杜志敏.基于Fisher判别分析法的空调系统传感器故障诊断.能源技术, 2007, 28(1):45-48.
[21] 周健, 李夕兵, 史秀志等. 用Fisher判别法和支持向量机预测地下矿山框柱稳定性. 中国有色金属学报(英文版). 2011, 21(12):2734-2743.
[22] 朱明旱, 邵湘怡. 基于向量组的Fisher线性鉴别分析方法.计算机工程与应用,2011,47(6):205-207.
[23] 管宇. 实用多元统计分析.杭州:浙江大学出版化2011:5-12.