小波分析在特征提取中的优势,主要是利用小波基可以用较少非零小波系数去逼近一类实际函数的能力,选择小波基应该是以最大量的产生接近于零的小波系数为优。小波基的这种能力主要依赖其数学特性――正交性、消失矩、正则性、对称性以及支集长度等来决定。在进行特征提取时选择不同的母小波,效果会有很大差异,而对于电路的特征分析中选择何种小波函数,目前还没有完善的理论指导,多根据经验或实验来确定,因此小波母函数、小波系数、小波网络结构及学习算法的优选问题都是亟待解决的问题。
4、基于故障信息量的特征提取
基于故障信息量的特征提取方法是从不同思路考虑的一种新方法[9-11]。模拟电路运行过程中若出现故障,则电路的特征参数会偏离正常状态,特征向量也会发生变化。因此,只要故障源存在,这种故障信息就会通过特征参数表现出来[11]。若以信息量作为出现故障的量度便可以对电路的状态进行诊断。按照信息理论的观点,特征提取的目标是通过一个特殊的信道――即所采用的特征提取方法,使信道的信息最大化,信道损失最小,其原理如图3所示。
图3 信息传输模型与特征提取模型的比较
基于互信息熵的特征提取就是其中的方法之一,其理论依据是当某特征获得最大互信息熵时,该特征就可获得最大识别熵增量和最小误识别概率,从而具有最优特性。因此特征提取便是在电路的初始特征集合中寻找一个具有最大互信息熵或最小特征条件熵的集合。而最大互信息熵是由系统熵和后验熵决定的,系统熵是一定的,因此后验熵越小,则互信息越大,分类效果就越好,于是有效的特征提取转化为在初始特征集给定后,寻找一个具有最大互信息熵或最小后验熵的集合。在特征优化过程中,随着特征的删除,会产生信息的损失,使得后验熵趋于增加。后验熵增值大小反应了删除特征向量引起的信息损失的情况。按后验熵由小到大排列,就可以获得对应的特征删除序列。
文献[9,10]中将电路中的测点拓展为任何能够携带电路故障信息的特征量,对电路进行交流小信号分析后对从可及节点处测得的电压的相频、幅频特性进行采样,再利用这些采样点的诊断信息量来完成有效测点(也即特征)的选取,为后续的诊断提供了诊断信息量大且能保证故障识别精度的有效故障特征集。
基于故障信息量的故障特征提取方法中,只要蕴含着不确定性状态的信息能在电路系统中传递且到达输出端口,就可以通过检测到的输出信号获取电路中的不确定状态,提取系统的异常征兆,为故障诊断提供有效的特征数据。这种方法不仅可用于线性电路,对非线性电路也适用。
目前基于故障信息量的特征提取方法中包括信息熵、互信息、负熵等多个测度,且多数需要获取各类故障的后验概率分布函数和测点测量值的密度函数,而获得这些参数困难重重,多采用估计方法来近似,因此概率密度函数的估计方法不同,搜索算法不同都会对最后生成的故障特征集是否为最佳故障特征集造成影响,这些都是目前特征提取工作中需要进一步探索的问题。
5、基于核函数的特征提取[4,12-13]
基于核函数的非线性特征提取特别适合处理模拟电路中广泛存在的非线性问题,它通过非线性映射将原始特征样本空间中的非线性问题转化为映射空间中的线性问题,如图4所示,其目标是使数据点到它所代表的曲线或曲面间的距离之和最小,从而使输入矢量具有更好的可分性。常用的核函数有多项式核和高斯核等。
图4 核函数的非线性嵌入映射
文献[12]中利用核函数对线性特征提取作了拓展,通过仿真分析表明基于核函数进行非线性特征提取的做法可以使故障模式的可分离性得到提高,由此提高电路的故障识别准确率。文献[3]中提出了用二元树支持向量机提取模拟电路故障特征的方法,并基于模式类空间分布的可分离性策略来构建不同的二元树结构,且比较了这几种方法的效果,得出平衡二元树支持向量机对多故障模拟电路的诊断具有更好的速度,自适应支持向量机则拥有更好的分类效果。
基于核函数的非线性特征提取选取的核函数不同,计算的代价和分类的效果则存在差异。另外基于核函数的非线性特征提取对小样本数据的故障诊断具有很好的分类效果,但是在样本数量众多的情况下进行特征提取,例如采用核主元分析时需计算核矩阵,由于核矩阵的维数等于样本数量,使核矩阵的计算将会变得非常困难,因此如何选择合适的核函数以及在保持特征样本分布结构不变的情况下减少核矩阵的计算量还需要做更进一步的研究。