图2 原始序列图形
原始含噪声数据的波形如图2所示,从上至下依次是指数形式、常数形式和多项式形式,数据有效长度为 ,原始数据中叠加的高斯白噪声符合 分布。在基于人工免疫网络的数据聚类过程中,线性归一化的原始数据作为抗原输入人工免疫网络,设置抑制阈值 ,最大循环代数为 ,记忆细胞规模为 ,其中的10次数据聚类结果如表1所示。
表1 人工免疫网络的聚类结果
如果将表1所示的10次实验均值作为聚类中心,则可以发现,它们大致位于各组数据的几何中心,同时也表明聚类结果的稳定可靠。
采用AR模型对原始数据进行预测时,通过试算法得出指数形式数据的AR模型为5阶,常数形式数据的AR模型为6阶,多项式形式数据的AR模型为11阶,预测误差如图3所示。
根据图3所示的预测误差可以看出,随着时间的推移,预测结果的误差逐渐增大,并逐渐偏离数据中心,其中常数类型数据的预测误差最小,多项式类型数据的预测误差最大。
图3预测结果误差 (a)指数形式数据 (b)常数形式数据 (c)多项式形式数据
6 结论
本文面向复杂系统综合健康管理对数据聚类和数据预测实际需求,充分利用人工免疫网络和AR模型的各自优势,提出了基于人工免疫网络和AR模型相结合的数据聚类和预测算法,并针对三种形式的原始数据进行了仿真实验,实验结果初步验证了所提出算法的可行性和有效性。本文提出的算法具有较强的通用性、适应性、鲁棒性,如何有效地提高聚类精度和预测准确性将是继续深入研究的内容。