·上一文章:NAT-PT技术在IPv4和IPv6互联中的实现
·下一文章:无线Ad-Hoc网络中P2P文件搜索机制的研究
对所用的贝叶斯网络学习算法进行CI测试,最坏情况下的时间复杂度为O(N4)。由表2可知,采用PCA降维后,算法所用时间约占原构造算法时间的34.58%,贝叶斯网络结构的学习效率有所提高。
经PCA降维,IRIS数据集的属性由4个减少为3个;ZooData的属性由18个减少到12个;Glass Identification Data的属性由11个减少为8个。属性数量的减少使得网络结构更为简单,并且由表2可以看出,经PCA降维后进行分类的结果准确率不低于不经过降维直接由数据集学习得到的贝叶斯网络分类结果的准确率。
经PCA降维后的网络结构如图1~图3所示。
用图1中的结点V4、图2中的结点F13及图3中的结点F8是类别标签结点,其余结点为原数据结点的线性变换,无实际意义。实验2用经过PCA降维后数据构造的贝叶斯网络器(BN)与朴素贝叶斯(NB)分类器、TAN分类器分类对以上3组数据进行分类。分类准确率的比较如表3所示。
由实验1可知,使用PCA降维后构造的贝叶斯网络与未使用降维数据学习得到的网络分类结果正确率相差不大,而这样构造的网络分类结果比其他分类器正确率高很多,同时使用降维后数据构造的网络还具有结点少、结构简单、学习效率高等优点。
5 结束语
基于贝叶斯网络结构学习中依赖分析方法需进行指数级的CI测试因而存在结点集较大时计算效率低的缺点,提出了将数据集先经过PCA主元分析的方法降维。减少结点数,再用降维后的数据进行贝叶斯网络结构学习的方法,提高了网络结构学习的效率,并通过提高学习到的网络结构的正确性保证了较好的分类结果。此外。构建的网络还具有结点少、结构简单的特点,减少了网络的复杂性。