笔者工作的广播电台的办公网出现了故障,之所以说奇怪问题,是我们排除故障的过程比较曲折,一个在理论上很简单的问题,在实际工作中却不容易发现,写出来,作为经验,供同行参考。
网络如图1所示。我台的办公网主要用于访问因特网以获取新闻、下载资料、收发邮件等,每个频道有20台微机,所有的用户必须通过宽带路由器进行NAT转换才能访问外网,宽带路由器没有启用任何防火墙功能。
故障现象:
1.A频道的微机有时不能访问因特网,有时候故障可自动恢复,一般重启宽带路由器可解决。
2.故障发生的时间间隔不同,少则几分钟,多则间隔几个小时。
3.当不能访问因特网时,使用“PING 172.18.254.254”命令,提示“request timed out”,不能到达网关。
4.B频道也有相似的问题。
一、分析我们对以上故障进行分析,因为重启宽带路由器可解决故障,初步认为可能是内网微机发生病毒或内网微机用了电驴、BT等软件,产生大量数据包或者打开大量TCP连接,宽带路由器过载所致。
二、处理1.根据上面的分析,我们先检查了A频道的微机,清理每台微机上的无关软件,并用最新版本的杀病毒软件进行杀毒处理。结果呢,很不幸,故障依旧。
2.把A频道的联网微机只保留了不到10台,其余的微机全部从网上断开,结果,还是故障依旧。处理故障用了2天时间,仍然没有排除故障,因为影响到新闻播出,我们压力还是比较大的。
三、再分析如果A频道内网只保留不到10台微机,仍然有故障,可能宽带路由器出问题了。
四、更换宽带路由器,连CISCO2950也换了,问题仍然没有解决。时间又过去了一天。我们的压力也越来越大。
五、把故障现象报给网络公司,网络公司来人看了看,还是认为我们的宽带路由器或内网中的微机有问题。
我们用SNIFFER工具分析了通过宽带路由器的数据包,没有发现异常。到了第四天,在内网的微机和宽带路由器上,我们再也没有办法了,我们开始怀疑外网了。如果外网出问题,则A频道和B频道可能同时出问题。
六、等待出现长时间故障。因为有时候故障会在几十秒的时间里自动恢复,我们来不及检查两个频道故障又恢复了,所以只能等待长时间的故障。功夫不负有心人,经过耐心的等待,有了重大发现,两个频道的微机同时出现故障。为了进一步验证故障,我们把网络进行简单改造,如图2所示,发现A频道的微机和微机B同时出现故障。
真相终于大白,问题不在内网,经过网络公司检查,是网线头接触出了问题。网线头接触不好导致了网络的时通时断,结果给我们造成了错觉,以为重启宽带路由器就可以解决故障。
实际上,在重启宽带路由器的时间里,网络已经自动连接了。一个在理论上很简单的问题,在实际工作中却不容易发现,浪费了我们一个星期的时间,我们承受了极大的压力,希望同行们从中吸取经验。