摘要:本文针对当前电力调度自动化系统运行监控管理上存在的问题及安全隐患,设计一种电力调度自动化系统综合监测平台,实现机房动力环境监视、IT设备资产管理、网络运行分析的一体化集成,综合自动化业务及系统运行环境的故障实时告警和智能展示,有效提高了自动化运行管理水平。
随着智能电网建设的深人开展,电力调度自动化系统已成为电网调度运行和变电站集中监控的核心技术支撑,在保证电力系统安全稳定运行中发挥着重要作用。然而,技术和应用需求的发展,导致电力调度自动化系统日趋复杂,薄弱环节也随之凸显。本文将针对当前电力调度自动化系统存在的问题和安全隐患进行分析,设计一种调度自动化系统综合监测平台。
1 调度自动化系统现状
1.1系统的重要性
在智能调度系统快速发展更新的大环境下,电力调度自动化系统已由电力系统中的一门辅助性远动技术发展成为集系统性、专业性于一体的技术,是维持电力系统安全稳定运行的一大支柱。随着电网规模的扩大和无人值班变电站的普及,电力调度自动化系统在广泛实用化后的今天,已成为电力企业减人增效,实现科技进步的主力军。
1.2系统运行中存在的问题
当前电力调度自动化系统监测巡视仍采用人工方式,故障处理在一定程度上依赖于运维人员的经验水平。近年来新技术、新功能的不断投人应用,导致电力调度自动化系统中计算机及通信设备数量增多,网络结构日趋复杂。各应用系统软件间又通过数据库、接口等形式互相通信、相互影响。遇到重要厂站及通道工况退出、网络中断、采集的数据异常、应用关键进程故障等情况,运维人员需耗费大量时间去核查应用系统各业务工况和设备运行状态,从而难以及时准确地进行故障定位。此外,人工巡视的管理模式往往是故障发生后进行被动式处理,无法进行事前预防,与在线监测、状态检修和预防性维护等电力主设备管理要求相距甚远。
另一方面,自动化应用系统形成的“信息孤岛”增多,加大了管理难度。尽管电力调度自动化部门一直在积极探索有效的管理模式,如通过培训来提高运维人员技能,购买厂商服务对部分应用系统进行外包,建立网络管理系统,配置多种专业化管理工具等,但是专业化管理工具和厂家服务的应用仅局限于特定范围,极大限制了其功能和性能的发挥,难以达到令人满意的显著效果。
1.3机房的安全隐患
电力调度自动化机房设备集中、网络布线复杂、运行环境要求高,因此其环境监测工作是自动化运维的重点。目前,电力系统采用值班员定时巡检方式,每隔一段时间到各机房进行巡检,通过观察设备指示灯、查看精密空调显示屏数据等方法,凭借经验和直觉来判断设备是否正常运行。然而,机房内设备状况时刻都在变化,定时巡检方式难以在第一时间发现问题,并且值班员缺乏对设备的了解或人为疏忽都会导致故障难以及时被发现和处理,必然会给系统运行带来影响。
2 系统设计与实现
2.1设计目标
本设计为一种电力调度自动化系统综合监测平台,从机房环境、通信网络、服务器、系统软件(数据库/中间件)、应用系统等多个层面实现电力调度自动化系统全方位一体化的智能监管。该平台可在数据层上第一时间发现问题,帮助值班人员更加准确及时地找到故障点,有效排除故障;可在物理层面上随时掌握电力调度自动化机房环境状况以及精密空调、UPS电源系统、网络及安全设备运行状况,保证系统的安全性和使用寿命;同时充分利用成熟的IT技术和手段,实现对不同安全分区的自动化设备、关键应用、重要数据的统一监管,打造“跨安全分区”的监测平台。
2.2监管对象及方式
结合电力调度自动化运维工作中的实际需求,将系统的监管对象分为主站设备、关键应用、重要数据、厂站工况、运行环境,并针对不同的监管对象采用不同的通信协议和监控手段。
(1)主站设备:主要包括各应用系统中的服务器、路由器、交换机、防火墙和网关设备等。采用简单网络管理协议(SNMP),通过轮询和接收SNMP TRAP(陷阱消息)方式监控设备运行状态、系统性能以及侦听告警信息。被监测对象需要启动SNMP服务,并开启端口一致。对于安装了特殊操作系统的服务器,要求安装SNMP主机代理。SNMP访问控制的只读团体(READ COMMUNITY)值需按规律一致设置。这样以保证新增设备能被监控服务器定期轮询模块发现,并根据监控模块预加载的MIB信息管理库识别设备类型,将其自动纳人监控范围。
(2)关键应用:主要实现对业务系统本身应用软件的监控。通过业务运行的主机服务器上的SNMP代理可完成对业务系统本身应用软件的监测。对于一般进程、文件系统的监控,通过标准MIB库就可完成。对于特定监控,如监控指定目录文件是否长时间没处理,需要通过扩展标准MIB库或自定义MIB库的方式来完成调度自动化综合监测系统对主机服务器SNMP的查询。
(3)重要数据:针对以往EMS系统重要遥测数据越限、不刷新或跳变,以及电能质量系统数据不更新等情况无法及时被发现问题,利用综合监测系统采集服务器通过数据库接口软件对各应用系统重要数据进行采集,并将数据实时传输到监测平台数据库,通过自定义告警规则实现及时告警。
(4)厂站工况:通过数据库接口采集EMS系统III区Web数据库上的厂站工况及告警数据,并将数据实时传输到管理服务器进行统一的告警预警与告警处理,对重要厂站及通道工况进行特殊告警处理,打造综合自动化业务和运行环境的集约化监测平台。
(5)运行环境:主要监测机房精密空调、温湿度及烟感、漏水、UPS电源系统等,并按大楼、机房、机柜、设备的层级以树状方式在界面上逐级展示监测结果。对于精密空调,通过其自带的智能通信接口即可监控压缩机、风机、加热器、加湿器、去湿器、滤网等的运行状态与参数,实现实时、全面诊断。对于温湿度及烟感,通过RS-232/485协议转网络将温湿度、烟感探头等设备量测数据采集人库并展示。对于UPS电源系统,可通过接口软件将有关参数、信号及运行信息传输到综合监测平台采集服务器。对于漏水,采用分布式传感检测系统进行监测,根据场地设备的布置情况,使用绳式测漏系统,该系统本身包括漏水控制器、漏水感应线及其它辅助设备,可检测感应线上任何点的漏水位置。
2. 3系统总体架构
系统总体架构如图1所示。安全II区部署1台采集服务器,负责采集、接收来自安全I/II区的设备信息、事件、告警和SYSLOG系统日志。安全II区采集数据库存放监控的任务信息、监控设备的必要状态信息等,这些信息可作为安全II区采集服务器向安全III区传递数据时的比对参考。安全II区的采集服务器将监控采集的数据(性能数据、拓扑数据、配置数据、告警数据、SYSLOG日志数据)通过安全II区传输代理以文件方式传递到安全III区,再由安全III区传输代理接收并转发到安全III区采集服务器本地指定目录。
安全III区采集服务器除了负责采集、接收来自安全III区的设备信息、事件、告警和SYSLOG系统日志外,还负责将传输代理转发的安全I/II区监控数据存入统一信息库,以及与动力设备监控管理站通信,将动力设备监控管理站收集到的所有机房的动力环境设备数据存入统一信息库。安全III区应用服务器负责将来自统一信息库的数据和安全III区采集服务器通过消息总线推送的数据分析和处理后统一展现在Web客户端。
2.4逻辑架构
系统逻辑架构如图2所示,纵向分为4层。视图展现层是用户与系统交互的界面,监测系统的图形化监控和可视化台帐维护都在这层完成。业务分析层采用成熟的企业级应用支撑平台(CISP ),可根据业务需求对数据进行组织、加工、分析、归纳。数据存储层是基于DMTF/CIM模型的统一数据配置库,对采集的数据按系统定义的结构进行存储,并提供查询、添加、修改、删除等操作接口。数据采集层负责与各类设备以各种规约、协议进行通信,支持并发采集和接收数据。