构架电网信息系统状态的监控和评价论文
2020-09-24 02:45:21 66
0引言
在“十二五”期间,中国国家电网公司将全面建设强大智能的电网,促进创新集约化发展公司和网格,并确保发展。成为国家电网公司实现战略发展目标的基础工程和重要保证。
。国家电网公司的SG186信息系统,SG-ERP系统和其他业务信息系统已投入使用,这不断改善了公司的业务支持。在与主业进行大规模整合的同时,信息系统的规模也急剧扩大,新系统和新技术的不断应用增加了系统故障的可能性,对系统产生了重大影响。稳定性和系统管理员。要求也增加了。如何提高信息系统维护的效率,质量,安全性和稳定性也变得显而易见。因此,采用创新的管理思想和现代计算机技术来确保信息系统的安全,降低生产成本,提高企业竞争力已成为电网公司的当务之急。在这种背景下,信息系统的状态维护已成为改变电网维护方式的必然趋势。
基金项目:国家电网四川省电力公司(52199713504A)的研发项目基于对信息系统状态的监控和评估。国家电网公司的企业信息系统目前使用B / S体系结构,B / S模式信息系统的主要结构包括应用服务器和数据库服务器。因此,对应用服务器和数据库服务器内部和外部状态的监视和评估已成为信息系统状态评估研究中最重要的环节。
信息系统维护是信息运维人员工作的重要组成部分,国家对信息系统的维护也是必然的发展趋势。 [3 -4]。目前,国内对信息系统状态维护的研究仍处于起步阶段,其中大多数研究人员对信息系统状态的监测和评估仅停留在总体设计思路上,而不会继续扩展。研究每个特定部分的状态。在此基础上,提出了一种对B / S信息系统的状态进行全面监视和评估的方法,并提供了一种对B / S信息系统的状态进行短期预测的方法,以提供更具体的研究思路和条件。信息系统的维护。取得技术参考。
1评估系统的总体设计
中国国家电网公司当前的信息系统主要采用B / S架构,以下重点介绍WebLogic服务器和甲骨文数据库服务器的技术路线大规模信息系统研究。图1显示了信息系统状态评估系统的总体设计框架。
从图1可以看出,该系统主要包括四个部分:健康状态划分和测试,健康数据收集,状态评估和预测以及健康状态存储系统。健康状况的分工和测试主要是建立评价体系的评价指标体系,以期合理划分信息系统的运行状况;健康数据收集模块用于监视WebLogic服务器和甲骨文数据库服务器的内部和外部状态数据,并将监视数据存储在健康状态存储数据库中,为状态评估模块提供实时数据源;状态评估与预测模块实现对信息系统当前状态的评估,并结合信息系统的历史状态数据,对信息系统的状态进行短期预测。健康状态存储系统是一个存储数据库,负责评估系统所有数据的存储。
2健康状况的划分和测试
2.1。健康状况的划分
根据B / S体系结构的特征对整个系统状态进行分类两部分,WebLogic服务器状态和甲骨文服务器状态。这两个服务器具有各自不同的子状态。这些状态量是根据WebLogic和甲骨文数据库的正式文档,书籍介绍以及运维人员的建议进行分类的。每个状态都有对应的状态。这些阈值也是参考文档,书籍以及操作和维护人员的经验。每个状态量分为4种状态:正常状态,注意状态,异常状态和危险状态。表中列出了每种状态的得分。 1如图所示。
2.2基于LoadRunner的负载测试
LoadRunner是用于预测系统行为和性能的负载测试工具
。基于LoadRunner的测试分析会自动生成各种指标的统计测试结果,例如测试简要图,交易平均时间响应图,系统资源图等,以了解和判断在不同压力测试下被测系统的运行状态以及对系统资源的使用,并对它们进行相关分析,以确定系统索引不同状态的阈值。通过模拟数以千万计的用户以实现并发负载和实时监视以确认和发现问题,将从测试中获得的性能指标值与定义的指标状态阈值进行比较,以验证阈值的准确性。同时,经过测试实验,各指标的权重定义如表2所示。
3状态数据收集
根据分层在B / S系统中,状态监视和收集系统也分为相应的子模块,以分别监视每个层。状态监视采集系统由三个子状态监视采集系统组成[6〜7]。它们是Weblogic服务器数据采集程序,甲骨文数据库数据采集程序和甲骨文主机数据采集程序。它们根据设置的频率收集相应的模块。保留收集的数据后,主程序将读取该数据,然后根据状态定义对数据进行分段。根据状态的划分,最终获得当前系统状态的评估。
3.1 Weblogic服务器数据获取程序
Weblogic服务器数据获取程序
可以获取服务器系列中的JMS信息,进程信息,线程信息,JVM内存信息,CPU使用率等服务器数据。获取信息状态数据后,可以对数据进行分析以获得服务器的当前状态。逻辑流程如图2所示。程序启动后,首先检查Weblogic服务器是否已启动。如果未启动,则报告错误以指示服务器未正常启动。如果Weblogic服务器正常启动,请启动系统数据收集子例程和Weblogic服务器数据收集子例程。在相应的时间和频率刷新并再次收集相应的子例程。主程序在相应的时间和频率获得相应的数据。将数据写入MySql数据库。
3. 3. 2 甲骨文数据库数据获取程序
甲骨文数据库数据获取程序可以获取服务器执行队列,等待执行队列,数据库命中率,SQL读写次数,数据库使用率等等。家庭数据库服务器状态。获取信息状态数据后,将数据写入MySql数据库。
流程逻辑如图3所示。程序启动后,首先实例化三个子数据采集程序并设置相应的采集频率。
设置后,每个子例程将根据相应的频率收集数据。 3.3 甲骨文主机数据获取程序甲骨文主机数据获取程序可以获取客户端服务器的CPU状态信息,交换区域信息,一系列客户端服务器状态信息,例如内存信息和硬盘信息。获取状态信息数据后,可以将其存储在MySql数据库中。
流程逻辑如图4所示。程序启动后,首先实例化四个子例程监视系统,并设置相应的采集频率。设置完成后,将根据相应的子例程收集数据,并将收集的数据反馈给服务器。获取相应数据后,程序将分析数据并给出相应的状态提醒。
4状态评估和预测
4.1基于聚类回归的状态评估模型
一般研究认为,低负载系统具有较高的运行状况。然而,在高负载系统中,在实际系统运行期间,系统的正常状态可能是中等负载或高负载。考虑到这种情况的存在,专门设计了基于历史状态聚类和系统回归的评估模型。
在实际系统运行期间,对于稳定运行的系统,在大多数情况下可以认为该系统是正常的。因此,使用聚类方法将训练集或收集的历史数据划分为K个类别,将数量最多的前N个类别视为系统的正常状态。代表。选择每个指标的中心点,每个指标偏离中心点一定范围。根据线性扣除,如果超出范围,则将扣除指标。根据指标的数量,将健康评分的数量分为等级。如果每个指标得分均小于其指定得分的β(默认值为0.6),则该指标被视为异常,并使用M5Rules回归模型计算指标之间的回归关系。偏离回归方程且偏差比超过0.3(计算方法为(|实际值-回归值|)/回归值)的前n个指标用作异常指标。如果存在n个指示灯,则所有指示灯均正常,如果多个0.1 * n个指示灯异常,则表示整个系统处于关注状态;如果存在多个0.2 * n个指示灯异常,则表明0.33 * n个指示灯异常。如果指示灯异常,则处于危险状态。
该模型不仅可以避免本身是高负载的系统的状态评估错误,而且不仅可以通过将低级指标直接组合为高级指标来判断系统状态,而且还可以每个基础指标的聚类分析。指导每个指标运行状况的判断,充分考虑影响信息系统状态的因素,并从指标的运行状况来衡量系统的整体运行状况,避免误报和误报。
4.2基于隐马尔可夫模型的短期状态预测模型
隐马尔可夫模型(HMM)是一种马尔可夫链,其状态无法直接观察,但可以通过观察序列进行观察向量,每个观察向量由各种概率密度分布表示为各种状态,每个观察向量由具有相应概率密度分布的状态序列生成。因此,隐马尔可夫模型是一个双重随机过程,即具有一定数量的状态和一组显式随机函数的隐马尔可夫链。在充分研究经典的预测模型并结合电网信息系统的状态特征之后,选择了隐马尔可夫模型来建立信息系统状态的短期预测模型。
该模型以大量的系统状态历史数据作为训练样本来完全训练该模型。评估模型正常运行一段时间后,系统的四级指标得分将按时间顺序记录,并且未来的一个或多个得分可通过隐马尔可夫模型进行预测,而第三,第二个,并最终预测出一级指标。为了确保预测的实时性和有效性,会定期更新隐藏的马尔可夫模型。
5实验验证
将状态评估系统应用于四川SG186安全监督管理业务应用系统服务器和数据库服务器分别是Weblogic和甲骨文。要测试评估系统数据收集和评估预测功能,请设置表3中所示的测试方案,并在表4和5中显示获得的结果。
从表4中的数据分析可以得出:看到甲骨文服务器获取程序可以收集主机硬件的动态信息。从方案1到方案3,cpu,内存和交换的使用量正在增加,这与测试用户的数量相乘,表明所收集的数据是正确的,并且“每秒用户事务数”的最大值为1.场景2中的1.8到1.96,然后场景3中的2.1依次增加,这与场景中用户数量的增加是一致的,表明获取程序的甲骨文数据库获取模块可以正常工作一般。同样,Weblogic服务器获取程序也可以正常运行。从表5中的数据分析可以看出,评估系统可以全面评估信息系统的当前状态,并且可以在1分钟后有效地预测信息系统的状态。通过对预测模型进行充分的训练,预测时间可以更长。
6总结与展望
提出了一种评估电网信息系统状态的方法。经过充分讨论,建立了信息系统状态评价指标体系,并根据各级指标的重要性分配了相应的权重。实现对B / S体系结构信息系统总体状态的监视和评估,并使用信息系统的历史状态作为训练样本来预测其短期状态。结果将用作电网信息系统状态维护的重要部分。
参考文献
李向荣,郝汉勇,范涛,等。数字电网建设信息化企业建设[J]。电网技术,2007(17):1 -5。
曾德俊。 SG186,ERP和IPSS关系的探讨[J]。华东电力,2009(9):1442 -1444。
刘贤杰,刘旭升。信息通信状态维护系统状态评估系统的探索与实践[J]。电力信息化,2012(5):64-69。
张涵。开展信息系统状态维护,提高系统运维水平[J]。农村电气化,2014(6):32 -34。