数字化控制系统可靠性确认方法及步骤探讨
裴建伟,刘肇阳,何大宇
(深圳中广核工.程设计有限公司,广东深圳518045)
摘要:本文围绕适用于数字化控制系统可靠性分析的定性和定量分析方法,如失效模式及效能分析、可量方法的分析比较.并对数字化控制系统可靠性及安全性的基本分析步骤也做了系统介绍.关键词:失效模式及效能分析;可靠性框图;故障树事件;马尔科夫状态转移法;可靠性;可用度;危险性中图分类号:TM623 文章标志码:B 文章编号:0258-0918(2012)S2-0175-04
Discussion on DCS Reliability Analysis Methods and Steps
PEI Jian-wei LIU Zhao-yang HE Da-yu
(China Nuclear Power Design Co. Ltd.(Shenzhen), Shenzhen Guangdong Prov.518045 China)
Abstract: This paper describes a qualitative method and three quantitative methods ofreliability analysis for digital control system such as failure mode and effect analysis reliabilityblock diagram fault event trees and Markov statetransition methods whichcan be applicable to digital control systems in nuclear power plant. The parisons ofthree quantitative methods are presented to select a suitable method according toapplication environments.In addition a draft procedure of systematic safety andreliability analysis of digital system is also presented.
Key words; reliability; failure modes and effects analysis; reliability block diagram;fault trees event; Markov state transition method; reliability; availability; risk
基于对一般模拟系统认识的局限性,特别是福岛核事故发生后,人们对核电厂安全问题产生的极大忧虑和恐惧,使核电的安全可靠性受到前所未有的质疑.尽管经过最近10余年发展,数字化技术因其对核电厂安全性和可靠性产生的积极影响而已完全取代传统模拟技术,如CPR-1000系列以及EPR、AP1000三代
核电厂的保护控制系统就是建立在数字化控制系统(DCS)基础上,也由此使得核电厂整体安全在一定程度上得到加强,但因缺乏量化的安全分析数据,而无法对人们信心产生显著影响.为了消除对核电安全的紧张心理,恢复发展核能信心,尤其是在福岛事故后全行业安全检查和完善的活动大力开展的背景下,数字化控制
提高可靠性的根本办法.相反地,软件发生的故障则多为设计产生的缺憾,通过一次修改调试,一般不会再发生同样的问题.但同一软件的多重使用有发生共模故障(CommonModeFailure)的风险,对于提升可靠性没有任何帮助.图1所示为控制系统硬件和软件故障率随时间变化的趋势.硬件故障率的变化趋势是从试运行阶段的高故障率到稳定运行阶段的故障率低水平保持,再到老化阶段的故障率逐渐增加,呈浴盆形变化.而软件故障率的变化趋势从理论上讲,通过持续的修改调试,可减少故障率.但在实际应用时,通过维护阶段的修改调试,会出现暂时故障率增长的现象,并且部分故障会持续发生.
系统可靠性分析显得更加必要和迫切.
本文就传统可靠性分析方法的特点及与数字化控制系统可靠性分析的适应性进行了阐述,参照参考文献[5]提出的核电厂数字化控制系统的可靠性及安全性分析步骤,对可能适用的分析方法和步骤分别进行论述.
1可靠性分析方法
对于数字化控制系统而言,影响其可靠性的故障主要来自两个方面:硬件和软件.硬件产生故障的原因一般来自设备本身,如设备物理性能下降或设备磨损等.在这种情况下,即便对故障进行修复,将来依然会发生同样的故障.而对同一设备采取冗余或更换措施,则是
图1软、硬件故障率随时间变化趋势图Fig. 1Software and hardware failure rate trend
在安全系统分析领域中,对系统可靠性由定性分析转向定量分析已成新趋势,这在最新的国际标准中是有相关要求的.系统可靠性分析方法有以下几种:
成分的失效率对系统的影响,以帮助评估系统的整体可靠性.参见参考文献[2].
(3)故障树法:故障树分析法从系统到部件,再到零件,按“下降形”分析的方法,分析故障事件(又称顶端事件)发生的概率.该方法的特点是可快速确认对系统可靠性产生重大影响的部件或部件的组合,同时也可根据关键重要度的大小得出最佳故障诊断和维修顺序,作为首先改善相对不可靠单元的依据.参见参考文献[3].
(1)失效模式及效能分析法
失效模式及效能分析FMEA(FailureModeandEffectAnalysis)是定性分析法的典型代表.该方法针对故障模式,对故障机理以及对系统的影响、故障检测等进行分析,可直接确认引起事故的故障模式或对事故产生的重大影响进行评价,参见参考文献[1].
(4)马尔科夫分析法:马尔科夫分析法是指在马尔科夫过程的假设前提下,通过分析随机变量的现时变化情况来预测这些变量未来变化情况的一种预测方法.参见参考文献[4].
表1所示是对CPR1000核电项目的S-VDU(Safety-VideoDisplayUnit)所做的FMEA分析实例.
(2)框图法:可靠性框图是利用互相连接的方框显示系统的失效逻辑,分析系统中每一
在实际应用中,由于分析对象的规模、投入分析工作的人数、分析人员的技能水平、计算机
可用率、分析结论的用途以及所处环境情况等的不同,需根据实际情况选择适宜的分析方法,
这一点很重要.表2是上述几种可靠性定量分析方法的比较.
表1FMEA分析实例Table 1An example of FMEA analysis
设备代码 功能 故障模式 故障机理 故障影响 故障探测方法 备注软件错误、I/0 无控制动作或选择码错误 故障机电磁 误触发设备 控制动作 仅影响一个通干扰 操纵员 道或分区动作操纵员操控 软件错误、1/0) 控制动作 使用其他手段SVDU 无信号传输 故障及电磁 无控制动作使用的MMI 干扰 操纵员 操控工作站无控制动作或多重选择码 控制动作 仅影响一个通错误 软件错误 误触发设备 操纵员 道或分区动作
表2可靠性分析方法比较Table 2 Comparison of reliability analysis methods
框图法 故障树法 马尔科夫转移法项 日使用便利性 优 良 差智能水平 中等 中等 高结 果 MTBF MTBF和R MTBF和R电脑工具需求 不需要 大系统需要 非常需要小系统 最小 适当 较多人力 大系统 较多 适当 较多分析难度 一般 较易 较难
分.在系统方案规划阶段,安全性计划就应开始执行;工程建设过程中,持续执行和更新安全性计划是计划实施的主要内容之一.
2 数字化系统可靠性及安全性分 析步骤
参考文献[5]NUREG/CR-6090《PLC及其在核反应堆系统中的应用》统一规范了核电厂数字化系统可靠性及安全性分析步骤,本文依此为基础,结合数字化仪控系统自身功能和特点,针对数字化仪控系统的安全计划、运行要求、系统可靠性、可用度及危险性等方面,对可能适用的分析方法和步骤给出如下建议.
2.2安全运行要求
数字化控制系统在安全方面的要求体现在如下方面:
一正常运行中的部件更换;-RAM的备用电源及电源状态监视;一系统备用电源;一冗余性;-容错性;一系统可用度;一确定事故发生时的安全模式.
2.1安全计划
设置系统生命周期.因生命周期与系统安全性有关,因此需特别予以关注.
2.3危险分析
系统生命周期模式只是安全性计划的一部
确认系统的危险要素,分析系统危险度.
通过分析,确认各危险要素,明确系统对各危险要素应做的响应,继而定义相应的安全功能.分析危险度的方法有FMEA和FTA,考虑到各方法(FMEA:自下而上,FTA:自上而下)的特点,采用并行分析方式将更加有效.危险度分析结果可作为危险度概率定量化分析的基础资料使用.
2.4故障分析
需特别强调,在系统规划阶段进行故障分析的必要性.
系统配置时,确定不安全状态,以此确立系统故障分析基础.以便设计人员在进行系统设计时,采取措施减少不安全状态发生的频率,确认遗留的不安全状态的发生率.
一过电流,过电压;失电;一数字化控制系统启动的初始程序;-数字化控制系统的停机程序;一内存故障;一通信故障;--1/0部件故障;一读取故障;一寻址故障;
CPU与I/O部件故障.
FMEA和FTA是用于系统故障及其影响分析的工具.尽管,与单一故障频繁发生相比,共模故障的发生并不频繁,但故障本身产生的影响却非常严重.
2.5系统可靠性的定量化
在安全性计划阶段,根据系统可靠性要求进行定量化分析.利用多种可靠性分析技术,譬如使用全面及定量的分析方法,加深对系统的了解,促进系统功能可靠性的提升.影响数字化控制系统可靠性的两个主要因素是硬件和软件.上述方法仅适用于硬件分析,考虑软件特性,将另有专门的分析方法.硬件的可靠性定量分析,将在本文第3部分介绍的系统可靠性分析方法中,根据系统特性选择合适的方法进行定量分析.
2.6系统可用度的定量化
在安全性计划阶段,根据系统的可用度的定量化要求进行定量分析.考虑软件难以实现
定量分析的情况,分析可在排除软件因素的情况下进行.根据危险要素进行的可用度计算结果是评价系统安全性的可信依据.
2.7系统危险性的定量化
在安全性计划阶段,根据系统危险率定量化要求进行必要的定量分析.危险率与系统可用度与可靠性以及安全性相关.危险率是指生命、公众或环境中可能潜在的危险发生概率.利用本文第3部分说明的定量化可靠性分析方法,进行危险率的定量分析.
3结论
本文针对可靠性定性和定量分析方法、数学化控制系统的可靠性及安全性分析步骤进行了论述.根据表2所示,定量化的可靠性分析方法涉及系统规模及复杂性,在实际工作中,针对数字化控制系统的可靠性分析要求,遵照本文论述的分析步骤,合理选定分析方法至关重要.文中所列的可靠性及安全性分析执行步骤可作为分析的基本步骤及执行方法的参考,同时应考虑实际系统的具体特性,对所述分析步骤做出相应调整.
核电厂数字化控制系统安全运行的信心是建立在对系统可靠性科学而全面的分析评估基础上,寻求和选择合理的分析方法,进行数字化仪控系统可靠性有效分析,研究开发出完善的可靠性评估系统,实现核电厂数字化控制系统安全可靠运行的量化评估是相关研究工作者共同努力的目标.
参考文献:
[1]IEC60812可靠性分析技术:失效模式和效应分析(FMEA)[S].2006.[2]IEC61078可靠性分析技术:可靠性方框图法[S].2006.[3]IEC61025故障树分析(FTA)2006.[4]IEC61508电/电子/可编程序的电子安全相关系统的功能安全[S].2010.[5]NUREG/CR-6090PLC及其在核反应堆系统中的应用[S]. 1993.[9] National Research Council. Digital Instrumentation andControl Systems in Nuclear Power Plants [S]. 1997.