《电子技术应用》

基于不同冗余结构的PLC系统可靠性与可用性研究

2016年电子技术应用第9期
孟 君
(神华集团有限责任公司,北京100011)
摘要: 冗余PLC是提高工业控制系统可靠性的重要手段,作为一种有效的容错技术已在诸多领域获得广泛应用,而在实际应用中,如何依据应用环境选择合适的冗余结构却是面临的现实问题。基于可靠性基础理论,分析了单系统、2单元并联冗余系统、3取2表决冗余及2乘2取2冗余PLC系统的可靠性及平均故障时间(MTBF),并对比了不同冗余结构可靠度及MTBF随单元故障率的变化关系,同时分析了典型冗余结构PLC系统的可用性。研究成果为实际应用环境中冗余结构的选择提供了有效依据。
中图分类号: V24.1
文献标识码: A
DOI:10.16157/j.issn.0258-7998.2016.09.021
中文引用格式: 孟君. 基于不同冗余结构的PLC系统可靠性与可用性研究[J].电子技术应用,2016,42(9):80-83.
英文引用格式: Meng Jun. Reliability of PLC system using different redundant structure[J].Application of Electronic Technique,2016,42(9):80-83.

Reliability of PLC system using different redundant structure

Meng Jun
(Shenhua Group Corporation Limited,Beijing 100011,China)
Abstract: Redundant PLC system is the important way to improve the reliability of industrial control system, which was widely used in many fields as an excellent fault-tolerant solution. However, suitable selection of redundant structure according to the practical application was an inevitable problem in the actual application environment. The reliability and MTBF(Mean Time Between Failures) of single element system, parallel redundancy, triple-module redundancy and double 2-vote-2 redundancy system are analyzed based on basic reliability theories, and the relationship between reliability, MTBF and failure rate of different redundant structure were discussed. The research achievements can provide effective theoretical guide for suitable selection of redundant structure in practical applications.

0 引言

  PLC(Programmable Logic Controller)系统被广泛应用于航空航天、军事、国防等诸多关键领域,这些领域对基于PLC控制系统的可靠性有极高要求,如何选择合适的措施提高系统可靠性已成为人们关注的研究课题[1]。鉴于各领域使用的控制系统越来越复杂、功能越来越丰富及各领域对系统可靠性的高要求,现今对重要控制系统的设计理念已由过去以功能、性能为中心逐渐向以可靠性为中心转变[2]。系统设计中存在的物理缺陷、设计不完善、软件错误等造成的系统故障是导致系统不可靠的重要因素。故障容错是提高系统可靠性的主要技术手段之一,该技术可以自动诊断设备的故障,并采取相应的措施保证设备维持其规定功能,或牺牲性能来保证设备在可接受的范围内继续工作[3-4]。

  以冗余设计为代表的故障容错技术是提高PLC控制系统可靠性的有效措施,在现代导弹武器系统、装备制造、航天测发控、发电输电系统、铁路等领域发挥着越来越重要的作用[5-6]。冗余技术一般通过增加多余的组件来保障系统功能,根据PLC系统的冗余对象可分为CPU冗余、通信模块冗余、输入输出模块冗余、电源冗余等。根据冗余实现方法分为硬件冗余和软件冗余两类。PLC软冗余是一种比较经济的可靠性提高方法,软冗余系统的主备切换时间为秒级,使得软冗余方式在实时性要求较高的领域适用性不强。硬件冗余功能的实现由专门的冗余模块来实现,处理器的同步机理多为定时同步或事件同步,短同步因周期短保证了主备切换时间能达到毫秒级(大到几十至几百毫秒),发生故障切换时,主备切换的快速响应能使存储数据不丢失、外设I/O状态不发生改变的情况下实现快速切换,大大保证了系统生产运行,因此在重要工业控制领域得到推广应用,常用的有双机热备、3取2冗余、四模冗余、2乘2取2冗余等[7-9]。实际应用中如何依据不同环境对可靠性及可用性的需求来选择合适的PLC冗余方案是值得探讨的问题,本文基于可靠性基础理论,重点针对不同冗余系统的可靠度及MTBF(Mean Time Between Failures)展开分析,并讨论可靠度及MTBF随故障率的变化关系。同时初步对比了典型冗余系统在相同条件下的可靠性及可用性,以期为实际应用中PLC冗余系统的选择提供理论依据。

1 可靠性与可用性基础理论

  PLC系统的可靠性一般可以通过故障率(Failure Rate,又称失效率或风险率)、可靠度、平均故障时间 MTBF等来表征。

  平均故障时间是指系统相邻故障期间的正常工作时间的平均值,用MTBF表示;故障率是指工作到某时间的机器、零件或系统,在连续单位时间内发生故障的比例,用?姿(t)表示。可靠度是指系统无故障正常工作状态的概率,用R(t)表示,它是规定时间t的函数,规定时间越长,R(t)越小。设F(t)表示失效分布函数,则有:

  QQ图片20161112103101.png

  故障率与可靠度之间的基本关系为:

  QQ图片20161112103105.png

  其中,f(t)=dF(t)/dt为失效密度函数。

  鉴于电子产品及控制设备的失效分布大致服从参数为?姿的指数分布,则有:

  QQ图片20161112103209.png

  QQ图片20161112103212.png

  QQ图片20161112103216.png

  由定义可知:

  QQ图片20161112103221.png

  根据可靠度性质:

  QQ图片20161112103228.png

  则平均故障时间MTBF为:

  QQ图片20161112103234.png

  系统可用性是指当需要时系统在该时刻处于正常可用状态的能力,一般通过可用度来表征,可采用马尔可夫模型方法分析得到[10]。

2 不同冗余结构的可靠性与可用性分析

  2.1 并联冗余系统

  当控制系统为并联的主备冗余系统,系统由n个单元组成,其中1个主单元决定系统数据输出,其余单元作为冗余备份,当主单元故障时,其中某一备份单元接替主单元继续工作。并联冗余系统框图见图1。

图像 001.png

  并联冗余控制系统中每个单元可看作是相互独立的概率事件,设每个单元的可靠度分别为Ri(t),单元不可靠度为Fi(t),由乘法原理可得并联冗余系统的不可靠度为:

  QQ图片20161112103239.png

  从而推导可得并联冗余系统的可靠度为:

  QQ图片20161112103243.png

  对于单元数为2的并联冗余控制系统,设每个单元可靠度为Ri(t)=R(t),则根据上式可得系统可靠度为:

  QQ图片20161112103247.png

  结合式(4)及式(11)可得:

  QQ图片20161112103251.png

  结合式(8)及式(12)可得:

  QQ图片20161112103255.png

  由上述结果可知,冗余度越高,可靠性相应越高,同时对硬件资源需求也越大。设某时刻各相同单元的可靠度R(t)为0.9,则由2个上述单元构成的并联冗余系统可靠度为0.99(提高了0.09),由3个上述单元构成的冗余系统可靠度为0.999(仅提高了0.009),而上述冗余系统的资源投入分别提高了1倍和2倍。上述结果表明可靠度的提高并不随冗余度增加而线性提高,实际应用中要权衡可靠度需求与投资情况选择合适的冗余结构。

  对于典型的并联冗余系统,其可用度为(假设等效单元的故障率为QQ图片20161112104113.jpg姿、维修率为QQ图片20161112104116.jpg滋):

  QQ图片20161112103300.png

  其中:

  QQ图片20161112103305.png

  由此可见?琢越大,可用度越高,一般可通过选择故障率低的元器件或提高维修效率来提高系统可用性。

  2.2 表决冗余系统

  并联冗余结构能有效提高系统可靠性,而实际应用中其容错配置方式存在一定争议,如典型的双机热备系统,由于主备机之间缺少一个仲裁者,输出结果谁对谁错就是一个问题。基于多个单元的表决冗余系统却能很好地解决上述争议,通过多数表决可以大大提高输出结果的正确性。典型n/k表决冗余系统的结构如图2所示,其中单元数为n,表决数为k,n个单元的输出结果经过n/k表决器后裁决输出,当n单元表决系统中有k个及以上单元完好时,就能完成规定功能,而系统中故障单元数超过n-k个时,输出结果表决为无效,系统输出安全态。

图像 002.png

  对于单元数为n、表决数为k的表决冗余系统,系统可靠度表达式为:

  QQ图片20161112103308.png

  设故障率为常数?姿,则系统平均寿命为:

  QQ图片20161112103312.png

  典型的单元数n=3、表决数k=2的表决冗余系统,其可靠度为:

  QQ图片20161112103315.png

  系统平均故障时间MTBF为:

  QQ图片20161112103319.png

  根据可用度定义可知系统可用度为:

  QQ图片20161112103323.png

  其中,MTTF指平均无故障时间,MTTR为平均修复时间。根据马尔可夫模型可知,三取二冗余系统MTTF为[11]:

  QQ图片20161112103326.png

  2.3 2乘2取2冗余系统

  2乘2取2冗余系统的结构框图如图3所示。系统由主、备两系组成,其中每系内部的两个运算单元形成2取2表决冗余结构,两系间通过并联冗余的方式实现数据输出。

图像 003.png

  由图3可知,主系内部运算单元A1、A2,备系内部运算单元B1、B2分别构成典型的2取2表决冗余结构,假设4个单元的可靠度均为R(t),由式(4)及式(16)可计算得出单系2取2冗余结构的可靠度及不可靠度分别为:

  QQ图片20161112103331.png

  QQ图片20161112103334.png

  根据式(4)、式(11)及式(12)推导可得系统整体可靠度为:

  QQ图片20161112103338.png

  根据式(8)及式(22)推导可得系统平均故障时间为:

  QQ图片20161112103343.png

3 不同冗余系统特性对比

  冗余系统的可靠性与单元的故障率有直接关系,对比单系统、2单元并联冗余系统、3取2表决冗余系统、2乘2取2冗余系统的可靠度R(t)与MTBF随故障率的变化关系分别见图4、图5。

图像 004.png

图像 005.png

  由图4、图5可知,在较低的单元故障率下,单系统可靠性普遍低于其他冗余系统。2单元并联冗余系统的可靠度在各阶段都较高。由于3取2表决冗余、2乘2取2冗余系统在保障系统可靠性的同时,基于表决机制保障了输出结果的正确性、安全性,系统复杂性的提高使得系统整体可靠性受单元故障率的影响明显,当单元故障率较低时,表决冗余系统的可靠性介于单系统及2单元并联冗余系统之间,而随着单元故障率增大,3取2表决冗余、2乘2取2冗余系统的可靠性显著劣化,尤其当单元故障率分别高于0.5及0.7时,表决冗余系统的可靠度甚至低于单系统可靠度。

  2单元并联冗余系统的平均故障时间MTBF最高,高于单系统的平均故障时间,较适于提高长期运行控制系统的可靠性(如过程控制、工业制造等)。3取2表决冗余、2乘2取2冗余系统的MTBF受系统复杂性的影响低于2单元并联冗余系统及单系统,而当单元故障率较低时,上述表决冗余结构在确保了系统可靠性的同时,保证了输出数据的正确性,进一步提高了系统安全性,较适于在较短运行周期内保障系统可靠性的同时对安全性有较高要求的应用场合。

  冗余系统的可用性比单机系统更高,同时,与系统可靠度一样,可用度随系统维修率、维修效率、故障率等因素的影响而产生变化,实际应用中需要针对实际应用情况权衡系统可用性需求进行可用性设计。假设不同冗余系统各等效单元的故障率、维修率均相同,且当故障率QQ图片20161112104113.jpg姿较低时,各冗余系统特性如表1所示。

图像 006.png

4 结论

  (1)对于冗余系统而言,单元故障率对整体系统可靠性有很大影响,如果无法保证单元的高可靠性,则冗余结构对整体系统可靠性的提高非常有限,因此设计中如何提高单元可靠性仍是核心工作。

  (2)2单元并联冗余系统的可靠度和 MTBF较其他系统而言优势明显,是提高一些长期运行控制系统可靠性的有效措施,但是在结果正确性方面的保障较弱。而当单元故障率较低时,3取2表决冗余结构、2乘2取2冗余结构在确保了系统可靠性的同时,保证了输出数据的正确性,进一步提高了系统安全性。

  (3)同一冗余系统在不同单元故障率阶段表现出不同的可靠性,因此实际应用中一般需要根据不同应用场合及对可靠度、平均寿命及安全性的特别需求选择合适的冗余方案。

  (4)系统可用性是保证系统在特殊使用条件下满足可用条件的重要依据,尤其对于一些长存储周期而在短时间窗内需要高可用性的设备而言(测发控系统、发射车),必须考虑选择有效措施以提高系统可用性(如提高维修效率、降低元器件故障率等)。

  参考文献

  [1] 吕京梅.PLC软冗余系统的研究与应用[D].西安:西安电子科技大学,2008.

  [2] 谷岩.CZ-2F火箭可靠性技术[J].导弹与航天运载技术,2004(1):13-19.

  [3] LEVITIN G,LISNIANSKI A.Structure optimization of multistate system with two failure modes[J].Reliability Engineering and System Safety,2001,72(1):75-79.

  [4] 陈加杰.中型PLC冗余架构研究与同步技术实现[D].哈尔滨:哈尔滨工业大学,2008.

  [5] 王新宝,方苏民,叶道益.硬件冗余技术在提高汽轮机数字控制系统可靠性中的应用[J].汽轮机技术,1996,38(2):88-94.

  [6] MARCOS J,MANDADO E,PENALVER C M.Implementation of fail-safe control systems using programmable logic controllers[J].Industrial Automation & Eontrol,1995:395-400.

  [7] FAVALLI M,METRA C.TMR voting in the presence of crosstalk faults at the voter inputs[J].IEEE Transactions on Reliability(S0018-9529),2004,53(3):342-348.

  [8] 张本宏,陆阳,韩江洪,等.“二乘二取二”冗余系统的可靠性和安全性分析[J].系统仿真学报,2009,21(1):256-261.

  [9] 陈州,倪明.三模冗余系统的可靠性与安全性分析[J].计算机工程,2012,38(14):239-241,245.

  [10] 刘冲,付江梅.双重冗余PLC控制系统的可靠性与可用性研究[J].自动化仪表,2010,31(9):44-46.

  [11] 周利艳.3取2冗余配置主处理单元可用性研究[J].电子世界,2006,5(1):190-191.

  


继续阅读>>