论文部分内容阅读
[摘 要]DCS控制系统是机组控制的核心部件,在对系统进行升级改造时,应严格按照测试要求,对系统进行各项试验,检查网络系统通信负荷率符合如下要求:所有控制站的中央处理单元恶劣工况下的负荷率均不得超过60%。操作员站、服务站的中央处理单元恶劣工况下的负荷率不得超过40%。数据通信总线的负荷率,以太网应不大于20%,其他网络应不大于40%。
[关键词]DCS;故障;分析;升级
中图分类号:TG552 文献标识码:A 文章编号:1009-914X(2015)36-0047-01
一、DCS在生产过程中的故障情况
1.1 DCS系统本身问题故障实例
此类故障较为常见,主要包括设计安装缺陷,控制器死机、脱网等故障,操作员站黑屏,网络通讯堵塞,软件存在缺陷,系统配置较低,系统接口问题等。
1.1.1电源及接地问题
某厂DCS电源为某公司PMCA95-05型电源,基建时按照SA94013型电源的接地方式进行安装。机组投产后发生多次DCS模件故障、信号跳变、硬件烧坏情况;某某厂因电源连线松动导致汽机侧控制系统失效。
1.1.2系统配置问题
某厂进行机组DCS改造,系统配置负荷率计算不准且为了减少投资,技术指标接近允许极限,调试时个别控制器负荷率超过90%,个别软手操响应接近1min。后经重新增加配置,问题才得以解决。
1.1.3控制器(DPU或CPU)故障
某厂机组系统的主CPU故障,从CPU未能切主控,设备无法操作。对故障CPU执行在线更换步序至停电时,从CPU切换主控CPU成功,更换故障CPU后系统正常。
1.2 人为因素造成DCS故障实例
1.2.1未按规定执行工作步骤
某厂HONEYWELL TPS控制系统,循环水泵房远程I/O卡件更换,未执行在线更换操作步骤,其卡件未能激活进入工作状态,导致现场设备状态与DCS画面不符,设备无法控制。执行在线更换步序后,系统正常。
1.2.2人员误操作
某厂检修人员处理缺陷时,误动DCS继电器柜输出继电器,造成锅炉MFT;某厂DCS卡件故障,由于工作人员未认真核对设备、卡件跳线错誤,导致新更换的卡件烧损。
1.2.3管理制度不完善
某厂辅控网主机USB端口及光驱未进行封闭,个别运行人员夜班期间玩游戏、看电影,导致操作员站死机;某厂未对DCS备份做详细规定,其GUS1操作员站软件升级未备份,后该站硬盘故障,造成系统恢复后该站与网络通讯不正常。
二、DCS系统故障防范及维护措施
2.1 DCS的设计调试
2.1.1可靠性和负荷率指标。系统和控制器的配置要重点考虑可靠性和负荷率(包括冗余度)指标。通讯负荷率必须控制在合理范围内,控制器的负荷率尽可能均衡,避免“高负荷”问题的发生。
2.1.2系统控制逻辑分配。系统控制逻辑的分配,不宜过分集中在某个控制器上,主要控制器应采用冗余配置。
2.1.3电源设计。电源的设计必须合理可靠。注意电源设计中的负荷率和电源的冗余配置方式,以保证有两路独立电源。
2.1.4DCS接口可靠性。注重DCS系统接口的可靠性,注意重要接口的接口方式和冗余度。
2.1.5紧急故障处理。根据设备运行特点和各种工况下处理紧急故障的要求,配置操作员站和后备手操装置。紧急停机停炉按钮配置,应采用与DCS分开的单独操作回路。
2.2 DCS运行、启停维护
2.2.1日常维护系统的日常维护是DCS稳定运行的基础,主要包括以下几点:
(1)根据国标、行标及有关文件规定,完善DCS系统管理制度。(2)电子间封闭良好,保证温湿度、空气洁净度符合制造厂规定。可将电子间的环境温度信号引入DCS监测。(3)每天检查系统各机柜风扇是否工作正常,风道有无阻塞。
(4)保证系统供电电源质量且为两路电源可靠供电,当任一电源失去即报警。(5)电子间禁止使用无线通讯工具,避免电磁场对系统的干扰,避免拉动或碰伤设备连接电缆和通讯电缆等。(6)做好主机USB端口、光驱等的封闭管理工作。规范DCS系统软件和应用软件管理,软件的修改、升级必须履行审批授权规定。
(7)做好各控制回路的PID参数、调节器作用形式等系统数据记录工作。(8)检查控制主机、显示器、鼠标、键盘等硬件是否完好,画面是否正常。查看自诊断画面,是否有故障提示。
2.2.2停运维护
机组检修期间应对DCS系统应进行彻底地维护,主要包括:
(1)利用机组检修时间逐个复位DCS系统的DPU、CPU和操作员站及数据站;进行组态优化,删除组态中的无效I/O点。
(2)对冗余电源、服务器、控制器、通讯网络等进行系统冗余测试。注意系统设备停电时,主从设备切换、网络、人机接口站是否正常;系统检修重新上电后对各设备进行切换测试。
(3)系统灰尘清除:系统停运对所有设备进行清扫吹灰,包括主机、控制站机笼、机柜滤网、风扇等部件的灰尘清理。
(4)接地系统检修,包括端子检查、对地电阻测试;系统供电线路检修,并对UPS进行供电能力测试;检查CPU主机CMOS电池电量,防止CMOS数据丢失。
(5)检查DCS系统和其他系统的接口,重要信号冗余处理;与其他系统的通信视情况采取单向传输或加装防火墙措施。
三.对DCS控制系统升级简要分析
举例说明,某公司DCS控制系统投产于2006年,该系统为某公司第一套采用可视化编程组态的系统,设计上不够完善,在实际使用过程中也暴露了很多的问题。2009年,机组汽包水位自动控制信号突然给到最大值,导致给水泵勺管执行机构开满,引起汽包水位高停炉,经检查为控制逻辑中PID调节模块积分饱和引起;2010年,机组停运,经检查为CPU双机自动切换时出现抢权现象,导致信号误发,机组停运;且该机组中多次出现LCN脱网,画面部分测点无法显示等现象,自检软件对设备脱网无法正常监测;因环境原因,各个机组DCS系统硬件积灰、积粉现象较为严重,引发LCN板故障,造成GUS脱网,无法显示现场实时数据。
2014年,该公司开始对各个机组相继进行A级检修,利用检修机会对各个机组及主机组公用DCS系统进行了升级。为保证整个DCS系统升级后的完整性和兼容性,升级前把单元机组和公用系统网络分开,分步对机组、公用系统、各个机组进行升级,待全部升级完成后,恢复原有网络结构状态,维持原有监视功能和操作习惯。
结语
提高DCS系统可靠性,应从设计、施工、调试、运行维护进行全过程管理。系统维护人员要根据系统配置和生产运行特点,制定科学合理的维护策略和方法,加强系统维护,对运行中出现的故障,具体问题具体分析,及时处理,确保DCS系统稳定可靠运行。
参考文献
[1]李东光,唐丽洁.分布式集散控制系统(DCS)的应用研究[J].中国新技术新产品.2011(02).
[2]耿胜民,吕雪霞,赵武臣.DCS系统防止人为误操作方案的实施[J].东北电力技术.2011(02).
[3]周哲民.提高DCS可靠性的工程设计策略[J].自动化技术与应用.2011(02).
[关键词]DCS;故障;分析;升级
中图分类号:TG552 文献标识码:A 文章编号:1009-914X(2015)36-0047-01
一、DCS在生产过程中的故障情况
1.1 DCS系统本身问题故障实例
此类故障较为常见,主要包括设计安装缺陷,控制器死机、脱网等故障,操作员站黑屏,网络通讯堵塞,软件存在缺陷,系统配置较低,系统接口问题等。
1.1.1电源及接地问题
某厂DCS电源为某公司PMCA95-05型电源,基建时按照SA94013型电源的接地方式进行安装。机组投产后发生多次DCS模件故障、信号跳变、硬件烧坏情况;某某厂因电源连线松动导致汽机侧控制系统失效。
1.1.2系统配置问题
某厂进行机组DCS改造,系统配置负荷率计算不准且为了减少投资,技术指标接近允许极限,调试时个别控制器负荷率超过90%,个别软手操响应接近1min。后经重新增加配置,问题才得以解决。
1.1.3控制器(DPU或CPU)故障
某厂机组系统的主CPU故障,从CPU未能切主控,设备无法操作。对故障CPU执行在线更换步序至停电时,从CPU切换主控CPU成功,更换故障CPU后系统正常。
1.2 人为因素造成DCS故障实例
1.2.1未按规定执行工作步骤
某厂HONEYWELL TPS控制系统,循环水泵房远程I/O卡件更换,未执行在线更换操作步骤,其卡件未能激活进入工作状态,导致现场设备状态与DCS画面不符,设备无法控制。执行在线更换步序后,系统正常。
1.2.2人员误操作
某厂检修人员处理缺陷时,误动DCS继电器柜输出继电器,造成锅炉MFT;某厂DCS卡件故障,由于工作人员未认真核对设备、卡件跳线错誤,导致新更换的卡件烧损。
1.2.3管理制度不完善
某厂辅控网主机USB端口及光驱未进行封闭,个别运行人员夜班期间玩游戏、看电影,导致操作员站死机;某厂未对DCS备份做详细规定,其GUS1操作员站软件升级未备份,后该站硬盘故障,造成系统恢复后该站与网络通讯不正常。
二、DCS系统故障防范及维护措施
2.1 DCS的设计调试
2.1.1可靠性和负荷率指标。系统和控制器的配置要重点考虑可靠性和负荷率(包括冗余度)指标。通讯负荷率必须控制在合理范围内,控制器的负荷率尽可能均衡,避免“高负荷”问题的发生。
2.1.2系统控制逻辑分配。系统控制逻辑的分配,不宜过分集中在某个控制器上,主要控制器应采用冗余配置。
2.1.3电源设计。电源的设计必须合理可靠。注意电源设计中的负荷率和电源的冗余配置方式,以保证有两路独立电源。
2.1.4DCS接口可靠性。注重DCS系统接口的可靠性,注意重要接口的接口方式和冗余度。
2.1.5紧急故障处理。根据设备运行特点和各种工况下处理紧急故障的要求,配置操作员站和后备手操装置。紧急停机停炉按钮配置,应采用与DCS分开的单独操作回路。
2.2 DCS运行、启停维护
2.2.1日常维护系统的日常维护是DCS稳定运行的基础,主要包括以下几点:
(1)根据国标、行标及有关文件规定,完善DCS系统管理制度。(2)电子间封闭良好,保证温湿度、空气洁净度符合制造厂规定。可将电子间的环境温度信号引入DCS监测。(3)每天检查系统各机柜风扇是否工作正常,风道有无阻塞。
(4)保证系统供电电源质量且为两路电源可靠供电,当任一电源失去即报警。(5)电子间禁止使用无线通讯工具,避免电磁场对系统的干扰,避免拉动或碰伤设备连接电缆和通讯电缆等。(6)做好主机USB端口、光驱等的封闭管理工作。规范DCS系统软件和应用软件管理,软件的修改、升级必须履行审批授权规定。
(7)做好各控制回路的PID参数、调节器作用形式等系统数据记录工作。(8)检查控制主机、显示器、鼠标、键盘等硬件是否完好,画面是否正常。查看自诊断画面,是否有故障提示。
2.2.2停运维护
机组检修期间应对DCS系统应进行彻底地维护,主要包括:
(1)利用机组检修时间逐个复位DCS系统的DPU、CPU和操作员站及数据站;进行组态优化,删除组态中的无效I/O点。
(2)对冗余电源、服务器、控制器、通讯网络等进行系统冗余测试。注意系统设备停电时,主从设备切换、网络、人机接口站是否正常;系统检修重新上电后对各设备进行切换测试。
(3)系统灰尘清除:系统停运对所有设备进行清扫吹灰,包括主机、控制站机笼、机柜滤网、风扇等部件的灰尘清理。
(4)接地系统检修,包括端子检查、对地电阻测试;系统供电线路检修,并对UPS进行供电能力测试;检查CPU主机CMOS电池电量,防止CMOS数据丢失。
(5)检查DCS系统和其他系统的接口,重要信号冗余处理;与其他系统的通信视情况采取单向传输或加装防火墙措施。
三.对DCS控制系统升级简要分析
举例说明,某公司DCS控制系统投产于2006年,该系统为某公司第一套采用可视化编程组态的系统,设计上不够完善,在实际使用过程中也暴露了很多的问题。2009年,机组汽包水位自动控制信号突然给到最大值,导致给水泵勺管执行机构开满,引起汽包水位高停炉,经检查为控制逻辑中PID调节模块积分饱和引起;2010年,机组停运,经检查为CPU双机自动切换时出现抢权现象,导致信号误发,机组停运;且该机组中多次出现LCN脱网,画面部分测点无法显示等现象,自检软件对设备脱网无法正常监测;因环境原因,各个机组DCS系统硬件积灰、积粉现象较为严重,引发LCN板故障,造成GUS脱网,无法显示现场实时数据。
2014年,该公司开始对各个机组相继进行A级检修,利用检修机会对各个机组及主机组公用DCS系统进行了升级。为保证整个DCS系统升级后的完整性和兼容性,升级前把单元机组和公用系统网络分开,分步对机组、公用系统、各个机组进行升级,待全部升级完成后,恢复原有网络结构状态,维持原有监视功能和操作习惯。
结语
提高DCS系统可靠性,应从设计、施工、调试、运行维护进行全过程管理。系统维护人员要根据系统配置和生产运行特点,制定科学合理的维护策略和方法,加强系统维护,对运行中出现的故障,具体问题具体分析,及时处理,确保DCS系统稳定可靠运行。
参考文献
[1]李东光,唐丽洁.分布式集散控制系统(DCS)的应用研究[J].中国新技术新产品.2011(02).
[2]耿胜民,吕雪霞,赵武臣.DCS系统防止人为误操作方案的实施[J].东北电力技术.2011(02).
[3]周哲民.提高DCS可靠性的工程设计策略[J].自动化技术与应用.2011(02).