一、前端设备运维管控业务分析
大多物联网系统部署完后,前端设备在线率下降的很快,主要因为前端设备通常部署在工况复杂、供电通信不稳、野外场所等场景下,而甲方维护人员对于前端设备运行工况常常无法获取知,又添加了对设备及时维保的难度。整个系统中设备运行的状态参数(指从传感器和控制器中取得的能够反应设备运行工况和健康状态的数据)、设备运行的工况数据(设备的负载、转速、运行模式等工作条件的设定信息)、设备使用过程中的环境参数、行为破坏信息、设备运行质量评价参数等都无法得到有效的感知和发现潜在风险、未雨绸缪,确保物联系统整体运作能力。
一般来说,通过构建数据驱动与维保规程相结合的智能维保模式,通过运维历史数据与设施设备的基础数据,实现设备状态智能监测、健康预测管理、智能运维决策、业务流程建模与优化,对设施设备健康状态进行预测评估,并进一步结合设施设备维护保养规程,科学规划维护保养计划,有效规范业务工作流程,合理调配维护保养备件资源,减少维护保养的盲目性,实现运维管理任务全流程电子化,提高维护保养效率,使物联网的设施设备始终处于较高水平运行。
对于大部分前端设备而言,其本身是不具备推送自身工况能力的,例如单一的传感器、PLC控制板、IO模块等,我们要感知他们的供电状况、通信状况、工作态势等就需要借助额外的辅助手段来获取。因此就提出了通过前端智能监控箱(室内、外设备箱)接入,智能监控箱要求具备设备准入功能,实现非IPC类设备隔离,支持MAC、端口、802.1x及SMEPSNOOPING协议探测认证等策略进行接入;支持可对接入以太网交换机端口的摄像机进行授权认证,隔离非摄像机设备能力;支持远程控制以太网设备端口连接功能,远程关闭空闲冗余端口,使该端口无法接入任何设备,同时可通过运维管理实现远程开启该端口,使该端口授权设备接入功能。结合后台运维管理系统,为前端设备提供智慧运维,做到事前预判,事中管理,事后分析,有效的解决前端设备故障发现不及时、故障处理滞后的问题。
二、前端设备智能接入解决方案
2.1 前端智能设备管理设计要求
有别与物联网准入安全防护产品,
(物联网边缘-物联网准入或接入安全防护产品及解决方案_py_free的博客-CSDN博客),
前端监控主要用于前端设备应用或服务的远程部署、固件升级、维护、监控管理,以及对前端设备的设备态势、IT资源、流量资源实时监测,并基于采集信息进行资源调度管理和健康诊断,并辅以远程桌面工具支持人工远程维运。通常具备但不限于以下能力:
- *固件升级模块会实时监测本地和最新版本比对,发现云端有新固件包时,及时加载到本地,进行固件包解压、迁移等作业,结合服务监控和参配管理功能模块实现对应应用或服务的版本更新。
- *服务监控可以控制边缘应用或服务的启动、退出、暂停等态势变更。日志服务统一前端服务和管理模块及提供统一日志记录接口。
- *流量监测主要针对前端设备的通信接口如RJ45、RS232等接口的通信流量实时监测与统计分析、分类分析。
- *资源调度会实时监测前端设备的磁盘空间、CPU使用、内存使用等信息,进行阈值校对与资源管控。
- *远程桌面分为远程可视化桌面工具和远程命令行工具,针对不同前端设备情况部署,便于设备的在线远程维运。
- *前端管理模块和云端构建多种通信信道,实现文件传输、日志同步、时间协同、消息队列等多种通信要去。
- *远程桌面分为远程可视化桌面工具和远程命令行工具,针对不同前端设备情况部署,便于设备的在线远程维运。
- *资源调度会实时监测前端设备的磁盘空间、CPU使用、内存使用等信息,进行阈值校对与资源管控。
- *流量监测主要针对前端设备的通信接口如RJ45、RS232等接口的通信流量实时监测与统计分析、分类分析。
- *服务监控可以控制边缘应用或服务的启动、退出、暂停等态势变更。日志服务统一前端服务和管理模块及提供统一日志记录接口。
2.2 方案简述
前端设备管控主要分为前端智能监控箱和监控箱智能运维平台两部分。
【1】智能监控箱
内部通常采用模块化设计,分为监控区、供电区、通讯设备区。
其中,监控区配置智能控制单元,对前端监控系统的供配电、电源防雷、设备状态感知、设备控制、安全防范等进行一体化设计,维护简单易操作;
供电区安装空开、电源防雷等;
通讯设备区安装交换机、熔纤盘等设备。
监控箱增加了对前端设备的运维管理功能,能够随时掌握前端设备的运行状态,具备智能监控功能,支持市电检测、用电监控、视频故障分析、网络故障修复、远程重启控制、网络传输监控、柜内温度监控、监控箱防盗等功能。
通常采用不锈钢201外壳,防水密封,接口全部采用航空插头,耐用可靠。内部可集成开关电源模块、智能传感器、防雷模块、串口模块、交换机等配件,把强电弱电部分分离,各项功能模块分类安装。配套的后台设备运维管理系统,能够远程监控智能箱自身及外接设备的状态(如设备状态、电源状态、网络状态、箱体开合状态、箱体环境状态等),处理工作异常或设备故障(智能巡检、自动告警、故障设备定位、设备自动上线等),实现远程管理(信息查询、参数配置、远程开关、自动同步等)。所有的电源、传输设备、防雷器等辅助设备都安装在设备箱内,内部安装架的设计充分考虑设备的安装位置,同时具有防雨、防尘、防高温、防盗等功能。
【2】 监控箱智能运维平台
运维平台实现前端设备的远程集中监控,可以真实记录设备运行状态,生成各种类型的统计报表供决策参考。通过监控中心平台软件,管理人员可实现对前端设备的管理,远程实时查看前端设备运行情况,操作设备供电状态。当前端设备出现异常时,监控中心可通过多种形式通知管理人员,并形成派工单,通知维护人员,及时进行故障排除。
2.3 功能设计
【1】状态监测与报警
箱体可实现对前端运行设备的供电状态、网络状态、环境状态、安防状态的实时监测并上传数据到后台,对状态发生异常的可立刻向后台报警。
1.供电状态。对电源的输入/输出状态实时监控,发生电源故障时实时上传报警。条件许可情况下可配置后备电源,满足断电后智能机箱和AC220V供电的网络交换机或ONU设备可持续工作一段时间。
2.网络状态。对传输网络的通讯状态实时监控,发生网络通讯故障时实时上传报警,当网络传输断开时,可自动进行重启,重启次数可设置。
3.摄像机状态。对摄像机状态实时监控,当接入的摄像机断电或网络断开时,可实时上传摄像机故障报警,可支持不小于8路外接摄像机状态检测。
4.环境状态。对箱体内部环境温度实时监控,具有温控风扇功能,可远程调整风扇温控阈值,确保所有设备处于正常工作环境。
5.安防状态。对箱门的开启或关闭状态实时监控,可设置箱门布防撤防。可设置运维期间临时撤防,超过设定撤防时间可自动布防,布防状态下箱门开启时实时上传报警。
6.防雷状态。对电源防雷模块的状态实时监控,发生雷击情况造成防雷模块失效时上传报警。
7.补光灯状态。对补光灯的状态实时监控,分析补光灯工作状态,能够区分补光灯白天异常亮起或晚上无法开启,发生补光灯故障时实时上传报警。
【2】控制管理
箱体可实现运行指标管控、远程控制,自动启停,准入管理。
1.运行指标管控。后台可实时在线统计视频总数、视频在线率、故障及时修复率(修复阈值时间可设)、视频掉线列表、告警情况。
2.远程控制。后台可对前端的输出电源远程控制,进行通、断电操作,实现设备重启等功能。交流输出接口具有定时控制、远程控制功能,可远程设定工作模式。
【3】智能维护
箱体数据对接运维管理系统,配置相关后台配套服务器硬件,并同步数据至市局相关系统,确保考核数据实时同步。
后台应用可基于B/S、C/S平台架构,支持基于地理化信息显示的设备管理方式,设备运行状态、告警显示、状态统计、维护管理、工单管理、日志审计功能。通过对数据的分析,可多维度、可视化呈现前端设备的健康度、运行状态、故障类型等。
2.4 监控箱设计
设备箱应适合户外环境使用,具备防雨、防尘、抗紫外线(耐老化)、防盗、防锈;箱体具有明显标识,表明设备箱用途及箱体编号;箱体大小根据配套设备的数量和尺寸来设计,与杆体大小协调,保证有充足的空间,方便设备安装和维护。采用整机设计整洁、美观、一体化电源,网络集成设计。
箱体空间保证设备正常安置;采用自然散热,无风扇设计;充分考虑使用地区的工作温度范围、工作湿度范围,工作电压范围以及防护等级要求。
在箱体安全设计方面,箱体必须考虑电源防雷、通信防雷功能,箱体内设置接地排,接地排与接地体有效连接。接地体施工应符合 国标的规定。箱体外门尽可能采用机械锁,机械锁采用三角转舌锁,具有防盗防破坏功能。
2.5 箱体供电保障及器件选择建议
【1】 供电保障建议
1.总供电输入来自市电供电系统,支持380AC、220AC电流接入。
2.总输入电路需要漏电开关进行输入保护,需要通过智能电表进行用电监控
3.部署在节点的摄像机、传感器等末端设备以及内置在智能箱体内的工业交换机、PLC控制器等通信设备,其的供电需要通过可控固态继电器或电源控制器进行输入供电控制,实现这些设备供电开闭态势监控。
4.工业环网交换机、PLC控制、节点网关设备等设备其供电保持常供电。
【2】电器选择建议
1.电子式自动重合闸保护器,RS485接口
2.防浪涌保护器(防雷器)
3.可控固态继电器,RS485接口
4.接近开关传感器,用于安防箱门的开闭状态
5.温湿度传感器,用于安防箱内的温湿度
【3】设备联网设计建议
1.智能箱内置一个光纤交换机,例如其具有2光N电的接口,支持冗余协议(SW-Ring)以实现环网通信。
2.智能箱内置一块智能控制器,支持RS232、RS485、干接点等接入能力,实现箱体内温湿度传感器、门开关传感器、防雷器等设备接入,该控制器通过RS485转以太网接入网络,实现异构网络接入。
注:通过环网交换机构建以太环网,任何一个网络节点都只有两个相邻的节点。在一个典型的冗余环网中,有一个主交换机,其余为从交换机。正常工作时,交换机的其中一个连接端口会被置为阻塞状态,阻止以太网数据帧转发,仅允许转发冗余控制帧,保证了物理上是一个回路,但是没有逻辑回路。在通信链路发生故障的时候,启用另外一条健全的通信链路,使网络通信的可靠性大大提高。
2.6 运维管理设计
运维管理平台可以基于B/S、C/S平台架构,支持基于地理化信息显示的设备管理方式,设备运行状态、告警显示、状态统计、维护管理、工单管理功能,为监控系统运行提供高度集成化、高可靠性、易维护的配套平台。
平台具有但不限于以下功能:
- 支持运行指标管控,实时在线统计视频总数、视频在线率、故障及时修复率(修复阈值时间可设)、视频掉线列表、告警情况,支持标识位置信息,并显示设备信息、工作状态(正常、异常、离线)。
- 支持设置设备运维、网络运维、电力运维,并可以生成统计报表。
- 支持通过时间、品牌等条件对外接摄像机故障率、在线率以柱状图或折线图展示统计报表;支持设置各类告警的告警等级;支持设置不同告警的处理时效。
- 支持根据经纬度直接在地图上标记展示各监控点位分布情况,并直观反映各点位的基本信息、设备信息、工作状态,包括正常、异常、离线等情况。
- 可详细了解到单个点位的供电情况、环境温度情况及设备的工作状态,可远程控制设备断电重启、设定设备参数。
- 支持分设备类型统计设备当前情况,支持导出设备列表。
- 支持自动派单和手动派单,详细记录工单处理过程。
- 支持批量对前端设备箱进行固件升级,支持离线升级、断点续传、版本自动匹配升级。
- 提供统一的API接口,实现与智慧安防管控平台做集成对接。例如基于RESTful,数据格式从采用json传输,为了划分请求的权限,为API接口提供了token认证等。
三、技术方案的难点、痛点
【1】精准定位故障,细化故障原因
是否能精准区分供电、网络、设备故障种类;细化判断故障现象,支持供电异常、供电过压、欠压、漏电、非法取电、供电故障、网线故障、补光灯工作异常、网络异常、非法接入、温湿度异常、风扇故障、防雷故障、箱门异常开启、箱体震动、箱体倾斜等2种故障现象的检测。
【2】确保警准确有效
针对前端供电故障、网络故障、流量故障,后端平台具备多重状态检测确认机制,提供告警准确性。采用聚类算法、根因分析、决策树等算法进行大数据、多维度数据分析,提供告警有效性。
【3】在有限尺寸内合理布局、便于安装调试
内部PCB板载模块走线连接,要杜绝减少人工连线故障隐患,必须强弱电分开布局。 支持平台对前端智能箱批量参数设置、输出控制、固件升级,方便施工部署过程中的安装调试。
【4】高可靠性确保设备在线率
支持工业级工作温度范围和专业的室外防雷,电源支持短路、过载、过压、欠压、漏电等电气保护措施。采用零中断供电技术,智能箱复位时供电不会停止,继续对摄像机和网络设备供电,保证智能箱重启阶段视频业务零中断。
【5】傻瓜式可视化运维管理
支持基于地理化信息显示的设备管理方式,设备运行状态、告警显示、状态统计、维护管理、工单管理等功能,为监控系统运行提供高度集成化、高可靠性、易维护的配套平台。
本文章来源于互联网,如有侵权,请联系删除!原文地址:物联网运维-前端设备运维管理设计及解决方案
一、MQTT基础理论了解 目前在做的项目里边涉及到了物联网这一块,在进行服务器和设备端通信的时候,用到了mqtt这一通信协议,既然要用到一门技术,首先要了解技术的基础原理->(3条消息) MQTT–入门_似水流年-CSDN博客_mqt…