前言
本文基于矿山研究者在矿山安全管理数据挖掘的研究+事事明移动互联网安全生产管理软件的预警信息数据,进行探索性的数据挖掘研究,实践效果仍然需要广大的矿山安全管理者改进并落地。
随着矿山数字化的发展,矿山数字化系统累积了大量的历史数据,有人员信息数据、人员定位数据、人员考勤数据、隐患排查数据、不安全行为数据、矿山地质数据、采矿数据等,这些数据的积累为矿山大数据的分析提供了数据支撑。现阶段单单把安全隐患数据作为预警数据,并没有进行很好的利用,更没有把各类数据之间的联系体现出来。
隐患数据利用仅停留在简单统计和描述
本文通过对矿山大数据进行关联规则分析,发现潜在的有价值的信息,为矿山企业提供决策参考。矿山安全事故的发生大都是存在隐患未及时发现造成的,为了降低矿山开采的风险,许多矿企都实现了双重预防机制建设,及时排查现场存在的安全隐患并录入管理系统进行集中管理,督促相关部门和人员整改及时整改。
由于大部分的系统只是实现了隐患数据的数字化管理,并没有对相关历史数据进行分析,无法从更高的层次保障矿山的安全。因此本文通过利用关联规则挖掘算法对矿山安全隐患历史数据进行分析,防止隐患的再次出现。
▼一、数据来源
经客户允许,本文的安全隐患数据是来源于河南某矿山从2020年1月到2022年7月的事事明预警统计导出的标准化的安全隐患管理数据,共计264933 条安全隐患记录。
事事明预警统计表
▼二、数据清洗
将预警统计的数据进行清洗,如预警事事号(作业地点)、预警发生时间、预警责任部门和风险等级。
数据清洗
▼三、Apriori算法实现关联分析
利用Apriori算法,选取supmin为0.001,confmin为0.5,得到安全隐患数据之间的关联规则。
关联规则数据挖掘结果
上述隐患数据关联规则显示:在14点-22点时间段,'矿1-生产技术科'在'CM102-S32-570-79线削壁采场'作业时有56%以上的隐患是二级风险;在14点-22点时间段,'矿2-生产技术科'在'PD1080-LM41E-1080-9线削壁采场'作业时有55%以上的隐患是二级风险;在14点-22点时间段,'矿3-生产技术科'在'PD846-T17-846-16线削壁采场'作业时有83%以上的隐患是二级风险;统计隐患数据发现,中班(14点-22点)发现安全隐患的概率较高,也间接印证了中班时段生产作业和安全检查最频繁,需要加强上述部门的安全教育培训,提高警惕,避免危险的发生。
通过Aprior算法对矿山安全隐患数据进行的关联规则挖掘和分析,能有效提高安全隐患的排查效率,实现对重点时间重点地点重点人员的特定检查,从源头上消除矿井中潜在的安全隐患,可以避免重大事故的发生。
本文由于预警事事号(作业地点)太分散,需要细化作业地点,继续完善数据关联规则挖掘和分析,获取更有价值的决策数据。
▼四、Apriori算法介绍
关联规则(Association Rule)分析作为一种重要的数据挖掘 方法在数据挖掘领域得到了广泛和深入的研究。关联规则是由R.Agrawal等人针对大型超市购物数据之间的信息挖掘问题提出的。关联规则最初的研究目的是为了发现超市销售数据库中售出物品之间的关联关系,这些规则可以在很大程度上反映顾客的购物行为模式,对于指导商家对商品的摆放和商品的进货具有很大的参考价值。随着近年来网络购物和信息流推荐的快速发展,关联规则挖掘算法受到了更多学者的关注和研究,己成为数据挖掘领域中重要研究方向。
4.1 关联规则基本概念
4.2 Apriori算法介绍
假设支持度计数为supmin=2,则生成频繁项集过程如图4-2所示:
图4-2 Apriori算法生成频繁集过程
参考文献: 李艳斌基于Hadoop的矿山大数据分析平台的研究与设计[D].华北电力大学,2021.