王宏伟教授:综采工作面巡检机器人自主定位方法


研究背景


       海量数据挖掘分析是综采工作面智能化的重要组成部分,对实现综采数据高效利用具有重要意义。许多学者利用人工智能技术挖掘综采工作面设备群海量数据的潜在价值。但由于综采工作面单位时间内数据采集体量大,易受短时电磁干扰等影响,无法保证数据采集的实时性与完整性,容易在采集过程中出现异常数据。通过传统单机计算引擎进行数据的清洗和挖掘分析,读写效率和计算性能的限制使得数据清洗和模型构建速度缓慢,导致决策指令下发具有滞后性,限制了模型从实验室到工作现场实际应用的进一步转换。针对上述问题,本文提出一种综采工作面海量数据挖掘分析平台设计方案。



平台总体架构

       综采工作面海量数据挖掘分析平台由数据源层、数据采集存储层、数据挖掘层、前端应用层组成,如下图所示。

王宏伟教授:综采工作面巡检机器人自主定位方法


平台关键技术


1、 海量数据实时采集存储技术

       工作面传统数据采集系统的数据协议不一且易受现场环境扰动,无法保证数据采集的实时性与完整性,因此使用海量数据采集存储技术完成工作面海量数据的初步汇聚与累积,技术实现流程如下图所示。

王宏伟教授:综采工作面巡检机器人自主定位方法


2、 海量数据清洗技术

       利用大数据组件Hive数据引擎,使用HQL语句编写数据处理条件,通过where条件筛选先剔除不符合实际工况数据的异常值和缺失值,再根据时间粒度统计每段时间内各类数据的采集频次、总值和均值,创建包含以上属性的新数据表,将HQL通过语义解析并优化逻辑执行计划后生成MapReduce任务,提交至Yarn资源管理器执行批处理程序,待清洗过程执行完成后使用insert方法将所有数据存入新数据表并导入HDFS分布式文件系统中。同时将数据表元数据存入MySQL,下次访问可直接根据文件存储路径读取该表内容,避免生成新的MapReduce批处理程序,从而提高数据查询的响应速度,保证后期数据建模运行准确率的同时节省服务器存储空间。


3、 海量数据挖掘技术

       针对传统单机计算引擎无法高效处理工作面海量高价值、低密度工况数据的问题,使用海量数据挖掘技术实现数据挖掘模型在实际生产中的实时调度,技术实现流程如下图所示。

王宏伟教授:综采工作面巡检机器人自主定位方法


4、前端实时可视化技术

       前端应用层基于Java前端框架开发工作面智能管控界面,通过后端集成平台各类数据库API,利用气泡图、热力图、实时线性图等可视化组件关联后端数据库,通过AJAX前后端交互技术定时与后端数据交互并更新部分前端内容,远程通过井上煤矿智能管控中心实时查看各类设备状态和井下人员位置等信息。

      通过关联后端开发组件构建数据挖掘任务,将任务提交至流程引擎生成后端编程代码,根据调度周期及其他环境参数设计HTML提交表单,人工输入各类调度参数并提交至后端定时调度数据挖掘模型,对新的实时数据进行模型应用,通过可视化界面将设备运行状态反馈给管理层及时调整决策策略。



平台测试


1、数据采集存储性能

       为验证平台的数据采集存储性能,设置数据采集周期为200 ms,对某工作面液压支架立柱压力数据进行采集与加载,通过数据库可视化编程界面随机查询在2月28号采集到的某液压支架立柱压力数据,查询结果如下图所示。通过Time字段的时间戳能看到每秒内进行5次数据采集,通过Value字段可看到采集过程中没有出现缺失值,不会因为网络延时和网络阻塞导致数据漏采、局部采集顺序紊乱等问题,充分保证了数据采集过程的实时性与完整性,满足工作面各类监测数据采集的实际需求。

王宏伟教授:综采工作面巡检机器人自主定位方法


2、数据清洗性能

       为验证平台数据清洗性能,分别使用平台中Hive数据引擎和单机MySQL查询引擎对不同体量数据清洗速度进行对比测试,结果如下图所示。可看出当数据量在10万条到2千万条区间内,Hive数据引擎和单机MySQL查询引擎的数据清洗时间相差不大,均维持在20 s左右;随着数据量的增加,单机MySQL查询引擎的数据清洗时间呈线性增长趋势,而Hive数据引擎的数据清洗时间可维持在30 s内,清洗效率约为单机MySQL查询引擎的5倍。

王宏伟教授:综采工作面巡检机器人自主定位方法


3、 数据挖掘性能

       为验证平台的数据挖掘性能,分别使用平台中Spark分布式挖掘引擎和单机Python挖掘引擎对不同体量数据挖掘速度进行对比测试,结果如下图所示。可看出当数据量在10万条以内时,Spark分布式挖掘引擎和单机Python挖掘引擎的数据挖掘时间均可维持在10 s内;当数据量增加至100万条时,单机Python挖掘引擎的数据挖掘耗时60 s,挖掘速度过慢;当数据量增加至200万条时,Spark分布式挖掘引擎的数据挖掘时间依然能稳定在20 s左右,数据挖掘效率是单机Python挖掘引擎的4倍。

王宏伟教授:综采工作面巡检机器人自主定位方法
王宏伟教授:综采工作面巡检机器人自主定位方法

引用格式

王宏伟,杨焜,付翔,等. 综采工作面海量数据挖掘分析平台设计[J]. 工矿自动化,2023,49(5):30-36,126.

WANG Hongwei, YANG Kun, FU Xiang, et al. Massive data mining and analysis platform design for fully mechanized working face[J]. Journal of Mine Automation,2023,49(5):30-36,126.

作者联系方式

王宏伟(1977—),女,黑龙江勃利人,教授,博士,博士研究生导师,主要研究方向为煤机装备智能化、人工智能与5G+智慧矿山等,E-mail:lntuwhw@126.com。通信作者:杨焜(1998—),男,山西长治人,硕士研究生,主要研究方向为工业互联网与大数据开发,E-mail:941077751@qq.com。


特别声明:

本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。

更多精彩内容,关注“传煤”微信公众号,或点击“期刊群”免费获取科研论文

 
用微信扫描左侧二维码,关注“传煤”公众号,第一时间获取煤炭行业新鲜资讯,享全方位煤炭科技知识信息服务。
煤科热搜
版本:Bate 1.2

24小时内最火

  • 1中美CCUS技术发展与政策体系对比
  • 2三质体智能高频细筛在天地王坡选煤厂粗煤泥改造工程中的应用
  • 3规模化CCUS−EOR项目技术经济性分析及启示
  • 4液压支架智能焊接车间制造执行系统研究与应用
  • 5不同装药结构对雷管起爆能力的影响研究
  • 6TBS粗煤泥分选机及应用
  • 7基于数字孪生的多功能煤矿四足机器人实验系统设计
  • 8水源热泵技术应用于深部矿井热害治理−以贵州锦丰金矿为例
  • 9空气重介质振动流化床对黑山露天矿细粒煤的分选效果研究
  • 10基于多传感融合的巷道三维空间映射

24小时内最火

  • 1废弃矿井压缩空气储能技术研究现状与新设计构想
  • 2煤自燃初期低温氧化产热特性及关键结构演变特征
  • 3尾矿资源化利用现状及生态化利用研究进展
  • 4基于光/电催化重整的废弃塑料回收研究进展
  • 5可变气门正时对汽油-氨双燃料发动机燃烧与排放特性的影响
  • 6煤可可的科普之旅|带你了解煤矿含盐矿井水的完美蜕变
  • 7吐哈盆地大南湖煤田西段中侏罗世西山窑组古地理及聚煤模式
  • 8富氧燃烧气氛下废弃物衍生吸附剂脱汞及再生性能
  • 9煤矿地下空间生物质储能及地质保障
  • 10液滴在烟煤表面的润湿特性及驱动机制

24小时内最火

  • 1绿色矿山
  • 2绿色煤矿
  • 3郑传柏
  • 4崔少鹏
  • 5贺提库
  • 6李瑞敏
  • 7鲁光辉
  • 8齐月
  • 9陈新波
  • 10折小江

24小时内最火

  • 1中国煤炭学会
  • 2中国矿业大学 资源与地球科学学院
  • 3中国矿业大学力学与土木工程学院
  • 4中煤科工集团常州研究院有限公司
  • 5 中国矿业大学(北京)力学与建筑工程学院 北京建筑大学土木与交通工程学院 北京建筑大学北京未来城市设计高精尖中心
  • 6 中国矿业大学化工学院 煤炭加工与高效洁净利用教育部重点实验室
  • 7 中国矿业大学资源与地球科学学院 中国矿业大学煤层气资源与成藏过程教育部重点实验室 中国石油长庆油田分公司勘探开发研究院 低渗透油气田勘探开发国家工程实验室
  • 8 中国神华煤制油化工有限公司 中国科学院山西煤炭化学研究所
  • 9 国家能源集团新能源技术研究院有限公司 北京国电电力新能源技术有限公司
  • 10 国能新疆化工有限公司 中国矿业大学(北京)

来对平台产品吐槽CCAJ有关的所有问题您都可以咨询,全天在线,欢迎反馈

Baidu
map