-
作者
栗婧张志珍杜璇王真刘紫薇辛艳丽
-
单位
中国矿业大学(北京)应急管理与安全工程学院武警特种警察学院情报侦察系
-
摘要
煤矿作为高危行业,企业违章行为记录繁杂。为高效、准确、智能地检索和管理企业违章记录信息,减少违章行为发生,本文以某矿近3年的13 935条违章行为数据库为样本,将违章行为分为3大类23小类,基于计算机文本分类技术,通过Jieba分词器文本预处理、向量空间模型构建、 TF-IDF模型特征值选取、相似度计算等流程搭建了违章文本数据分类器,在Python环境下构建了可视化展示平台并进行分类统计。结果表明:违章操作在总违章行为中占比最高,达到64%,其次为违章行动和违章指挥。同时对各违章子类进行了高、中、低频类别划分,为预防事故发生提供重要数据支撑。
-
关键词
文本分类技术违章行为安全生产煤矿企业
-
基金项目(Foundation)
中央高校基本科研业务费专项资金(2021YJSAQ12);
-
文章目录
1 违章数据分类规则
(1) 确定范围。
(2) 寻找符合的切入点。
(3) 考虑是否需要细分和补充。
(4) 确认是否有遗漏或重复。
2 违章文本分类器
2.1 文本预处理
2.2 构建向量空间模型
2.3 特征值选取
2.4 相似度计算
2.5 分类结果检验
3 违章文本分类可视化平台搭建
3.1 违章分类结果展示及统计分析
3.2 违章子类频次分类分析
4 结 论
-
引用格式
栗婧,张志珍,杜璇,王真,刘紫薇,辛艳丽.基于文本分类技术的煤矿违章行为统计方法研究[J].矿业科学学报,2022,7(03):344-353.DOI:10.19606/j.cnki.jmst.2022.03.009.