张泽琳1,2 胡 齐1,2 章智伟1,2 王 黎1,2
(1.冶金矿产资源高效利用与造块湖北省重点实验室,湖北省武汉市,430081;2.武汉科技大学资源与环境工程学院,湖北省武汉市,430081)
摘 要 采用图像分析技术对太西无烟煤精煤、中煤和矸石三产品进行了分类预测研究。通过煤岩组分与表面特征分析,从微观到宏观揭示了精煤、中煤和矸石三产品的表观差异性,并为后续煤粒表面特征量化奠定了理论基础。对图像预处理后的煤粒区域针对性地提取了65个特征参数,同时采用箱线图和相关性系数分析提出了特征参数筛选策略,并通过支持向量机建立了三产品分类预测模型。研究结果表明,相关性系数阈值为0.6时,特征参数集及其分类模型最佳,其训练集和测试集的分类准确率分别为92.66%和88.50%,该研究对基于机器视觉的煤炭智能干选机提供了一定的理论基础和技术支撑。
关键词 图像分析 无烟煤 三产品 分类模型
目前,常见的选煤方法为水洗工艺和干选工艺,水洗工艺主要包括跳汰、重介和浮选等,占比达到了80%以上,而基于风选的复合干选、空气重介、碎选等工艺应用不多,主要集中于新疆、内蒙等干旱缺水的地方,然而这些地方的原煤储量巨大,是我国将来煤炭重要供给源。从保护环境、节约水资源以及我国煤炭开发的前景考虑,干法选煤意义重大,是未来选煤行业的发展方向。近年来,基于γ射线、X射线成像光电以及机器视觉的煤炭智能干选机的相关研究和应用日益增多,其节能、降耗、无水、性价比高等优势使其具有较大的市场应用前景,这类技术是煤炭干选领域的一个重大技术突破,为我国干旱缺水地区的煤炭分选提供了一种全新的思路。
智能干选技术是将原煤平铺后,基于传感器和人工智能算法对煤与矸石或多产品进行智能化识别,进而通过高压风或击打装置将产品分开。目前,智能干选机多以γ射线、X射线成像识别为主,机器视觉识别研究较少。选煤厂有经验的工人均能够通过肉眼观察煤料质量并指导相关设备生产,而机器视觉中图像分析技术能够代替人眼来捕捉目标的相关信息,进而实现对矿流的识别与判断。图像分析技术已经被广泛应用于选矿行业,并受到了业内学者的高度重视。
张国英等研究人员提出了一种基于图像分析的原矿石粒度在线检测与分析方法,建立了矿石群中的粒度组成与分布的预测模型;Kistner和Perez等研究人员利用图像分析技术,提取了与矿石粒度高度相关的特征参数,并建立矿石粒度预测模型,实现了矿石粒度的在线检测;Patel等研究人员提取了石灰石基于RGB颜色模型各分量上的加权平均值、偏度和和峰度等9个统计特征,对PNN分类器进行验证,发现模型的错误率低于6%,证明了提出的基于图像分析的模型可以很好地对石灰石进行分类;Ebrahimi等研究人员通过获取矿石表面图像,提取出颜色、光泽、形状、纹理等表观物理特征,用层次分析法(AHP)对提取出的所有特征进行筛选,保留了权重较大的7个特征,并用人工神经网络(ANN)建立了矿石类型预测模型;王团锋等研究人员采用X射线荧光分析法对金矿石进行了在线识别与监测,设计了合适的金矿石分拣平台,成功实现了矿石预分选阶段的抛尾工作,大幅度提高了入选矿石的品质;杨沫等研究人员以煤与矸石表面的灰度信息作为主要的特征参数,设计了一种基于图像分析的煤与矸石自动分类系统,大幅度降低了选煤厂的经济和人力成本。
因此,本文针对无烟煤三产品提出了一种基于图像分析技术的分类方法。首先,通过显微煤岩组分与表面特征分析,从微观到宏观揭示了精煤、中煤和矸石三产品的表观差异性,为无烟煤三产品图像识别与分类奠定理论基础;其次,通过图像预处理、特征提取和筛选以及分类模型的建立对无烟煤三产品进行分类预测。该方法为煤料智能干选设备的开发提供了一定的理论基础和技术支撑。
试验煤样为宁夏太西无烟煤精煤、中煤和矸石三产品,粒级为13~40 mm。通过灼烧称重法,3个密度级产品的灰分分别为7.12%、20.55%和50.32%。
图像采集系统由计算机、工业相机和光源3部分组成,图像像素大小为1280×1024 pixel,试验共获取了1226张煤粒图像,其中精煤612张、中煤302张、矸石312张。图像采集系统和煤粒图像如图1所示。
图1 图像采集系统和煤粒图像
对试验中精煤、中煤和矸石三产品进行显微与宏观煤岩组分分析,结果见表1。
表1 显微与宏观煤岩组分分析结果 %
类型煤岩组分含量精煤中煤矸石显微煤岩组分镜质组97.273.8-惰质组0.92.615.4壳质组0.00.0-无机质1.923.684.4宏观煤岩组分镜煤20~300~10-亮煤40~6010~20-暗煤10~1570~80>95丝炭1~5<5<2
由表1可以看出,不同密度级无烟煤之间显微组分含量、宏观煤岩组分含量均有显著差异,使其从光亮型煤向暗淡型煤转变,导致其颜色、光泽、纹理等物理表观特性的不同。
为了进一步观察和对比精煤、中煤和矸石煤样表观特性的差异,拍摄了20 μm尺度下三产品的SEM表面形貌图像如图2所示,工业相机下拍摄的照片如图3所示。
图2 三产品煤样20 μm尺度下SEM图像
图3 工业相机下拍摄的三产品煤粒图像
由图2可以看出,精煤表面以薄层状结构为主,质地均一光滑,断口较为平整;中煤表面以细条带碎片为主,裂隙增多,断口参差不齐,无规则;矸石表面以致密纤维状和线理状结构为主,磨砂般平滑,内生裂隙不发达。图3中工业相机拍摄图像在表面形貌上与图2中的SEM图像一致,由于煤岩组成的不同导致三产品煤样在颜色和光泽上也呈现出较大的差异性。精煤煤样偏黑色,表面光泽很强,质地均一且易于反光,导致表面偏亮;中煤丝炭和暗煤含量较高,反光性差、表面暗淡且偏黑;矸石主要成分为矿物质,灰分较高,表面平滑致密,质地坚硬,几乎不反光,表面偏灰色。
显微和宏观煤岩组分分析揭示了精煤、中煤和矸石三产品表观差异性的根源,而SEM图像分析和工业相机图像分析更加直观反映了三产品煤粒表面在颜色、光泽和纹理上的差异。上述分析不仅为精煤、中煤和矸石三产品图像分析奠定了理论基础,而且为后续煤粒表面特征量化指明了方向。
为了方便量化煤粒表面特征,需对获取的图像进行预处理,如图4所示。
(1)灰度图与二值图像转化。将RGB彩色原图转化为灰度图,并采用大津法进一步转化为二值图像,将目标区域与背景区域分离。
(2)面积阈值法与孔洞填充。设定面积阈值去除图像区域内小于面积阈值的杂点和细小颗粒,消除后续目标区域识别的误差,进而将目标区域内容的孔洞进行填充。
图4 图像预处理结果
(3)形态学腐蚀处理。试验过程中发现目标区域与背景交接处存在异常亮点,对后续特征参数的提取会产生误差,因此采用10×10 pixel圆形结构体对各目标区域边缘进行腐蚀操作,消除亮点区域。
(4)目标区域标记和截取。在二值图像中对各目标区域进行标记,进而分别提取原图中R、G、B三分量矩阵中对应的目标区域,重建优化后的煤粒彩色图像,最终采用垂直方向上的外接矩形截取各目标区域。
根据煤岩分析与表面特征分析,精煤、中煤和矸石三产品煤粒表面的颜色、光泽和纹理存在较大差异性。最常用的颜色、光泽特征量化方法是基于RGB颜色模型、灰度模型和HSV颜色模型。
选取频率直方图的常用统计特征来量化煤粒表面颜色和光泽信息。Kistner等研究人员指出用基于图像像素的二阶统计特征作为目标的特征参数已经占据了主导地位;Patel等研究人员提取了石灰石基于RGB颜色模型各分量上的加权平均值、偏度和峰度等9个统计特征,建立了石灰石的类型预测模型,并取得了良好的试验效果。因此本文选择频率直方图的均值、标准差、偏度和峰度来量化煤粒表面的颜色和光泽特征。根据前期研究,R分量和B分量、G分量和灰度图像的相关统计特征基本一致,在进行颜色和光泽特征提取时各选其一即可,即提取R分量和灰度图像的均值、标准差、偏度和峰度即可。
本文对比分析了三产品煤粒R、G、B三分量伪彩色图和频率直方图,三产品煤粒原图及R分量伪彩色图和频率直方图如图5所示。
图5 三产品煤粒原图及其R分量伪彩色图和频率直方图
通过观察三产品煤粒H、S、V三分量的伪彩色图和频率直方图,三产品煤粒H分量的伪彩色图和频率直方图如图6所示。
图6 三产品煤粒H分量伪彩色图和频率直方图
针对不同产品煤粒、不同HSV分量之间的显著差异,选择在HSV分量间提取灰度差分统计法、小波纹理、Gabor小波纹理以及灰度共生矩阵纹理特征进行分析对比,最终共提取65个颜色、光泽和纹理特征参数如图7所示。
图7 65个颜色、光泽和纹理特征参数
采用箱线图对三产品煤粒每个特征参数进行对比分析,去除几乎不变的特征参数,筛选出变化较大的特征参数。若部分特征参数变化趋势基本一致,则通过计算其相关性系数,保留阈值以下的特征参数。特征筛选的目的在于减少三产品煤粒分类模型的冗余特征参数,在保留分类精度的前提下提高模型运算速度和鲁棒性。
通过对三产品煤样表面特征的箱线图进行分析,发现共有6种变化趋势(以每一类典型的变化趋势为例),如图8所示。不同变化趋势下的特征参数见表2。
图8 特征参数的6种变化趋势
表2 不同变化趋势下的特征参数
变化趋势特征参数增大T10、T17、T20、T21、T33、T34、T38、T41、T42、T60、T61、T63减小T2、T6、T11、T28、T29、T30、T31、T32、T36、T39、T40、T47、T48、T49、T58、T59先增后减T3、T4、T7、T8、T12、T13、T18、T25、T26、T27、T44、T45、T46、T50、T57、T64、T65先减后增T1、T5、T14、T15、T51单个差异较大T9、T19、T22、T23、T24、T43、T52、T53、T55、T62基本不变T16、T35、T37、T54、T56
除去基本不变的特征参数外,对每个变化趋势下的特征参数进行相关性系数分析。设定相关系数阈值R为0.4、0.5、0.6、0.7、0.8和0.9,对比分析不同R筛选出来的特征参数集相对应的分类预测模型精度。当相关性系数大于R时,则判定两特征参数之间很相似,保留其一;反之,两特征全部留下。R值越小则特征参数越少,反之则特征参数越多。通过不同R值的设定,确定最终保留的特征参数,通过对比三产品分类模型的精度,确定最佳的R值和最合适的特征参数集。增大变化趋势中特征参数之间的相关性系数分析图如图9所示,图中可根据颜色和椭圆形状直观显示特征之间的相关性大小。系数阈值条件下筛选出的特征参数见表3。
表3 系数阈值条件下筛选出的特征参数
R特征参数0.4T1、T2、T3、T9、T10、T13、T14、T15、T18、T19、T22、T24、T51、T530.5T1、T2、T3、T9、T10、T12、T13、T14、T15、T19、T22、T24、T33、T51、T530.6T1、T2、T3、T9、T10、T11、T12、T13、T14、T15、T19、T22、T24、T33、T44、T50、T51、T530.7T1、T2、T3、T9、T10、T11、T12、T13、T14、T15、T19、T22、T24、T26、T28、T34、T44、T51、T53、T55、T630.8T1、T2、T3、T4、T9、T10、T11、T12、T13、T14、T15、T19、T22、T24、T26、T28、T33、T38、T44、T47、T49、T51、T53、T55、T630.9T1、T2、T3、T4、T9、T10、T11、T12、T13、T14、T15、T18、T19、T20、T22、T24、T26、T28、T31、T33、T38、T41、T43、T44、T47、T49、T51、T52、T53、T57、T60、T63
本文采用箱线图中的异常点检测标准,这种方法不需要事先假定数据服从特定的分布形式,没有对数据作任何限制性要求,在识别异常值方面有一定的优越性。取Nl-3IQR~Nu+3IQR为特征参数的正常变化范围,<Nl-3IQR和>Nu+3IQR的数据为异常点。其中Nl为下四分位数,Nu为上四分位数,IQR为Nu与Nl的差值。
选用支持向量机(SVM)作为三产品煤粒分类建模方法,其中主要调整的两个参数为惩罚参数c和核函数参数g。在实际应用中,常用交叉验证法优化这两个参数。交叉验证的基本思想是将原始数据分为若干份,其中一份作为测试集,其余作为训练集,循环建立分类模型,选出平均精度最高的c值和g值,即Bestc和Bestg。其中训练集的数据越多,关于对象的描述就越准确,模型的识别精确度就越高;而测试集用于检测模型的泛化能力,即采用非训练集数据作为模型的输入,输出的分类精确度越高说明模型的泛化能力越强。
分别选用R值条件下筛选出的有效特征参数,对其进行异常点检测后,去除带有异常点数据的煤粒特征,剩余1189组数据。随机选取精煤、中煤和矸石三产品煤粒数据的2/3作为训练集,1/3作为测试集对模型进行训练与测试,每次测试均采用交叉验证方法得到Bestc和Bestg,重复10次取其平均值,并对其预测时间进行对比分析(指煤粒图像预处理、特征参数提取以及分类预测在内的总时间),不同阈值R的训练集和测试集分类准确率见表4。
表4 不同阈值R的训练集和测试集分类准确率
R值特征个数BestcBestg训练集分类准确率/%测试集分类准确率/%预测时间/min0.4144.0000.35088.2984.955.450.5158.0001.00089.7886.436.140.6185.6601.00092.6688.507.580.7214.0001.00092.5488.429.570.8252.8300.35092.4788.6512.760.9328.0000.12593.7389.1515.36
分类测试结果表明,随着R阈值的增加,特征参数个数增多,无烟煤三产品分类精度随之增高,预测时间也随之增加。然而,当R大于0.6时,其训练集和测试集分类准确率相差不大,但特征参数个数差异较大,说明冗余特征增多,对于无烟煤三产品分类模型的实时性和稳定性不利。综合考虑特征参数个数、分类精度以及预测时间,确定R为0.6时的特征参数集及其分类模型最合适,其训练集和测试集的分类准确率分别为92.66%和88.50%。
以无烟煤精煤、中煤和矸石三产品为试验样本,提出了一种基于图像分析的三产品分类预测方法,并得出以下结论:
(1)无烟煤煤岩分析和煤粒表面图像分析可以有效证明煤粒表面颜色、光泽以及纹理等表观特征与其密度级之间存在紧密联系,为无烟煤精煤、中煤和矸石三产品图像分析奠定了理论基础,并为煤粒表面特征的量化指明了方向。
(2)通过图像预处理后,有针对性地提取了8个颜色和光泽特征以及57个纹理特征;采用箱线图对比分析不同密度级煤粒表面特征参数的变化趋势,结合相关性系数提出了特征参数筛选的策略。
(3)采用支持向量机(SVM)建立了煤粒密度级预测模型,利用不同阈值R条件下筛选出的有效特征参数对模型进行训练和测试。综合考虑三产品分类模型的实时性、稳定性和准确性,R为0.6时的特征参数集及其分类模型最佳,其训练集和测试集的分类准确率分别为92.66%和88.50%,具备作为基于图像分析的煤炭智能干选机在线分类方法的潜力。
参考文献:
[1] 王国法, 杜毅博. 智慧煤矿与智能化开采技术的发展方向[J]. 煤炭科学技术, 2019 (1)
[2] 杨硕, 佟建楠. 视觉感知技术在选煤厂的应用研究[J].中国煤炭, 2018 (10)
[3] 张泽琳. 基于图像分析的煤质快速分析方法研究[D]. 徐州:中国矿业大学,2014
[4] M. Firsching, F. Nachtrab, J. Mühlbauer,et al. Detection of enclosed diamonds using dual energy X-ray imaging [J].18th World Conference on Nondestructive Testing, 2012(7)
[5] Y. Wang, C.L. Lin, J.D. Miller. Improved 3D image segmentation for X-ray tomographic analysis of packed particle beds [J]. Minerals Engineering, 2015(83)
[6] 张国英, 邱波, 刘冠洲等. 基于图像的原矿碎石粒度检测与分析系统[J]. 冶金自动化, 2012 (3)
[7] Kistner M, Jemwa G T, Aldrich C. Monitoring of mineral processing systems by using textural image analysis[J]. Minerals Engineering, 2013 (5)
[8] Perez C A, Saravia J A, Navarro C F, et al. Rock lithological classification using multi-scale Gabor features from sub-images, and voting with rock contour information [J]. International Journal of Mineral Processing, 2015(144)
[9] Patel A K, Chatterjee S. Computer vision-based limestone rock-type classification using probabilistic neural network[J]. Geoscience Frontiers, 2016 (1)
[10] Ebrahimi M , Abdolshah M , Abdolshah S . Developing a computer vision method based on AHP and feature ranking for ores type detection[J]. Applied Soft Computing, 2016(49)
[11] 王团锋. 基于X射线荧光技术的金矿石在线拣选方法研究[D].洛阳:河南科技大学, 2017
[12] 杨沫. 选煤厂手选作业煤与矸石自动分选系统的研究[D].淮南:安徽理工大学, 2016
[13] Patel A K, Chatterjee S, Gorai A K. Development of machine vision-based ore classification model using support vector machine (SVM) algorithm[J]. Arabian Journal of Geosciences, 2017 (5)
Zhang Zelin1,2, Hu Qi1,2, Zhang Zhiwei1,2, Wang Li1,2
Abstract The authors used image analysis technique to classified Taixi clean coal, middling coal and gangue the three-products of anthracite, revealed apparent differences of the three products from micro to macro level and established theoretical basis on surface characteristic quantization of coal particle by analyzing maceral specification and surface characteristics, extracted 65 characteristic parameters on target regions after image preprocessing, proposed features selection strategies by using analysis of box plots and correlation coefficient, and built a model of the three-products classification and prediction of anthracite by support vector machine. The results showed that the classification model was the best when correlation coefficient was 0.6 and the classification accuracies of training dataset and test dataset were 92.66% and 88.50%. The research provides a certain theoretical basis and technical support for the coal intelligent dry-sorting equipment based upon machine vision.
Key words image analysis, anthracite, three-products, classification model
中图分类号 TQ533
文献标识码 A
基金项目:国家自然科学青年基金项目(51604196),中国博士后科学基金面上项目(2017M612522)
引用格式:张泽琳,胡齐,章智伟等. 基于图像分析的无烟煤三产品分类预测研究[J].中国煤炭,2019,45(8):66-72,110.
Zhang Zelin, Hu Qi, Zhang Zhiwei,et al. Prediction study on three-products classification of anthracite by image analysis [J]. China Coal, 2019, 45(8):66-72,110.