《中国煤炭杂志》官方网站

何 继1,崔瑞豪2,李虎民1,王 磊3,马 飞3,王培俊4

(1. 内蒙古蒙泰不连沟煤业有限责任公司,内蒙古自治区鄂尔多斯市,010300;2. 中国矿业大学环境与测绘学院,江苏省徐州市,221116;3. 华电煤业集团数智技术有限公司,北京市房山区,102400;4. 中国矿业大学公共管理学院,江苏省徐州市,221116)

摘 要 人工植被重建是矿区土地复垦与生态修复的基础性工作,分析人工植被重建效果是评价生态修复质量的重要环节。以内蒙古蒙泰不连沟煤矿土地复垦示范区为主要研究区,采用无人机搭载多光谱相机进行数据采集,并应用3种常见的机器学习算法,综合地物光谱、纹理的差异提取人工植被。在此基础上,选取植被生物量指标,分析研究区坡顶人工植被生长状况,并评价其植被重建效果。研究结果表明,对机器学习分类方法进行超参数调优能够有效提升模型分类精度,超参数调优后随机森林分类模型分类精度最高,总体精度为82.11%,Kappa系数为0.77;使用随机森林模型获得的反演结果精度最高,其R2为0.93,均方根误差为13.97。示范区坡顶的草本植被重建效果欠佳,有接近66.6%面积区域生物量等级处于0~50 g/m2的范围;灌木重建效果较好,有接近61.4%面积区域生物量等级处于100~150 g/m2的范围。

关键词 无人机遥感;人工植被重建;矿区土地复垦;超参数调优

煤炭开采对矿区周边地区的生态环境造成的损伤仅靠自修复难以解决[1-2],需要采取以人工修复为主的植被重建修复策略,帮助矿区周边地区的植被环境恢复至采前水平[3],合理的植物群落结构配置有利于植被环境的快速修复。由于我国西部地区自然环境较恶劣,经过破坏后的矿区自然修复过程极其缓慢,因此需要进行人工干预,借助整形整地技术、优势树种与种间配置、植物栽植与绿化技术等,建立一个稳定、高效的人工植被生态系统[4]。其中,植被长势情况是衡量人工干预矿区恢复效果的重要评价指标,也是治理工作中重要环节之一。进行长势评价的前提是将不同植被类型进行准确划分,因此,快速、准确的植被信息识别分类对人工植被重建效果评价意义重大[5-8]。

目前植被修复效果评价大多基于实地样方调查等传统方法[9],不仅耗费大量人力、物力及时间成本,而且无法从整体上对修复效果做出准确判断。同样,在气候条件较为复杂的西部矿区,乔木、灌木和草本植物的稀疏分布限制了样方的代表性,并且大规模调查还面临着诸多原因的限制。随着遥感技术的发展,通过植被覆盖度[10]、地上生物量[11-12]等植被理化性质参数的反演,可以实现大区域尺度上修复效果评价。相比于传统卫星遥感,无人机遥感技术以其高分辨率、快速响应、成本效益和操作灵活性,在精准农业[13-15]、地质灾害监测[16-19]、矿区生态环境监测[20-21]和矿区土地复垦[22-24]等领域展现出显著的应用潜力和成效。

本研究以内蒙古蒙泰不连沟煤业有限责任公司(以下简称“不连沟煤矿”)土地复垦示范区为研究对象,采用无人机搭载多光谱相机进行数据采集,使用常见的机器学习模型对土地复垦示范区内人工重建的植被进行分类提取,并进行超参数调优提高分类效果;随后结合植被生物量对人工植被重建效果进行评价,可为当地土地复垦与生态修复提供帮助,并为同类型矿区的土地复垦与生态修复提供借鉴与参考。

不连沟煤矿土地复垦示范区位于内蒙古准格尔煤田北部的大路镇,交通条件便利。煤矿北邻托克托县,东接清水河县,北距呼和浩特市约95 km,距托克托电厂30 km,西距鄂尔多斯市150 km。从气候特征来看,不连沟煤矿地处中温带大陆性气候区,四季分明,光照充足。冬季漫长寒冷,夏季炎热短促,春秋两季气温变化较大。年降水量较少,主要集中在夏秋季节。

采用大疆M210搭载MS600 PRO多光谱相机进行无人机数据采集,该相机能够获取蓝光(B1)、绿光(B2)、红光(B3)、红边(B4)和近红外(B5)等波段影像。航向重叠度及旁向重叠度设定为75%,航高90 m,飞行速度为1.9 m/s,3次飞行总计航点数312个,航线长度约 25.1 km,能够覆盖整个矿山生态修复示范区。在数据采集前,无人机与GNSS接收机在地面布设了MS600 PRO传感器的白板光谱反射率校正板。每次起飞前,通过手持飞机在校正板正上方1.5 m处拍照,获得当时条件下的标准反射率。随后,采用Reflectivity软件对影像进行预处理,再通过Pix4Dmapper对影像进行处理。此外,借助ENVI5.1软件,以数字正射影像为参考,在图像不同位置均匀选取30个参考点对多光谱影像进行几何精校正。经过检验,图像几何纠正误差小于0.5个像元。

与无人机航飞同一时间,在研究区所选样点处进行同步采样,布设20个大小为1 m×1 m的样方,齐地收割各样方内1/4或1/5的人工植被。随后测得人工植被总干重的最大、最小及平均值分别为251.2、38.2、118.3 g。

矿区植被类型调查是植被恢复工作的基础,对矿区的植被分布、种类组成、生长状况进行定点调查,并结合遥感手段进行全域分析,有助于确定哪些植被类型更适合在矿区生存和繁衍,为后续的植被恢复工作提供科学依据。

无人机多光谱影像具有较高的影像分辨率,使用其作为数据源进行机器学习分类能够有效地提取地物类型,但机器学习分类方法中多种超参数又会影响分类器分类精度。为了取得最优分类效果,本文选取3种机器学习分类方法,即随机森林分类方法、分类回归树和梯度提升树,通过调节超参数以达到最佳的分类效果。

2.1.1 样本点构建

研究人员在2023年9月对不连沟煤矿土地复垦示范区进行了实地考察,根据考察结果制作了乔木、灌木和草木3类共计约420个样本点。在GEE(Google Earth Engine)平台上按照7∶3的比例,将样本点随机划分为训练样本点与验证样本点,每次分类前GEE平台自动生成训练样本集及测试样本集,确保每次使用的样本集数量相同但点位不同,从而提高分类结果的稳定性和可靠性。

2.1.2 特征变量提取

由无人机光谱特征构建的相关植被指数能够表示不同类型的植被信息,将训练样本集与特征变量信息对应后引入机器学习分类器中进行分类,分别输入5种光谱特征、4种植被指数特征和6种纹理特征(红光波段的角二阶矩、对比度、相关性、熵、逆差矩和方差)。4种植被指数都是常用于无人机遥感植被生长状况监测和特性评估的植被指数[25-27],其公式见式(1)~式(4):

(1)

(2)

(3)

(4)

式中:NDVI——归一化植被指数;

NDRE——归一化红边植被指数;

EVI——增强型植被指数;

EVRE——增强型红边植被指数;

NIR——无人机多光谱近红外波段;

RED——无人机多光谱红光波段;

REDedge——无人机多光谱红光边缘波段;

BLUE——无人机多光谱蓝光波段。

本文根据目标地物的特性和数据源的差异,提取多种无人机遥感影像特征,涵盖光谱、植被指数、红边指数和纹理等方面。特征变量的选择是遥感分类的一个关键环节,合理的特征组合能够显著提高分类的准确性。然而,特征变量的过度使用也带来了一些问题,首先,它会导致数据集体积过大,从而降低分类模型的计算效率;其次,特征信息的重复可能会导致冗余特征,进而影响分类的精确度。特征选择可以挑选出最具代表性和信息量最大的影像特征,这不仅能够降低模型数据集的特征维度,还能最大限度地利用地物信息,实现地物信息的高效和准确识别。因此,在分类之前,对特征进行适当的筛选是必要的,以避免过多特征变量对分类结果准确性的负面影响。变量重要性结果如图1所示。由图1可以看出,6种通过红光波段计算的纹理特征对乔木、灌木、草木分类的重要性程度较低,因此仅选取光谱、植被指数和红边指数进行分类,减少模型的复杂度,降低过拟合的风险。

图1 变量重要性结果

2.1.3 机器学习分类

随机森林方法实现相对简单且参数调整相对直观,使得其具有较高的实用性。随机森林方法基于决策树的概念,并通过集成学习的方式提升模型的性能。随机森林使用自助法从原始训练数据集中抽取多个样本子集,并构建多个决策树,用于不同样本子集的训练,然后通过投票或取平均的方式确定最终的预测结果,即选择被最多树预测的类别作为输出。

(1)分类回归树是一种重要的决策树学习算法,兼具分类和回归功能,其核心特点在于构建二叉树结构,通过不断分裂特征空间来形成决策边界。分类回归树以简洁直观的方式展示决策过程,易于理解和解释,其非参数性质使得分类回归树能够自适应地学习数据的内在规律,无需事先假设数据分布。此外,分类回归树能够处理具有缺失值或离散值的数据,显示出良好的鲁棒性。

(2)梯度提升树是一种基于迭代思想的决策树集成学习方法,通过构建多棵决策树并集成其预测结果,以优化一个可微分的损失函数。其核心特点在于每棵树都针对前一棵树的残差进行拟合,通过不断减小残差来逐步提升模型的预测性能。梯度以提升树具有预测精度高、可解释性强、能处理多种类型数据等优点,广泛应用于回归、分类等问题。其灵活的损失函数选择和自然的处理缺失值能力,使得梯度提升树成为机器学习领域的重要工具之一。

2.1.4 参数调优

参数调优是随机森林分类模型构建过程中的一个重要环节,旨在找到一组能够最大化模型性能的参数组合[28-30]。

在随机森林模型中,决策树的数量扮演着至关重要的角色。这一参数直接决定了森林中树的数量,进而影响着模型的性能。一般而言,随着树的数量增加,模型能够捕获更多的数据特征,从而提高预测精度。然而,过多的树也可能导致模型过于复杂,增加计算成本,并可能引发过拟合现象。因此,在调整决策树数量时,需要找到一个平衡点,确保模型在不过于复杂的同时达到良好的性能。

在构建决策树的过程中,分裂特征数也是一个关键的参数。在随机森林中,每棵树通常不会使用所有的特征进行分裂,而是随机选择一部分特征。这种策略增加了模型的随机性,有助于降低过拟合的风险。通过合理设置分裂特征数,可以在保证模型性能的同时,提高模型的泛化能力。

在分类回归树模型中,最少节点数是一个重要的停止分裂条件。当达到这一条件时,决策树将停止生长,从而控制叶子节点的数量。这些叶子节点在数据空间中定义了决策边界,即哪些样本属于哪个类别或具有哪个预测值。通过调整最少节点数,可以影响决策边界的复杂度和光滑度,进而控制模型的复杂度。

对于梯度提升树而言,树数量参数决定了要构建的树的总数,通过迭代地添加树来不断改善梯度以提升树模型的性能。随着树数量的增加,模型能够捕获更多的数据细节,从而提升分类预测精度。然而,过多的树也可能导致模型过于复杂,增加计算成本,并可能引发过拟合问题。因此,在调整树数量参数时,需要权衡模型的复杂度和泛化能力,以达到最佳的预测性能。

2.1.5 分类结果精度评定

用户精度、生产者精度、总体精度和Kappa系数是遥感影像分类进行精度评定时常用的评估指标。用户精度是某一类别被正确分类的样本数与该类别实际参考样本总数的比值,其衡量了分类器将某个类别的样本正确分类为该类别的能力;生产者精度是某一类别被正确分类的样本数与该类别分类器分类出的样本总数的比值,其反映了分类器对某一类别的识别能力,尤其是避免将该类别误分为其他类别的能力,从生产者的角度来看,生产者精度衡量了分类器对某一类别样本的准确识别率;总体精度是正确分类的样本总数与总样本数的比值;Kappa系数是一个衡量分类精度的统计指标,其考虑了分类结果的混淆矩阵中所有可能出现的情况,包括正确分类和错误分类的样本。

线性拟合是一种简单的统计方法,假设生物量与其他相关变量之间存在线性关系。在线性拟合中,通过最小化预测值与实际值之间的残差平方和来估计模型的参数。这种方法适用于生物量与相关变量之间关系相对简单、线性的情况。然而,线性拟合可能无法准确描述更为复杂或非线性的生物量变化模式。

相比之下,非线性拟合则能够拟合出更为复杂的数据形态,包括曲线、曲面或更复杂的形状。非线性拟合使用非线性的函数形式来适应复杂的数据模式,从而可能更准确地描述生物量与相关变量之间的实际关系。非线性拟合模型的复杂度通常较高,需要估计更多的参数,并且参数估计通常需要使用迭代算法,如梯度下降法、牛顿法等。虽然非线性拟合能够更好地拟合复杂的数据形态,但也可能出现过拟合的情况,即模型过于复杂,过度拟合了训练数据,导致在新数据上的泛化性能下降。

对上述构建的各种模型选取均方根误差(RMSE)和决定系数(R2)进行模型分析检验。其中决定系数表示模拟值与实测值的拟合程度,其值越趋近于1,拟合程度越高;均方根误差主要用于模型验证,反映了模拟值与实测值的偏离度,其值越小,模型精度越高,见式(5)~式(8):

(5)

(6)

(7)

(8)

式中:n——数据点的数量;

yi——真实值;

SSres——残差平方和,即观测值与预测值之间差值的平方和;

SStot——总平方和,即观测值与观测值的平均值之间差值的平方和;

机器学习分类模型参数调优曲线如图2所示。

图2 机器学习分类模型参数调优曲线

由图2可以看出,随机森林分类器的决策树数量参数按照步长为1进行调试,结果显示在决策树数量从0增加到10的过程中,随机森林分类器分类精度呈现出明显的提升趋势,这表明增加决策树的数量能够增强模型的集成效果,提高分类性能;当决策树数量超过10后,虽然精度有所波动,但并未超过取值为10时的最佳精度,这表明继续增加决策树数量可能不会带来更多的性能提升,甚至可能因为过拟合而导致性能下降。随机森林分类器的分裂特征参数的调整同样对分类性能有显著影响,在计算能力允许的范围内,当分裂特征参数取值为14时,分类精度达到最高。

在分类回归树模型中,最大叶片节点参数的调整同样对分类精度具有重要影响。实验结果显示,当最大叶片节点参数取值为36时,模型分类精度达到最佳状态。然而,当取值超过36后,分类精度开始出现波动并逐渐下降,这表明过大的叶片节点参数可能导致模型过于复杂,从而降低分类性能。对于梯度提升树模型,调节梯度树数量对分类精度产生了显著影响。随着梯度树数量的变化,分类精度呈现出波动趋势,在梯度树数量取值为29时,分类精度达到了最佳状态。不同机器学习分类模型默认参数时分类精度见表1,不同机器学习分类模型默认参数的总体精度和Kappa系数见表2。

表1 不同机器学习分类模型默认参数时分类精度 %

类别 随机森林 用户精度 生产者精度 分类回归树 用户精度 生产者精度 梯度提升树 用户精度 生产者精度 乔木 0 0 60. 87 65. 12 60. 78 72. 09 灌木 24. 00 26. 09 33. 33 39. 13 48. 00 52. 17 草木 49. 25 98. 51 68. 33 61. 19 75. 00 62. 69

表2 不同机器学习分类模型默认参数的总体精度和Kappa系数

分 类 模 型 总 体 精 度 / % K a p p a 系 数 随 机 森 林 4 8 . 3 5 0 . 4 7 分 类 回 归 树 7 3 . 8 5 0 . 6 6 梯 度 提 升 树 7 7 . 0 6 0 . 7 1

由表1和表2可知,在默认参数设置下,随机森林分类器的总体分类精度为48.35%,Kappa系数为0.47。就生产者精度而言,该分类器主要将影像识别为草木地类和灌木地类,而对乔木地类的识别存在显著不足,导致较多乔木地类像元被识别为其他像元。在用户精度方面,草木地类和灌木地类的识别结果同样不理想,均有超过一半的像元被错误归类。

相对而言,分类回归树和梯度提升树这2种分类模型在默认参数下的分类效果更为理想,能够有效地区分3种植被类型,其中分类回归树的总体分类精度为73.85%,Kappa系数为0.66;而梯度提升树的总体分类精度达到77.06%,Kappa系数为0.71。

然而,从生产者精度的角度看,这2种模型在灌木的分类上表现不佳,可能是由于灌木的分布较为稀疏,且其形态与草木相近,导致易被误判为草木地类。尽管如此,与随机森林相比,分类回归树和梯度提升树在用户精度上表现更佳,其对草木地类和灌木地类的识别中,均有超过60%的像元被正确划分。

随机森林分类模型参数调优后的分类精度见表3,分类回归树和梯度提升树模型参数调优后的分类精度见表4。

表3 随机森林分类模型参数调优后的分类精度 %

类别 随机森林决策树参数 用户精度 生产者精度 随机森林节点分裂参数 用户精度 生产者精度 乔木 64. 29 60. 93 69. 39 79. 07 灌木 33. 33 34. 35 88. 89 64. 78 草木 54. 31 94. 03 71. 05 80. 60

表4 分类回归树和梯度提升树模型参数调优后的分类精度 %

类别 分类回归树最大节点参数 用户精度 生产者精度 梯度提升树梯度树参数 用户精度 生产者精度 乔木 69. 23 62. 79 70. 21 76. 74 灌木 60. 00 59. 13 50. 00 56. 17 草木 65. 00 77. 61 77. 78 73. 13

由表3和4可以看出,参数调优在3种不同机器学习分类模型中起到了关键作用,显著影响了不同植被类型的分类精度。经过对决策树参数的调优,随机森林分类模型的分类性能得以显著提升。参数调优使得分类回归树模型和梯度提升树模型对分类问题的能力上得到了进一步提升,这2种模型的分类精度均有提高。

不同机器学习分类模型参数调优后的总体精度和Kappa系数见表5。

表5 不同机器学习分类模型参数调优后的总体精度和Kappa系数

分类模型参数 总体精度/ % Kappa 系数 随机森林决策树 72. 48 0. 63 随机森林节点分裂 82. 11 0. 77 分类回归树最大节点 78. 44 0. 72 梯度提升树梯度树 81. 19 0. 76

具体而言,分类回归树模型的总体精度提升了4.59个百分点,而梯度提升树模型的总体精度提升了4.13个百分点。同时,分类回归树模型和梯度提升树模型的Kappa系数也分别增加了0.06、0.05(根据表2和表5计算得出)。这2种模型对乔木和草木的用户精度均好于随机森林模型,但对灌木的分类效果较差。

相较于原始模型,随机森林调优后的总体精度跃升了24.13个百分点,Kappa系数也增加了0.16,模型分类效果显著改善。在用户精度方面,模型分类结果中乔木类别的像元准确率达到了64.29%,草木类别的像元准确率为54.31%,而灌木类别的像元准确率相对较低,仅为33.33%。生产者精度显示草木类别的像元中有高达94.03%被准确分类,然而,乔木类别和灌木类别的生产者精度分别为60.93%和34.35%,模型在乔木和灌木的分类上仍存在较大的误差。

在确定最佳决策树参数后,进一步对节点分裂参数进行了优化,模型的总体精度和Kappa系数均实现了显著提升。与仅进行决策树参数调优的模型相比,优化后的模型在总体精度上提升了9.63个百分点,Kappa系数也增加了0.14,随机森林模型的可靠性得到了进一步增强。分类结果中灌木像元的准确率提升了55.56个百分点,达到88.89%,仅有25.22%的灌木像元被错分。

研究共选择多光谱影像的5个单波段和4种植被指数,共9个影像特征,构建随机森林、分类回归树和梯度提升树分析土地复垦示范区人工植被空间分布格局,均可清晰地看出示范区人工种植的3种植被类型的分布,植被类型斑块较完整、较为清晰。最终分类结果如图3所示。

分类结果图与无人机正射影像对比可知,3种分类方法均存在局部错分情况,随机森林模型和梯度提升树模型主要将示范区缓斜坡处的植被类型错分为乔木类型,使用实地考察结果对分类效果进行验证,显示缓斜坡处的植被组成以苜蓿和狗尾草为主,并存在一定数目的灌木(如柠条),并没有出现任何乔木;分类回归树模型则将大片的乔木类型错分为灌木。随机森林模型结果中乔木、灌木、草木、提取效果略优于梯度提升树模型,选取随机森林分类结果作为最终分类结果,可用于后期人工植被重建效果评价。

人工植被生物量反演结果见表6。

由表6可以看出,使用机器学习拟合模型回归精度远高于使用单一指数的函数拟合模型,其中随机森林模型对人工植被生物量反演结果精度最高,R2为0.93,均方根误差为13.97。因此,使用随机森林模型绘制示范区生物量反演图进行人工植被类型适应性评价。

根据分类结果和原始地形地貌特征可知,坡顶平台相较缓斜坡和缓斜坡平台而言更加完整,并且同时种植灌木和草木2种植物,适合进行适应性评价,坡顶人工植被生物量反演结果统计见表7,示范区生物量反演结果如图4所示。

根据现场调查与采样结果显示,坡顶的草本植被主要为人工种植的紫花苜蓿,灌木则是主要种植在坡顶边缘防止水土流失。使用随机森林模型反演的生物量结果显示,示范区坡顶种植的紫花苜蓿生物量66.6%的面积处于0~50 g/m2的范围内,生长情况欠佳;分布在边缘的灌木生物量61.4%处于100~150 g/m2的范围内,生长情况相对较好。根据图4中灌木和草木生物量的空间分布结果显示,靠近西侧的植被不论灌木和草木,其生物量均明显高于东侧植被。

图3 最终分类结果

表6 人工植被生物量反演结果

植被 指数 简单线性拟合 R 2 均方根误差 指数函数 R 2 均方根误差 二次函数 R 2 均方根误差 随机森林 R 2 均方根误差 分类回归树 R 2 均方根误差 NDRE 0. 52 37. 77 0. 55 37. 55 0. 56 37. 21 EVRE 0. 42 41. 71 0. 42 41. 72 0. 53 42. 70 EVI 0. 53 37. 41 0. 53 37. 40 0. 53 38. 44 NDVI 0. 55 36. 47 0. 56 36. 03 0. 58 36. 55 0. 93 13. 97 0. 85 19. 15

表7 坡顶人工植被生物量反演结果

生物量等级 / (g·m - 2 ) 坡顶草地生物量 面积/ m 2 占比/ % 坡顶灌木生物量 面积/ m 2 占比/ % 0 ~ 50 80 647 66. 61 2 130 7. 42 ≥50 ~ 100 28 173 23. 27 5 053 17. 59 ≥100 ~ 150 6 234 5. 15 17 636 61. 41 ≥150 ~ 200 6 014 4. 97 3 899 13. 58

图4 示范区生物量反演结果

本文基于无人机高分辨率多光谱影像,应用机器学习分类方法提取了示范区人工植被,分类结果与精度已经能够说明机器学习分类方法在人工植被提取上的适用性,并且如图2所示调节不同分类算法的超参数能够有效改变分类模型的复杂程度,进而达到最佳分类精度。研究结果显示,超参数调节对分类回归树模型和梯度提升树的效果不明显但能够有效地提高随机森林模型分类精度。考虑到分类回归树模型[31]和梯度提升树[32]均是简单的决策树模型,而随机森林分类器模型超参数较多为复杂决策树模型,因此超参数调节对复杂模型的优化效果更好。

虽然调整模型超参数能够有效地提高分类效果,但不同分类模型之间的差异是影响分类效果的主要因素,并且根据图2和图3显示分类精度并不能完全代表分类效果,分类回归树模型的分类精度仅低于其他2种模型约5个百分点,但绘制出的分类结果图中乔木林地整体错误识别的情况明显。因此模型超参数仅能对分类效果在一定程度上提升,并不能改变分类模型的错分、误分现象,对人工植被更进一步的分类识别,仍需要更好的机器学习或者深度学习分类模型和更全面的分类特征参数,如地形地貌等[33]。

随机森林内置的特征选择方法可以评估每个特征对模型预测能力的贡献,从而选择与分类模型密切相关的特征。并且,随机森林模型在2次超参数调优后的总体精度达到了82.11%,Kappa系数为0.77,这表明随机森林模型相对其他2种模型具有较高的分类准确性。因此相对而言选择随机森林分类模型进行人工植被提取是无人机多光谱数据的最优选择。

无法适应当地气候、地理环境的人工植物会出现短期“假活”的现象,直接表现为植被大面积枯死,因此使用生物量反演结果代表人工植物的生长发育情况进而可以评价人工植被的重建效果[34-35]。根据现场调研可知,示范区坡顶平台主要种植有大面积的紫花苜蓿,并且在调研前数天进行了当年的收割,因此坡顶平台区域生物量反演结果偏低。由图4可知,示范区斜坡处的人工植被反演结果同样较差,综合考虑可能由于研究区地处西部干旱、半干旱气候区自然降雨量少,人工植被需要长期管护[36],不当的管护使得水肥未能均匀分布全部示范区,从而造成示范区斜坡处人工植被的长势差异。

机器学习分类方法在人工植被识别中展现了显著的优势,通过参数调优能够有效提高分类精度。但该方法也存在一些局限性,无人机多光谱影像较高的分辨率给模型运算带来了困扰,依靠机器学习模型难以有效处理大规模无人机高精度影像数据集,并且难以持续监测人工植被恢复效果。人工植被类型的差异直接影响植被生物量,灌木和乔木植被的生物量可能会出现过饱和状态,均会影响人工植被重建的评价效果。

未来的研究应进一步结合遥感数据和机器学习算法,对人工植被进行更细致的分类,并构建一个多维度的评价体系,包括植被生长参数和群落丰富度等。这将为人工植被重建的效果评估提供更全面、更准确的参考,有助于优化植被恢复策略,提高生态修复的质量和效率。

本文基于GEE平台对无人机多光谱影像应用3种机器学习分类方法进行了矿区土地复垦示范区人工植被重建识别分类,并使用生物量反演结果评价人工植被重建效果。这对于优化土地复垦策略、提高生态修复效率具有重要意义,并为未来矿区人工重建植被的选择提供理论依据。

(1)对机器学习分类方法进行超参数调优能够有效的提升模型的分类精度,调整随机森林模型的决策树参数使得其总体精度提高了24.13个百分点,Kappa系数也增加了0.16。进一步调整节点分裂参数,使其总体精度上进一步提升了9.63个百分点,Kappa系数也增加了0.14。

(2)在超参数调优获取最优分类效果的过程中,随机森林分类模型总体分类精度最高,达到了82.11%;其次是梯度提升树分类模型,总体分类精度为81.19%;最后是分类回归树分类模型仅为78.44%。

(3)使用随机森林模型获得的反演结果精度最高,其R2为0.93,均方根误差为13.97,满足人工植被重建效果评价。示范区坡顶的草本植被重建效果欠佳,有接近66.6%面积区域生物量等级处于0~50 g/m2的范围;灌木重建效果较好有接近61.4%面积区域生物量等级处于100~150 g/m2的范围。

参考文献:

[1] 陈超,胡振琪,台晓丽,等.风积沙区土地生态损伤自修复能力评价[J].中国煤炭,2015,41(10):124-128.

[2] 胡振琪,龙精华,王新静.论煤矿区生态环境的自修复、自然修复和人工修复[J].煤炭学报,2014,39(8):1751-1757.

[3] 刘祥宏,尹勤瑞,辛建宝,等.生态植被自然修复及其人工促进技术研究进展与展望[J].生态环境学报,2022,31(7):1476-1488.

[4] 周涛,胡振琪,阮梦颖,等.基于无人机遥感的煤矸石山植被分类[J].煤炭科学技术,2023,51(5):245-259.

[5] 程天亮,王新平,马雄忠,等.基于无人机影像的阿拉善东南部荒漠灌丛植被空间格局研究[J].生态学报,2022,42(16):6778-6789.

[6] 崔万新,李锦荣,司前程,等.基于无人机可见光数据荒漠灌木覆盖度提取方法研究[J].水土保持研究,2021,28(6):175-182.

[7] 万炜,肖生春,陈小红,等.无人机遥感在野外植被盖度调查中的应用——以阿拉善荒漠区灌木为例[J].干旱区资源与环境,2018,32(9):150-156.

[8] 徐渝杰,舒向阳,陶敏,等.基于无人机和机器学习的川西北修复沙地植被信息提取[J].四川农业大学学报,2024,42(1):181-187.

[10] 邹兰兰,冯启言,郝明,等.灵泉露天矿生态修复效果及驱动因素分析[J].中国矿业,2024,33(3):43-50.

[11] FREMOUT T, COBIAN-DE V J, THOMAS E,et al. Site-specific scaling of remote sensing-based estimates of woody cover and aboveground biomass for mapping long-term tropical dry forest degradation status[J].Remote Sensing of Environment,2022,276.

[12] YAN Feng,WU Bo,WANG Yanjiao. Estimating spatiotemporal patterns of aboveground biomass using Landsat TM and MODIS images in the Mu Us Sandy Land,China[J].Agricultural and Forest Meteorology,2015,200:119-128.

[13] 贾元,张琳,吴冬秀,等.基于无人机多光谱实测数据的草地生物量反演模型比较[J].生态学报,2024(15):1-11.

[14] 沈思聪,张靖雪,陈鸣晖,等.基于无人机多光谱估测不同品种紫花苜蓿的地上生物量和叶绿素含量[J].光谱学与光谱分析,2023,43(12):3847-3852.

[15] 赵国兵,郑江华,王蕾,等.基于RF分类调优和SNIC聚类的新疆红枣种植区遥感提取[J].干旱区地理,2024,47(6):1004-1014.

[16] 廉旭刚,韩雨,刘晓宇,等.无人机低空遥感矿山地质灾害监测研究进展及发展趋势[J].金属矿山,2023(1):17-29.

[17] 许强,郭晨,董秀军.地质灾害航空遥感技术应用现状及展望[J].测绘学报,2022,51(10):2020-2033.

[18] 龙林丽,刘英,张旭阳,等.无人机在矿区表土特征及地质灾害监测中的应用[J].煤田地质与勘探,2021,49(6):200-211.

[19] 吴海文.无人机技术在煤矿岩移监测中的应用[J].中国煤炭,2023,49(2):89-96.

[20] 肖武,任河,赵艳玲,等.无人机遥感支持下的煤矸石山自燃监测与预警[J].煤炭科学技术,2023,51(2):412-421.

[21] 颜杰,王晓东,张禹,等.哈尔乌素露天煤矿粉尘监测与防治策略实践[J].中国煤炭,2023,49(S1):71-76.

[22] 徐岩,胡振琪,陈景平,等.基于无人机遥感的开采沉陷耕地质量评价及复垦建议[J].金属矿山,2019(3):173-181.

[23] 邵振鲁,张会松,邓榕,等.自燃煤矸石山火区表面温度场三维重构与实践[J].煤田地质与勘探,2024,52(11):12-23.

[24] 孙长斌.无人机热红外遥感技术对矿区煤火探测识别研究[J].中国煤炭,2023,49(S2):85-94.

[25] 郭云开,刘雨玲,许敏,等.植被叶面积指数估算的红边指数建模分析[J].测绘科学,2021,46(1):93-98.

[26] 李晓婷,杨丽帆,邹友峰,等.采煤胁迫下干旱区植被生长周期红边指数动态变化[J].煤炭学报,2021,46(5):1508-1520.

[27] CUI R H,HU Z Q, WANG P J,et al. Crop Classification and Growth Monitoring in Coal Mining Subsidence Water Areas Based on Sentinel Satellite[J].Remote Sensing,2023,15(21).

[28] 熊向阳,杨小周,赵银超,等.基于超参数优化随机森林算法的森林生物量遥感反演[J].中南林业科技大学学报,2024(5):102-111.

[29] 严格齐,赵婉莹,于镇伟,等.基于超参数优化算法下的随机森林模型预测奶牛呼吸频率[J].农业工程学报,2024,40(11):195-203.

[30] 张立欣,杨翠芳,张晓,等.基于近红外光谱和支持向量机回归参数调优的羊肉含水量检测[J].食品与发酵工业,2022,48(12):255-260.

[31] 李晓雅,田昕,段涛,等.融合无人机和卫星影像的温带疏林草原木本和草本植物覆盖度遥感估算[J].遥感学报,2023,27(9):2139-2152.

[32] 张宏鸣,刘雯,韩文霆,等.基于梯度提升树算法的夏玉米叶面积指数反演[J].农业机械学报,2019,50(5):251-259.

[33] 张妮娜,张珂,李运平,等.中国南方典型湿润山区植被类型的无人机多光谱遥感机器学习分类研究[J].遥感技术与应用,2023,38(1):163-172.

[34] 胡萧,王栋,张轩,等.锑矿区修复的不同植被类型植物多样性及生物量特征[J].合肥工业大学学报(自然科学版),2023,46(10):1314-1321.

[35] 周伟,官炎俊.重建植被视角下露天煤矿区土地复垦演替过程及管控模式研究[J].煤田地质与勘探,2022,50(12):65-74.

[36] 陈航,雷少刚.基于面向对象的矿区人工植被提取与重建效果分析[J].干旱区资源与环境,2018,32(7):98-103.

HE Ji1, CUI Ruihao2, LI Humin1, WANG Lei3, MA Fei3, WANG Peijun4

Abstract Artificial vegetation reconstruction is the foundational work for land reclamation and ecological restoration in mining areas, and analyzing the effects of artificial vegetation reconstruction is an important link of ecological restoration quality evaluation. Taking the land reclamation demonstration area of Inner Mongolia Mengtai Buliangou Coal Mine as the main study area, Using UAV with multispectral cameras for data acquisition and three common machine learning algorithms for application, artificial vegetation data was extracted based on the differences in spectral and texture characteristics of land and land cover. On this basis, selecting the vegetation biomass index to analyze the growth status of artificial vegetation on the ridges of the study area, its artificial vegetation reconstruction effect was evaluated. The results showed that hyperparameter tuning for machine learning classification methods could effectively improve the classification accuracy of the model, the random forest classification model had the highest classification accuracy after hyperparameter tuning, with an overall accuracy of 82.11% and a Kappa coefficient of 0.77; the inversion results obtained by the random forest model had the highest accuracy, with an R2 of 0.93 and a root mean square error of 13.97; the reconstruction effect of herbaceous vegetation on the ridges of the demonstration area was poor, with nearly 66.6% of the area having a biomass grade in the range of 0-50 g/m2; the reconstruction effect of shrubs was better, with nearly 61.4% of the area having a biomass grade in the range of 100-150 g/m2.

Keywords UAV remote sensing; artificial vegetation reconstruction; land reclamation in mining area; hyperparameter tuning

THE END
0.《水》第二课时(精选16篇)【设计意图】让学生准确把握物质的分类方法,理解把物体分成固体、液体和气体只是正确分类方法中的一种。标准不同,给物体分类的方法也不同。 四、课外延伸: 在生活中找找哪些是固体、哪些是液体、哪些是气体? [设计意图] :科学探究与实际生活相结合,让学生对固体、液体、气体的理解更加深入,记忆更加深刻。 jvzquC41yy}/fr~khctxgw3eqo5kkjtcp1~jcx}wgy{okjslk{{xgwokcqgo1@;:56=/j}rn
1.科普丨常见的外来入侵物种还有哪些?如何防治?三、防治方法 红棕象甲的幼虫、成虫在很长的时间内都是钻蛀在枝条、叶柄、茎的内部隐藏,极易传带。加强对疫情的检疫封锁,限制从国内红棕象甲发生区引进和调运棕榈科植物或从国外疫区进口棕榈科大型植株和种苗。在引进这些大型植物体的时候,要实施严格、细致的检疫措施,一旦发现有虫的植株,需销毁处理。 jvzquC41yy}/j~grf0ipo8mwdrj0t|x1{kjjcwkzwt0kwigz0nuouDeqpzfp}Nf?6<23?=823>54B6538;5
2.公文函格式范文对于“函”一节的教学内容,很多学生不太了解函是什么,函有什么作用,函的分类、函的写法及语言风格怎样。为使学生掌握这种公文的特征和运用方法,笔者将学校近时的情况设计为教学情境:学校毗邻国道206线,其时道路正在扩建,车辆多,交通拥堵,学生上学、放学,特别是每周五下午住校的两千多学生陆续回家时,交通安全隐患极大jvzquC41yy}/i€~qq0ipo8mcqyko1::2:7=/j}rn
3.基于k此外,依赖序列同源性或NCBI/RefSeq数据库进行分类的方法在没有分类学或与任何分类学(如大多数宏基因组病毒)没有同源性的情况下不起作用。例如,ViromeScan依靠NCBI的已知分类法,从宏基因组样本中的RefSeq中识别病毒。诸如vConTACT、Low等人和Metavir等工具需要与已知病毒具有同源性才能进行分类。据我们所知,目前还没有jvzquC41yy}/ew2jgcrujlftg0ipo8ftvkimg€r142832=691euovnsv/394;@770jznn
4.2020年广东省考常识速记之土地资源的利用公务员考试网土地资源的分类有多种方法,在中国较普遍的是采用地形分类和土地利用类型分类: (1)按地形,土地资源可分为高原、山地、丘陵、平原、盆地。这种分类展示了土地利用的自然基础。一般而言,山地宜发展林牧业,平原、盆地宜发展耕作业。 (2)按土地类型利用,土地资源可分为已利用土地耕地、林地、草地、工矿交通居民点用地等;宜jvzquC41yy}/j~fvw0ipo87242518:>13;;73<50jvsm
5.2023年初中语文基础知识要点:说明文基知辅导初中语文之明文解题方法 第1讲 说明的对象及特征 一、说明文的分类 1.事物说明文: 介绍事物形体特征的说明文。 2.事理说明文: 介绍事物本身的道理或内部规律等科学知识的说明文。 二、如何分清说明的对象? 1.要区分说明文的类型。 事物说明文中事物本身就是说明对象,对象往往可以从题目中找出来。事理说明文中的说明jvzq<84yyy4{jxsimcu/exr1g1814<5338575l9h75?d6j7c0unuou