检索项 检索词
  土壤学报  2022, Vol. 59 Issue (5): 1279-1292  DOI: 10.11766/trxb202012030670
0

引用本文  

王丽, 周勇, 李晴, 等. 基于随机森林的耕地质量评价智能模型及其应用研究. 土壤学报, 2022, 59(5): 1279-1292.
WANG Li, ZHOU Yong, LI Qing, et al. An Intelligent Model of Cultivated Land Quality Evaluation Based on Random Forest and Its Application. Acta Pedologica Sinica, 2022, 59(5): 1279-1292.

基金项目

国家自然科学基金项目(42171061)、国家科技基础资源调查专项(2021FY100505)和湖北省农业农村厅重点项目(2018-05-20,2018-10-15)资助

通讯作者Corresponding author

周勇, E-mail:yzhou@mail.ccnu.edu.cn

作者简介

王丽(1987—),女,河南信阳人,博士研究生,主要从事自然资源评价与土地利用研究。E-mail:wli_gis@mails.ccnu.edu.cn
基于随机森林的耕地质量评价智能模型及其应用研究
王丽, 周勇, 李晴, 徐涛, 左岍, 吴正祥, 刘婧仪    
华中师范大学城市与环境科学学院/地理过程分析与模拟湖北省重点实验室/华中师范大学土地科学研究中心, 武汉, 430079
摘要:为了更精确地表达耕地质量的系统性、非线性、差异性等特点,本研究旨在探索一种新的智能化耕地质量评价方法,提高耕地质量评价精度。以襄州区为研究区域,从地形地貌、土壤条件、社会经济、生态安全4个方面构建耕地质量综合评价指标体系,选用熵权法(EW)、后向传播神经网络(BPNN)、随机森林(RF)三种模型进行训练,比较三种模型的评价精度,并分析襄州区2018年耕地质量等级分布规律。结果表明:(1)襄州区耕地质量整体较好,以二、三等级为主,累积面积占比达到54.63%,呈现出明显的地域分异规律,高质量耕地主要分布在中北部,低质量耕地主要聚集在南部,且各乡镇耕地质量等级分布也具有明显差异;(2)耕地质量RF评价模型能够较为精确地模拟指标之间的复杂关系,科学定量分析各指标对耕地质量的贡献;(3)耕地质量平均指数比较,RF>BPNN>EW,RF与BPNN的评价结果具有相似的空间分布,且均与EW的差异较为显著;(4)相比于BPNN和EW,RF具有更高的数据挖掘能力和训练精度,其评价结果最为理想,决定系数R2为0.814 5,MAE为0.009,MSE为0.012,RF能有效运用于耕地质量评价研究。本研究丰富和完善了县域尺度耕地质量评价指标体系及方法,为襄州区耕地资源数量、质量、生态“三位一体”的管护提供理论依据,同时为其他类似地区耕地质量评价提供借鉴与参考。
关键词耕地质量    随机森林    智能模型    襄州区    
An Intelligent Model of Cultivated Land Quality Evaluation Based on Random Forest and Its Application
WANG Li, ZHOU Yong, LI Qing, XU Tao, ZUO Qian, WU Zhengxiang, LIU Jingyi    
The College of Urban & Environmental Sciences, Central China Normal University/ Key Laboratory for Geographical Process Analysis & Simulation in Hubei Province, Central China Normal University/Land Science Research Center, Central China Normal University, Wuhan 430079, China
Abstract: 【Objective】Constructing a scientific and quantitative quality-assessment model for cultivated land is important for understanding cultivated land quality, and can provide a theoretical basis and technical support for formulating rational and effective management policies and realizing the sustainable use of cultivated land resources. To accurately reflect on the systematic, complex, and differential characteristics of cultivated land quality, this study aimed to explore an intelligent cultivated land quality assessment method that avoids the subjectivity of determining indicator weights while improving assessment accuracy.【Method】In this study, taking Xiangzhou in Hubei Province of China as the study area, 14 indicators were selected from four dimensions—terrain, soil conditions, socioeconomics, and the ecological environment—to build a comprehensive assessment index system for cultivated land quality. A total of 1, 590 representative cultivated land quality samples in Xiangzhou were selected, of which 1, 110 were used as training samples, 320 as test samples, and 160 as validation samples. Three models of entropy weight(EW), back propagation neural network(BPNN), and random forest(RF)were selected for training, and the assessment results of cultivated land quality were output through simulations to compare the assessment accuracy of the three methods to verify the reliability and superiority of the RF model. In addition, the distribution pattern of cultivated land quality grades in Xiangzhou in 2018 was also analyzed in this study.【Result】The results are summarized as follows: (1)The overall quality of cultivated land in Xiangzhou was better, with a larger area of second- and third-grade farmland, accounting for 54.63%, and the grades conformed to a positive distribution trend. From the distribution point of view, the spatial distribution of cultivated land quality in Xiangzhou was unbalanced, influenced by the topography and socioeconomic development level and showing an obvious geographical differentiation pattern, with overall characteristics of high in the north-central area and low in the southern area. The distribution of cultivated land quality grades also varied widely among towns.(2)The RF model for cultivated land quality assessment required fewer parameters and could simulate the complex relationships between indicators more accurately and analyze each indicator's contribution to cultivated land quality scientifically.(3)In terms of the average quality index of farmland, RF > BPNN > EW. The spatial patterns of the quality index from RF and BPNN were similar, and both were significantly different from EW.(4)Compared to BPNN and EW, RF had a higher data mining ability and training accuracy, and its assessment result was the best. The coefficient of determination(R2)was 0.8145, the mean absolute error(MAE)was 0.009, and the mean squared error(MSE)was 0.012.【Conclusion】The findings in this study showed that RF was more suitable for the quality assessment of cultivated land with complex nonlinear characteristics. This study enriches and improves the index system and methodological research of cultivated land quality assessment at the county scale, and provides a theoretical basis for achieving a threefold production pattern of cultivated land quantity, quality, and ecology in Xiangzhou, while also serving as a reference for the evaluation of cultivated land quality in similar regions.
Key words: Cultivated land quality    Random forest    Intelligent model    Xiangzhou District    

科学评价耕地质量是衡量耕地质量水平及其生态安全的基础[1]。目前中国耕地质量下降、空间破碎、生态破坏的空间格局日益显现[2],为此中央政府提出了实施耕地数量、质量、生态“三位一体”的保护战略,并将提升耕地质量作为保障国家粮食安全的重要路径[3]。在这一现实背景下,耕地质量的理论研究与实践探索将面临严峻挑战,厘清并全面客观掌握耕地质量水平成为土地科学、土壤学、环境科学等学科研究的重点问题。

耕地质量的内涵已从早期单一因素的基础地力延伸到涉及生产潜力、适宜性及可持续性等多重因素的综合质量[4]。国外主要研究耕地质量的时空演变及可持续利用,而国内则更多关注耕地质量的培育以及与粮食产能的耦合关系[5]。目前学术界对耕地质量的概念界定尚未统一,普遍认为耕地质量受自然、社会、经济等多种因素的影响[6],一般由自然质量、利用质量、经济质量和生态质量组成[7]。耕地质量评价是定量测算耕地质量所处的状态或满足耕地功能需求的程度[8],已从早期查田定产、土壤理化性质、基础地力等自然因素的研究扩展到考虑人地关系的耕地资产核算研究[9]。长期以来,国内外学者对耕地质量评价进行了有益的探索,取得了大量的研究成果,主要以熵权法(Entropy Weight,EW)[10]、模糊评价法[11]、层次分析法(Analytic Hierarch Process,AHP)[12]、灰色关联分析法[13]等常规评价方法为主。这类方法均具有模型简单、数据兼容性强、应用广等特点。EW依据数据的物理特点客观赋权,但未引入人为对评价指标的认知判别[10];AHP确定指标权重的主观性较大,敏感性较差[12];模糊评价法、灰色关联分析法处理高维度数据的稳定性较差,且难以深入挖掘非线性信息[1113]。近年来,人工神经网络和支持向量机(Support Vector Machine,SVM)在耕地质量评价方面日益受到关注[14]。人工神经网络具有很强的鲁棒性和自学习能力,但存在过度拟合、泛化误差大、指标权重确定难等缺陷[15]。SVM处理高维数据的泛化能力更强,能够依据数据原始信息确定指标权重,但存在样本划分难、参数选取主观性大、过学习等问题[16]。因此,如何将多源环境变量有效统一到同一个评价单元仍是耕地质量评价的重难点。

随机森林(Random Forest,RF)是一种通过构建多棵分类树进行组合决策的机器学习模型,具有较强的抗噪声能力和模型泛化能力,并在训练学习中评估指标的重要性,可以有效克服局部过度拟合[17]。耕地质量是由自然、社会经济及生态等因素共同作用的巨大系统,存在非线性、高维、缺失值等难题。RF作为一种非参数决策树模型,在处理高维数据、非线性关系及权重动态性更先进。理论上,RF能够成为评价耕地质量的理想工具,但目前相关研究并不多见。鉴于此,本研究构建了一种基于RF的耕地质量评价智能模型,并将其运用于襄州区2018年耕地质量评价,同时将后向传播神经网络模型(Back Propagation Neural Network,BPNN)和EW作为对比,以验证RF评价模型的稳定性和先进性,探索耕地质量评价的新路径,以期扩充耕地质量评价方法库,提高耕地质量评价的精度。

1 材料与方法 1.1 研究区概况

襄州区隶属于湖北省襄阳市,位于鄂西北部、汉江中游(图 1a)。襄州属于亚热带湿润季风气候,降水适中,年均气温15.3℃~15.8℃。襄州为丘陵平原交错地带,地势从四周向中部逐渐降低,80%以上的面积为岗地,仅分布有较少的河流冲积平原(图 1b)。全区现辖有13个乡镇和1个农场,总面积为24.67万hm2,耕地面积为16.53万hm2,是湖北省粮、棉、油主要产区之一。但随着城镇化进程的加快,建设用地大势扩张,占用了大量的耕地,导致耕地数量锐减。同时频繁的人为扰动也对耕地质量造成了一定的危害。因此,全面把握和提升耕地质量水平,对提高粮食产能和保障国家粮食安全意义重大。

图 1 研究区域:a)在湖北省的位置;b)襄州区DEM图 Fig. 1 Study area: a)location in Hubei Province; b)digital elevation map(DEM)of Xiangzhou District
1.2 数据来源

本研究涉及的数据主要包括图件、土壤采样以及社会经济统计数据:(1)襄州区2018年土地利用现状变更调查数据(1:10 000),主要获取行政区划图、耕地图斑、农村居民点、农村道路、公路、沟渠、河流等;(2)襄州区DEM(30 m)来源于地理空间数据云平台(http://www.gscloud.cn),提取坡度因子;(3)襄州区2018年耕地质量等级调查与评价成果,获取土壤属性和生态环境因子;(4)襄州区2018年耕地土壤环境质量类别划分成果,获取土壤清洁程度因子;(5)襄州区2018年统计年鉴及相关农业统计资料,提取社会经济等统计数据。

1.3 数据处理

遵循全面性、代表性、均衡性等原则,在研究区选择具有代表性的不同地类的地块,布设255个采样点(图 2),于2018年10月农作物秋收后土壤施肥前进行采样,同时使用手持GPS进行坐标定位。采集0~20 cm的耕层土壤,采用“S”型混合土样,保留1 kg的土样装袋进行化验,同时记录采样点相关属性信息。生物多样通过计算土壤样点的蚯蚓数量的百分比获得。通过土壤样品测试分析得到有机质、有效磷、速效钾、pH、土壤容重等土壤属性。此外,在研究区不同地类的地块上布设326个重金属采样点(图 2),通过化验分析得到铅、镉、铬、汞、砷5种土壤重金属含量,以此确定土壤的清洁程度。此外,利用ArcGIS10.2软件,通过邻域分析工具计算得到耕地的社会经济指标。

图 2 土壤采样点分布 Fig. 2 Soil sample points distribution
1.4 评价指标的选取

耕地是由气候、地形地貌、土壤理化性质、人为活动等多种因素相互作用形成的复杂系统[418],其质量状况受到多重因素影响。土壤是重要的自然资源,也是农业发展的基础。选取坡度、地形部位和耕层质地评价耕地的适宜性[19],有效土层厚度是评价土地退化的重要指标[20]。选取有机质、pH、有效磷、速效钾等因子评价土壤肥力[21]。有机质是作物营养的主要来源,是表征土壤肥力的重要指标[22]。pH影响土壤肥力水平,其值为6.5~7.5时,大多数农作物生长最好[23]。有效磷和速效钾是对农作物施用的主要肥料[24]。20世纪80年代,美国土壤保护局(SCS)建立的土地评价和立地评价(LESA)体系强调社会经济条件在耕地质量评价中的重要作用[25]。水资源是农作物产量的重要影响因素[26]。合理的排灌模式不仅能提高排灌能力,还能保持耕地的土壤湿度[27]。交通便利性影响土地利用空间格局,通过计算耕地图斑到道路的距离来表达[28]。近十年来,中国农业发展已从追求增产转向关注耕地生态安全。因此,在耕地质量评价中需要考虑生态因素[29],一般选取耕地的生物多样性和清洁度来表征生态质量。生物多样性是衡量耕地生态价值的重要指标,一般通过物种多样性来表达[30]。清洁度反映了土壤的环境状况,已作为土壤生态安全评价的重要指标[31]

1.5 耕地质量评价模型

(1)RF评价模型。构建耕地质量RF评价模型的关键是分析评价指标与耕地质量等级间的对应规则,通过决策树实现[17]。决策树是一棵由根节点、子节点以及叶节点组成的二叉决策树,其中,根节点代表评价指标的观测值,根节点到叶节点的路径表示评价规则,叶节点表示评价结果。构建耕地质量RF评价模型的基本思路:首先利用BootStrap法随机选择训练样本集输入到各个构造树形成不同的决策方案,通过随机分裂节点技术将各子节点的指标属性值分解为叶节点。然后,通过叶节点结构分析,运用Gini系数计算各评价指标权重,按照决策树对应的线性规则形成指标与权重相对应的关系集并输出RF模型,各叶节点上指标的属性值与其权重值加权求和的均值为最终的耕地质量指数。

本研究调用R语言的randomForest程序包,运用袋外数据(OOB)对RF模型的精度进行无偏估计,当决策树的个数大于200时,OOB的误差趋向于稳定。通过改变评价指标个数,对RF模型均方误差和决定系数R2进行比较,确定最优分割节点n,当节点分割数n为7时误差最小,R2最大。

(2)EW和BPNN模型。目前关于耕地质量评价的方法大致可分为两类:常规赋权法和机器学习算法。为了更全面地验证RF模型的可靠性和优越性,本研究从两类中分别选取一种方法作为对比。

相比其他常规赋权法,EW是一种客观赋权法,其基本原理是根据指标变异性的大小来确定权重,信息熵越小,变异程度越大,提供的信息量越多,其权重也就越大。由于该方法应用较为广泛,本研究不再赘述,具体计算过程参考文献[10]

BPNN是机器学习算法的经典代表,较常规赋权法更具稳定性和灵活性,且在耕地质量评价研究中趋向于成熟。本研究利用R语言构建耕地质量BPNN评价模型,通过调用neuralnet程序包,使用反向传播、弹性反向传播(RPROP)训练神经网络。

2 结果 2.1 评价指标的确定

基于上述对耕地质量内涵的分析,结合相关国家标准[32-34]和已有的研究成果[47],本研究从地形地貌、土壤条件、社会经济、生态安全4个方面选取19个指标,初步构建适用于该区域的耕地质量综合评价指标体系(表 1),其中地形地貌和土壤条件用于评价耕地的自然质量,社会经济因素用于评价耕地的经济质量,而生态安全用于评价耕地的生态质量。

表 1 耕地质量综合评价指标体系 Table 1 Comprehensive evaluation indicator system of cultivated land quality

利用Minitab18对同一个维度的初选指标进行Pearson相关分析,相关性显著的指标只保留一个,最终从19个指标中筛选出14个,构建同时适用于EW、BPNN和RF的耕地质量综合评价指标体系(表 1)。

上述构建的指标体系(表 1)虽然较为全面,但不能确定是否还存有其他影响耕地质量的因素,因此本研究利用残差系数对评价指标体系进行效度检验[17],得到残差系数为0.203,表明其他因素对耕地质量的影响可以忽略。可见,本研究构建的评价指标体系具有较强的可信性和代表性。

参考已有的研究结果[4-7],本研究将土壤图、行政区划图和最新土地利用现状图叠加形成的耕地图斑作为评价单元,研究区评价单元为16 072个,总面积为16.53万hm2

2.2 指标等级及其隶属度的确定

依据相关国家标准[32-34]及相关文献[11-12],确定各个评价指标的等级及其隶属度。本研究定性指标的隶属度采用特尔菲法获得(表 2),定量指标的隶属度则利用隶属函数计算(表 3)。

表 2 定性指标等级及其隶属度 Table 2 Classification of qualitative indicators and their affiliation

表 3 定量指标隶属函数 Table 3 Affiliation function of the quantitative indicators
2.3 评价指标权重的确定

基于RF确定评价指标的权重值(RFW)(图 3),排水能力、灌溉能力、有效磷、地形部位、有机质是影响耕地质量最重要的5个指标,权重占比达到82.41%,与相关国家标准通过专家经验确定的评价指标权重基本一致[32-34]。而坡度、交通通达度和耕作便捷度则是最小的3个指标,比例仅为1.35%。为了与RFW比较,分别基于BPNN和EW确定各评价指标的权重BPNNW和EWW(图 3)。BPNNW识别比较均衡,灌溉能力、地形部位、有机质、耕层质地、排水能力为最重要的5个指标,坡度和清洁程度为最不重要指标,与相关国家标准通过专家经验确定的评价指标权重基本相符[32-34]。在EWW中,有效磷是对耕地质量贡献最大的指标,而耕作便捷度为最小的指标。可见,RFW与BPNNW确定的权重比较相似,均与EWW具有明显的差异。地形地貌是限制丘陵地区耕地水土肥力保持的重要因素,有机质、有效磷反映了土壤的肥力水平,完善的田间排灌设施有利于维持农作物适宜的水分,因此它们是影响耕地质量的重要因素。但由于当地是重要的农业生产区,耕地质量受自然因素的影响较强,而受社会经济因素影响较弱,因而RF识别交通通达度和耕作便捷度是影响耕地质量较小的因子。

注:SL、TS、SST、SAK、SOM、SAP、EF、TA、CL、BI、TTL、IC、DC分别代表坡度、地形部位、耕层质地、土壤速效钾、土壤有机质、土壤有效磷、耕作便捷度、交通通达度、清洁程度、生物多样性、有效土层厚度、灌溉能力、排水能力。  Note: SL, TS, SST, SAK, SOM, SAP, EF, TA, CL, BI, TLT, IC, DC are Slope, Topographic site, Surface soil texture, Soil available potassium, Soil organic matter, Soil available phosphorus, Ease of farming, Traffic accessibility, Cleanliness, and Biodiversity, Thickness of tillage layer, Irrigation capacity, Drainage capacity, respectively. 图 3 基于随机森林(RF)、后向传播神经网络(BPNN)、熵权(EW)确定的指标权重 Fig. 3 Indicator weights based on Random Forest(RF), Back Propagation neural network(BPNN), and Entropy weights(EW)

EWW依据原始数据的分布结构计算指标权重,而RFW和BPNNW根据Gini系数减少值确定指标权重,具有更强的解释能力,更能反映耕地质量系统的非线性特征。此外,RF均方误差为0.001 9,平均预测精度为93.01%,收敛时间为4.43s,而BPNN均方误差为0.005 7,平均预测精度为88.19%,收敛时间为5.87s,表明RF具有更强的解释能力、更高的预测精度和更快的运算速度。

2.4 评价结果分析与对比

基于表 1,依据全国耕地质量等级成果,在襄州区随机选取不同质量等级的耕地图斑生成原始样本集,同时根据样本的空间位置进行调整,以体现样本分布的均匀性,共选取1590组样本,随机选取70%的数据作为训练样本,20%作为测试样本,10%作为检验样本(图 4)。本研究利用R语言的randomForest库,训练耕地质量RF评价模型,并将其运用于襄州区2018年耕地质量评价。训练样本的决定系数R2位于0.772 7~0.948 3范围内,且在0.05的水平下显著,表明预测精度较高。

图 4 耕地质量样本的空间分布 Fig. 4 Spatial distribution of cultivated land quality samples

根据RFW、BPNNW和EWW分别计算襄州区2018年耕地质量指数,并利用自然断裂法将耕地质量从高到低依次划分为5级:一等级、二等级、三等级、四等级、五等级(图 5表 4)。此外,本研究以耕地图斑为单元分别汇总各个乡镇和地类(水田、水浇地、旱地)的平均耕地质量指数,从中观尺度上探讨耕地质量在乡域、地类之间的差异性和可比性,为县级政府制定耕地资源管护政策提供理论依据。

图 5 耕地质量等级空间分布:a)基于随机森林(RF);b)基于后向传播神经网络(BPNN);c)基于熵权(EW) Fig. 5 Spatial distribution of cultivated land quality grades: a)Random forest(RF)—based, b)Back propagation neural network(BPNN)—based, and c)Entropy weight(EW)—based

表 4 基于RF、BPNN、EW的耕地质量等级面积统计 Table 4 Area statistics of cultivated land quality grades based on RF, BPNN, and EW

根据RF模型,襄州区平均耕地质量指数为0.827 5,整体质量较好。二、三等级的耕地面积较大,占比达到54.63%,而一等级和五等级的耕地面积比重较小,分别为8.88%、8.23%,可见,各个等级的面积基本符合正态分布(表 4)。从平均耕地质量指数来看,张家集、张湾、双沟、古驿、龙王最高,分别为0.851 7、0.847 5、0.839 5、0.837 5、0.835 6,但峪山、伙牌、黄龙比较小,分别为0.817 5、0.814 9、0.809 4。就不同地类而言,水田、水浇地、旱地的平均耕地质量指数依次为0.828 6、0.828 2、0.826 7,表明水田的质量最好。此外,由于受地形地貌的影响,襄州区耕地质量空间分布差异较为显著,形成了“中北部高,南部低”的空间格局。质量较高的耕地主要分布在中部的张家集、张湾、双沟以及北部的龙王、古驿等乡镇,质量较低的耕地主要聚集在南部的峪山、黄龙等乡镇(图 5a)。襄州中部区域位于汉江流域的冲积平原地带,地势较低,地形较为平坦,土壤较为肥沃,受经济发展的影响,该区域存在一定的污染源,影响土壤的清洁程度,但该区域河流较多,排灌设施较为完善,总体而言,肥沃的冲积平原适宜发展耕作农业。襄州北部和南部属于岗地、丘陵地貌,海拔较高,坡度较大,容易造成土壤侵蚀,土壤较为贫瘠,由于水源较少,排灌设施条件一般,虽然耕地面积较大,但由于粗放式耕作,土地利用水平较低。

襄州区平均耕地质量指数,RF>BPNN>EW,分别为0.827 5、0.827 1、0.753 2。基于RF和BPNN的各个乡镇平均耕地质量指数比较接近,但乡镇之间也存在一定的差异。双沟镇基于RF评价的耕地质量等级较高,而基于BPNN评价的耕地质量等级相对偏低(图 5a图 5b)。双沟镇地势较低,地形较为平坦,土壤较为肥沃,境内河流众多,水资源丰富,排灌设施较为完备,因此,双沟镇理论上耕作条件优势明显,耕地质量等级应该较高,也与已有的研究成果相符[35-36]。但是EW的评价结果与RF、BPNN具有明显的差异,耕地质量较高的区域主要集中在张湾、双沟、程河,耕地质量较低的区域主要分布在伙牌、峪山、黄龙(图 5c)。

2.5 RF模型合理性检验

为了进一步检验耕地质量RF评价模型的合理性,本研究对RF、BPNN和EW评价结果的一致性进行分析,使用4个指标来验证RF模型的合理性和先进性:平均绝对误差(MAE)、均方误差(MSE)、决定系数(R2)及显著性。

(1)一致性检验。通过分析RF与BPNN、RF与EW评价耕地质量等级的差异性,以检验RF模型的合理性,具体过程为:首先,将耕地质量一等级、二等级、三等级、四等级、五等级分别赋值为1、2、3、4、5。其次,将基于RF评价的耕地质量等级赋值与10相乘,并与基于BPNN和EW评价的耕地质量等级赋值相加,得到结果为两位数字。如果两位数字相同,那么RF与BPNN、EW的评价结果相同,否则具有差异,耕地质量等级差异的空间分布如图 6所示。耕地质量等级标注的第一个数字为基于RF评价的等级,第二个数字表示基于BPNN或EW评价的等级。

图 6 耕地质量等级差异空间分布(a)RF与BPNN,b)RF与EW Fig. 6 Spatial distribution of cultivated land quality grade differences between a)RF and BPNN and b)RF and EW

基于RF与BPNN评价耕地质量等级的差异,误差个数占比为22.74%,主要聚集在一个级别的差异,其误差个数比例高达99.36%(图 6a)。而基于RF与EW评价耕地质量等级的差异,误差个数占比相对较高,达到48.24%,主要聚集在一个级别的差异,其误差个数占比为79.67%(图 6b)。由此表明,基于RF与BPNN评价耕地质量等级的一致性相对较高。在这些误差中,基于EW评价的耕地质量较高,而基于RF和BPNN评价的质量较低的区域,部分属于地势较高,土壤肥力较差,排灌设施条件一般的区域,其耕地质量的高低主要受地形和土壤肥力的约束,理论上耕地质量相对较低。EW识别为耕地质量较低而RF、BPNN识别为较高的地区,部分为地形平坦,土壤较为肥沃且生物多样性丰富的区域,理论上具有较高的耕地质量。可见,相比EW,基于RF和BPNN评价的耕地质量等级更加符合客观实际,也与已有的研究成果基本相符[35-36]

(2)先进性检验。为了进一步比较RF模型的先进性,选择检验集样本数据,分别构建基于RF和BPNN的耕地质量评价模型。RF的MAE为0.009,MSE为0.012,均小于BPNN。RF的决定系数R2为0.814 5,大于BPNN。F检验表明,RF在5%水平下显著,而BPNN不显著。由此可见,RF评价误差最小,精度最高,稳定性最好,可以优先选择RF进行耕地质量评价。

3 讨论 3.1 构建一套耕地质量综合评价指标体系

指标体系的构建是开展质量评价的核心工作[21]。孔祥斌等[18]创建了基于农户土地利用目标变化的“压力-状态-效应-响应”耕地质量评价指标体系。陈正发等[37]基于最小数据集构建“要素-需求-调控”的坡耕地质量评价体系。由于耕地质量系统具有复杂性、非线性等特点,评价指标应全面考虑地形、土壤理化性质、生态等影响因素。但传统的耕地质量评价仅选取土壤因素和地形作为指标,对生态因素考虑不足[29]。因此,建立考虑社会经济因素以及生态环境的耕地质量评价指标体系显得尤为重要。本研究从地形地貌、土壤条件、社会经济、生态安全4个方面选取14个指标,构建用于评价耕地质量的综合评价指标体系。但在生物多样性数据的获取上,由于研究区域实验条件的限制,未能对其全面分析,仅通过土壤中蚯蚓数量来表达,有待进一步深入研究。在清洁度数据的获取上,由于数据缺失,未能从环境质量的实质入手,仅选择几个重金属元素进行分析,对于生态环境质量的分析还不够全面,有待深入研究。

3.2 研究尺度对指标选取的影响

耕地质量评价具有空间尺度效应[38]。小尺度的耕地质量评价主要选取地形和土壤理化性状等微观因子,着重评价耕地的自然质量;在大尺度上,从自然环境、土地利用水平、经济水平等方面选取宏观因子。县域是我国耕地管理的基本行政单元,耕地质量评价结果可直接作为县级政府制定耕地管护政策的理论依据。因此,本研究以襄州区为研究区域,从地形地貌、土壤条件、社会经济、生态安全4个维度构建耕地质量综合评价指标体系,反映了公众对耕地功能多样化的需求,可为全国县域尺度的耕地评价提供理论参考,也可为襄州区的耕地管理提供技术支撑。然而,由于受尺度效应的影响,不同尺度的耕地质量评价指标体系的可比性仍然存在不足[4],需要进一步深入研究不同尺度耕地质量评价指标体系的构建、尺度转换等问题。

3.3 设计一种基于RF的耕地质量评价智能模型

如何科学合理确定指标权重是构建耕地质量评价模型的核心[17]。林子聪等[39]运用随机森林算法,通过构建耕地质量回归模型确定指标权重。为进一步验证RF的可靠性和优越性,本研究选用EW、BPNN、RF 3种模型进行训练,通过仿真输出耕地质量评价结果。相比EW和BPNN,RF评价精度更高,更加符合客观实际。然而,训练样本选取方法不同,耕地质量评价结果也会不同,本研究仅采用均匀法选取样本,有待深入研究不同样本选取方法对评价结果的影响。

在实际过程中,由于影响耕地质量的因素比较复杂,评价模型是否合理,将直接影响耕地质量评价结果的准确性。此外,指标权重是在RF模型的训练过程中根据真实数据的属性值分解规则自动生成的。但是随着社会经济的发展,耕地质量内涵将发生变化,评价指标将会相应改变,评价方法和手段也将会日益丰富。尤其随着我国天空地一体化监测技术的发展,可获取的耕地质量评价指标将会更加精细,评价结果将会更加精准。因此,本研究基于现状评价指标构建的RF评价模型,并不适用于未来的耕地质量评价,应结合研究地区未来的实际情况以及影响耕地质量的自然因素和社会经济因素,进一步完善RF模型,提高耕地质量评价的精度,将是下一步研究的重难点。

4 结论

本研究构建了基于RF的耕地质量评价智能模型,并将其应用于襄州区2018年的耕地质量评价。同时,以BPNN和EW作为对比,验证三种模型的优劣。襄州区耕地质量总体较好,以二、三等级为主,累积占比为54.63%。襄州区耕地质量空间分布不平衡,受地形地貌和社会经济发展水平影响较大,呈现出明显的地域分异规律,高质量的耕地主要分布在中北部,而低质量的耕地主要聚集在南部,而且各乡镇耕地质量等级的分布差别也较大。相比于BPNN和EW,耕地质量评价RF模型能够较为精确地模拟指标之间的复杂关系,科学定量分析各指标对耕地质量的贡献,具有更高的数据挖掘能力和训练精度,其评价结果最为理想,能有效运用于具有系统性和非线性等特点的耕地质量评价研究,可为制定合理有效的耕地管理政策提供技术支持,也可供其他类似地区的耕地质量评价借鉴和参考。

参考文献
[1]
Jiang G H, Zhang R J, Ma W Q, et al. Cultivated land productivity potential improvement in land consolidation schemes in Shenyang, China: Assessment and policy implications[J]. Land Use Policy, 2017, 68: 80-88. DOI:10.1016/j.landusepol.2017.07.001 (0)
[2]
Kong X B. China must protect high-quality arable land[J]. Nature, 2014, 506(7486): 7. DOI:10.1038/506007a (0)
[3]
Wang N, Zu J, Li M, et al. Spatial zoning of cultivated land in Shandong Province based on the trinity of quantity, quality and ecology[J]. Sustainability, 2020, 12(5): 1849. DOI:10.3390/su12051849 (0)
[4]
Shen R F, Chen M J, Kong X B, et al. Conception and evaluation of quality of arable land and strategies for its management (In Chinese)[J]. Acta Pedologica Sinica, 2012, 49(6): 1210-1217. [沈仁芳, 陈美军, 孔祥斌, 等. 耕地质量的概念和评价与管理对策[J]. 土壤学报, 2012, 49(6): 1210-1217.] (0)
[5]
Wu X G, Zhang H F, Sun L, et al. Spatial evolution of cultivated land quality of Inner Mongolia in the vision of trinity conservation (In Chinese)[J]. Journal of Arid Land Resources and Environment, 2020, 34(6): 48-55. [吴晓光, 张宏飞, 孙林, 等. 三位一体保护视角下内蒙古耕地质量空间演变研究[J]. 干旱区资源与环境, 2020, 34(6): 48-55.] (0)
[6]
Fu G Z, Bai W Q. Advances and prospects of evaluating cultivated land quality (In Chinese)[J]. Resources Science, 2015, 37(2): 226-236. [付国珍, 摆万奇. 耕地质量评价研究进展及发展趋势[J]. 资源科学, 2015, 37(2): 226-236.] (0)
[7]
Xin Y N, Fan S Y, Kong X B, et al. Evaluation of cultivated land quality based on four quality dimensions (In Chinese)[J]. Resources Science, 2018, 40(4): 737-747. [辛芸娜, 范树印, 孔祥斌, 等. 四重质量维度下的县域耕地质量评价方法研究[J]. 资源科学, 2018, 40(4): 737-747.] (0)
[8]
Song W, Pijanowski B C. The effects of China's cultivated land balance program on potential land productivity at a national scale[J]. Applied Geography, 2014, 46: 158-170. DOI:10.1016/j.apgeog.2013.11.009 (0)
[9]
曹隽隽. 江汉平原耕地质量与粮食生产能力时空耦合研究[D]. 武汉: 华中师范大学, 2013.
Cao J J. Research on spatio-temporal coupling relationship between grain production capacity and quality of cultivated land[D]. Wuhan: Central China Normal University, 2013. (0)
[10]
Kuang L H, Ye Y C, Zhao X M, et al. Evaluation and obstacle factor diagnosis of cultivated land system security in Yingtan City based on the improved TOPSIS method (In Chinese)[J]. Journal of Natural Resources, 2018, 33(9): 1627-1641. [匡丽花, 叶英聪, 赵小敏, 等. 基于改进TOPSIS方法的耕地系统安全评价及障碍因子诊断[J]. 自然资源学报, 2018, 33(9): 1627-1641.] (0)
[11]
Nie Y, Zhou Y, Yu J, et al. Farmland quality evaluation based on GIS and fuzzy matter-element proximity cluster analysis model (In Chinese)[J]. Acta Pedologica Sinica, 2005, 42(4): 551-558. DOI:10.3321/j.issn:0564-3929.2005.04.004 [聂艳, 周勇, 于婧, 等. 基于GIS和模糊物元贴近度聚类分析模型的耕地质量评价[J]. 土壤学报, 2005, 42(4): 551-558.] (0)
[12]
Zhao J J, Zhang H Y, Wang Y Q, et al. Research on the quality evaluation of cultivated land in provincial area based on AHP and GIS: A case study in Jilin Province (In Chinese)[J]. Chinese Journal of Soil Science, 2012, 43(1): 70-75. [赵建军, 张洪岩, 王野乔, 等. 基于AHP和GIS的省级耕地质量评价研究——以吉林省为例[J]. 土壤通报, 2012, 43(1): 70-75.] (0)
[13]
Meng X L, Shi F G. An extended data envelopment analysis for the decision-making[J]. Journal of Inequalities and Applications, 2017, 2017(1): 240. DOI:10.1186/s13660-017-1502-0 (0)
[14]
Ye Y, Zhao X J, Hu Y M. Evaluation of cultivated land quality in Pearl River Delta based on GA-BP neural network (In Chinese)[J]. Ecology and Environmental Sciences, 2018, 27(5): 964-973. [叶云, 赵小娟, 胡月明. 基于GA-BP神经网络的珠三角耕地质量评价[J]. 生态环境学报, 2018, 27(5): 964-973.] (0)
[15]
Pan R Q, Ma X S, Liu J. Calculation model of cultivated land nature quantity score based on PSO-BP neural network (In Chinese)[J]. Geography and Geo-Information Science, 2014, 30(5): 78-82. DOI:10.3969/j.issn.1672-0504.2014.05.016 [潘润秋, 马小淞, 刘珺. 基于粒子群优化BP神经网络的耕地自然质量分计算模型[J]. 地理与地理信息科学, 2014, 30(5): 78-82.] (0)
[16]
Li L L. Model of productivity of cultivated land based on improved-SVM (In Chinese)[J]. Journal of Shenyang Agricultural University, 2012, 43(1): 126-128. [李露璐. 基于改进的SVM算法的耕地地力评价模型研究[J]. 沈阳农业大学学报, 2012, 43(1): 126-128.] (0)
[17]
Chen D L, Lu X H, Kuang B. Measurement of cultivated land utilization efficiency: Construction and application of random forest (In Chinese)[J]. Journal of Natural Resources, 2019, 34(6): 1331-1344. [陈丹玲, 卢新海, 匡兵. 基于随机森林的耕地利用效率测度模型构建及其应用[J]. 自然资源学报, 2019, 34(6): 1331-1344.] (0)
[18]
Kong X B, Liu L W, Qin J. Arable land evaluation based on the household land use behavior in Daxing district of Beijing (In Chinese)[J]. Acta Geographica Sinica, 2008, 63(8): 856-868. DOI:10.3321/j.issn:0375-5444.2008.08.007 [孔祥斌, 刘灵伟, 秦静. 基于农户土地利用行为的北京大兴区耕地质量评价[J]. 地理学报, 2008, 63(8): 856-868.] (0)
[19]
Raiesi F, Salek-Gilani S. Development of a soil quality index for characterizing effects of land-use changes on degradation and ecological restoration of rangeland soils in a semi-arid ecosystem[J]. Land Degradation & Development, 2020, 31(12): 1533-1544. (0)
[20]
Fresno T, Peñalosa J M, Flagmeier M, et al. Aided phytostabilisation over two years using iron sulphate and organic amendments: Effects on soil quality and rye production[J]. Chemosphere, 2020, 240: 124827. DOI:10.1016/j.chemosphere.2019.124827 (0)
[21]
Li Q, Xu M X, Zhao Y G, et al. Gully erosion soil quality assessment on the cultivated slope land in the loess plateau region, China (In Chinese)[J]. Journal of Natural Resources, 2012, 27(6): 1001-1012. [李强, 许明祥, 赵允格, 等. 黄土高原坡耕地沟蚀土壤质量评价[J]. 自然资源学报, 2012, 27(6): 1001-1012.] (0)
[22]
Lehmann J, Kleber M. The contentious nature of soil organic matter[J]. Nature, 2015, 528(7580): 60-68. DOI:10.1038/nature16069 (0)
[23]
Xu Z W, Zhang T, Wang S Z, et al. Soil pH and C/N ratio determines spatial variations in soil microbial communities and enzymatic activities of the agricultural ecosystems in Northeast China: Jilin Province case[J]. Applied Soil Ecology, 2020, 155: 103629. DOI:10.1016/j.apsoil.2020.103629 (0)
[24]
Khadka D, Lamichhane S, Amgain R, et al. Soil fertility assessment and mapping spatial distribution of Agricultural Research Station, Bijayanagar, Jumla, Nepal[J]. Eurasian Journal of Soil Science, 2019, 8(3): 237-248. (0)
[25]
Tyler M, Hunter L, Steiner F, et al. Use of agricultural land evaluation and site assessment in Whitman County, Washington, USA[J]. Environmental Management, 1987, 11(3): 407-412. DOI:10.1007/BF01867169 (0)
[26]
Hu Q L, Yang Y H, Han S M, et al. Degradation of agricultural drainage water quantity and quality due to farmland expansion and water-saving operations in arid basins[J]. Agricultural Water Management, 2019, 213: 185-192. DOI:10.1016/j.agwat.2018.10.019 (0)
[27]
Li J S, Fei L J, Li S, et al. The influence of optimized allocation of agricultural water and soil resources on irrigation and drainage in the Jingdian Irrigation District, China[J]. Irrigation Science, 2020, 38(1): 37-47. DOI:10.1007/s00271-019-00649-z (0)
[28]
Kang C D. The effects of spatial accessibility and centrality to land use on walking in Seoul, Korea[J]. Cities, 2015, 46: 94-103. DOI:10.1016/j.cities.2015.05.006 (0)
[29]
Yang Q J, Wu K N, Feng Z, et al. Soil quality assessment on large spatial scales: Advancement and revelation (In Chinese)[J]. Acta Pedologica Sinica, 2020, 57(3): 565-578. [杨淇钧, 吴克宁, 冯喆, 等. 大空间尺度土壤质量评价研究进展与启示[J]. 土壤学报, 2020, 57(3): 565-578.] (0)
[30]
Zou J, Lu J W, Zhou X Z, et al. Evaluation of soil fertility in tobacco-growing areas in Hubei Province (In Chinese)[J]. Resources and Environment in the Yangtze Basin, 2015, 24(3): 504-510. [邹娟, 鲁剑巍, 周先竹, 等. 湖北省主要植烟区土壤肥力状况及分析[J]. 长江流域资源与环境, 2015, 24(3): 504-510.] (0)
[31]
Ma J F, Chen Y P, Antoniadis V, et al. Assessment of heavy metal(loid)s contamination risk and grain nutritional quality in organic waste-amended soil[J]. Journal of Hazardous Materials, 2020, 399: 123095. (0)
[32]
中华人民共和国国家质量监督检验检疫总局, 中国国家标注化管理委员会. GB/T 33469-2016耕地质量等级[S]. 北京: 中国标准出版社, 2016
General Administration of Quality Supervision, Inspection and Quarantine of the People's Republic of China, China National Standardization Administration Committee. GB/T 33469-2016 Farm Land Quality Grade[S]. Beijing: China Standard Press, 2016. (0)
[33]
中华人民共和国农业农村部耕地质量监测保护中心. 全国耕地质量等级评价指标体系[Z]. 北京: 中华人民共和国农业农村部, 2019.
Center for Monitoring and Protection of Arable Land Quality, Ministry of Agriculture and Rural Affairs of the People's Republic of China. National Arable Land Quality Grade Evaluation Indicator System[S]. Beijing: Ministry of Agriculture and Rural Affairs of the People's Republic of China, 2019. (0)
[34]
中华人民共和国国家质量监督检验检疫总局, 中国国家标准化管理委员会. GB/T 28407-2012农用地质量分等规程[S]. 北京: 中国标准出版社, 2012.
General Administration of Quality Supervision, Inspection and Quarantine of the People's Republic of China, China National Standardization Administration Committee. GB/T 28407-2012 Regulations for Classification on Agriculture Land[S]. Beijing: China Standard Press, China, 2012. (0)
[35]
Zhang Z H, Nie Y, Ma Z Y. Evaluation of cultivated land quality based on BP neural network method—A case study at Xiangyang urban area (In Chinese)[J]. China Agricultural Informatics, 2019, 31(2): 72-83. [张朝晖, 聂艳, 马泽玥. 基于BP神经网络法的耕地质量定级评价—以襄阳市城区为例[J]. 中国农业信息, 2019, 31(2): 72-83.] (0)
[36]
Zeng R, Zhao R, Liang Y. Cultivated land quality assessment based on AHP-grey correlation analysis method—Taking Xiangyang City of Hubei Province as an example (In Chinese)[J]. Science of Surveying and Mapping, 2018, 43(8): 90-96. [曾荣, 赵荣, 梁勇. AHP-灰色关联度分析法的耕地质量评价—以湖北省襄阳市为例[J]. 测绘科学, 2018, 43(8): 90-96.] (0)
[37]
Chen Z F, Shi D M, He W, et al. Quality evaluation of slope farmland in Yunnan Province based on "element-demand-regulation" framework (In Chinese)[J]. Transactions of the Chinese Society of Agricultural Engineering, 2020, 36(12): 236-246. [陈正发, 史东梅, 何伟, 等. 基于"要素-需求-调控"的云南坡耕地质量评价[J]. 农业工程学报, 2020, 36(12): 236-246.] (0)
[38]
Turner M G, O'Neill R V, Gardner R H, et al. Effects of changing spatial scale on the analysis of landscape pattern[J]. Landscape Ecology, 1989, 3(3): 153-162. (0)
[39]
Lin Z C, Ren X N, Zhu A X, et al. Research on the index system of cultivated land quality grading based on random forest algorithm (In Chinese)[J]. Journal of South China Agricultural University, 2020, 41(4): 38-48. [林子聪, 任向宁, 朱阿兴, 等. 基于随机森林算法的耕地质量定级指标体系研究[J]. 华南农业大学学报, 2020, 41(4): 38-48.] (0)