作为衡量土壤紧实度的重要指标,容重不仅可以基于土壤孔隙度表征土壤的物理性质,还可以基于土壤有机质等要素的储量反映土壤的肥力水平[1-2]。了解土壤容重状况是研究土壤理化性质的基础。传统的土壤容重测定方法为环刀法,该方法原理简单、测定精度高,但存在野外采样环节多、某些情况下操作过程难度大以及人力物力成本高等问题[3-4],这导致全球范围内土壤属性数据库均存在容重数据大面积缺失的情况[5-6]。填补土壤容重缺失数据是健全区域土壤属性数据库和全面掌握土壤理化性质演变信息所必需的环节。因此,通过已有样点数据实现对土壤容重低成本且高精度的预测成为了土壤科学的一个研究重点。
国内外学者根据容重与土壤属性间的关系构建数学模型以实现对土壤容重的预测,该方法被称为土壤传递函数(Pedotransfer Functions,PTFs)[7-8]。我国多地使用PTFs对土壤容重进行预测并取得了不错的效果。如门明新等[9]、刘继红等[10]和李颖等[11]基于全国第二次土壤普查资料分别构建了河北省、河南省和南方喀斯特地区的土壤容重传递函数模型,补全了地方土壤属性数据库中缺失的容重数据。韩光中等[12]将2 441个土壤样点划分为12个土纲,归纳出我国主要土壤类型的土壤容重传递函数。这些研究发现,PTFs虽然操作简单快速,但存在较差的区域适用性。这是因为成土因素、土壤类型以及土壤性质等因素对土壤容重均有影响,且在不同区域或同一区域不同亚区的影响程度明显不同[13-16]。而基于回归模型构建的土壤容重预测模型很难准确揭示土壤容重与各影响因素间的复杂关系,导致现有模型的预测精度普遍不高[17-19]。因此,准确表达土壤容重与各影响因素间的复杂映射关系进而构建适合特定区域的高精度土壤容重预测模型亟待解决。
近年来,人工神经网络(Artificial Neural Network,ANN)模型和随机森林(Random Forest,RF)模型等机器学习方法凭借计算快速准确、学习能力强且对多元共线性不敏感等特点在预测土壤容重上受到了研究人员的青睐[20-22]。如高如泰等[23]构建了地处黄淮海平原的曲周县基于BP神经网络的土壤转换函数模型,预测效果明显优于多元线性回归(Multiple Linear Regression,MLR)模型。杨玮等[24]利用100个土壤样本构建的支持向量机回归土壤容重预测模型,也大幅度提高了土壤容重的预测精度。然而,基于140个土壤表层调查数据构建的安徽省土壤容重随机森林预测模型结果表明,机器学习方法可以有效降低模型过拟合问题,但样点密度较低和考虑的环境因子较少会导致其预测精度不高[25]。这些研究表明,运用机器学习方法构建的土壤容重预测模型在小区域范围内预测精度优于传统的PTFs,但在较大的研究尺度下其预测精度还有待进一步提高。
作为我国四大盆地之一,四川盆地耕地面积广阔,农业历史悠久,是我国重要的粮食产区之一[26-28]。全国第二次土壤普查资料中,该区域近30%耕地土壤容重数据缺失,制约了对该区域耕地土壤理化性质演变规律的准确把握。因此,本研究在收集整理全国第二次土壤普查四川盆地典型土壤样点数据的基础上,运用方差分析、回归分析和随机森林模型分析了成土因素、土壤类型以及土壤性质(质地类型、pH和有机质)等因素对土壤容重的影响,采用径向基函数神经网络模型构建该区域土壤容重预测模型,并与传统土壤传递函数、多元线性回归模型和随机森林模型进行对比,以期提高较大研究尺度下耕地土壤容重缺失值的预测精度,为更好地补全区域土壤属性数据库和准确掌握耕地土壤质量演变提供方法参考。
1 材料与方法 1.1 研究区概况四川盆地(含四川省和重庆市)位于我国西南腹地(27°38′-32°54′ N、102°48′-109°16′ E,图 1a),面积约为26万km2;耕地面积约占盆地总面积的76%[28](中国科学院资源环境科学与数据中心(https://www.resdc.cn/)2020年中国土地利用遥感监测数据集),是我国长江中上游地区重要的粮食产区。盆地整体地势中间低,四周高,按照地形和水系可进一步细分为岷江流域、沱江流域、涪江流域、嘉陵江流域、渠江流域以及长江干流区6个亚流域(图 1a)[29]。四川盆地属亚热带季风性气候,气象站点数据统计显示年平均气温为14.9~18.6℃,年均降水量为700~1700 mm,年日照时数为900~1300 h,无霜期约为280~350 d。成土母质主要有侏罗系的蓬莱镇组、沙溪庙组和遂宁组、白垩系的夹关组和灌口组紫色砂泥岩风化物,上更新统黄色黏土和中下更新统老冲积物以及近代河流冲积物。土壤类型以紫色土和水稻土为主,分别约占盆地总面积的45%和31%,其次为地带性土壤黄壤。耕地利用类型主要包括旱地、水旱轮作地以及水田三类。
![]() |
图 1 四川盆地位置和土壤样点分布图 Fig. 1 Distribution of the Sichuan Basin and soil sample sites |
(1)土壤数据。通过收集整理四川盆地范围内各区县全国第二次土壤普查土种志,获得了可代表整个区域主要土种的4 219个典型土壤样点数据,包括采样地点、成土母岩、地形部位、土壤类型、土壤pH以及有机质等环境信息和土壤理化指标。其中,2 883个土壤样点记录了表层土壤容重值,1 336个土壤样点的表层土壤容重值缺失(图 1b)。此外,近60%土壤样点没有详细的土壤颗粒组成信息,只记录了土壤质地类型(卡庆斯基制)。根据记录资料,土壤样点所在母岩主要有第四系全新统和更新统,白垩系城墙岩群、嘉定群、灌口组和夹关组,侏罗系蓬莱镇组、沙溪庙组、遂宁组和自流井组以及三叠系须家河组等10余个群组。土壤类型主要为紫色土、水稻土、黄壤、新积土、灰潮土以及石灰(岩)土。根据土壤样点所在地块的种植制度,将耕地利用类型划分为旱地、水旱轮作地以及水田3种。为避免受到异常值的影响,分别在土壤类型和耕地利用类型中用均值加减3倍标准差判断异常值[29],并以两种分类方式下的正常最大值或最小值替换被同时标记为异常值的数值。为后续评价模型预测精度,利用ArcGIS 10.6软件的地统计分析模块将已有容重数值的2 883个土壤样点划分为两个部分,即随机抽出15%(432个)的土壤样点作为独立样点验证集,另外85%(2 451个)的土壤样点作为建模样点数据集(图 1b)。
(2)影响因素数据。参照现有研究结果,选择气候(年、四季气温和降雨量)、地形(高程、坡度、坡向、平面曲率、剖面曲率以及地形湿度指数)、成土母岩(地层群组类型)、耕地利用类型以及土壤属性(土壤亚类类型、质地类型、土壤pH和有机质)5方面因素,共22个因子作为预测模型的辅助变量。其中,气象数据为研究区及其周边144个县级气象站点1961—1980年的逐日气温数据和降雨量数据;首先利用气象数据计算得到各气象站点年和四个季节的气温均值和降雨量均值,然后在ArcGIS 10.6软件中采用普通克里格法分别对其进行插值,从而得到四川盆地年和四个季节的气温均值和降雨量均值空间分布栅格数据。地形数据为ALOS 12.5 m DEM,来源于中国科学院资源环境科学与数据中心(https://www.resdc.cn/);基于该数据在ArcGIS 10.6软件中计算得到研究区高程、坡度、坡向、平面曲率、剖面曲率以及地形湿度指数等地形因子。各土壤样点的气象因子及地形因子信息通过其位置提取得到。对地层群组类型、耕地利用类型、土壤亚类类型及质地类型等定性分类变量采用类别均值代替类别名称,作为变量值用于模型构建。
1.3 研究方法(1)径向基函数神经网络模型。径向基函数神经网络(Radial Basis Function Neural Network,RBFNN)模型是一种以函数逼近为基础,具有单隐层的3层前馈人工神经网络,结构简单、参数调节方便且学习速度快[30]。该方法可以准确揭示多元环境变量与目标变量间的非线性映射关系,被广泛运用到土壤性质的预测研究中[31-33]。本研究利用RBFNN模型建立了影响因子与土壤容重间的映射关系预测模型,具体过程如下:
(a)将土壤样点按其所在的亚流域分为6组,采用相关分析确定各亚流域中与土壤容重具有显著相关关系(P < 0.05)的影响因子。
(b)在不同亚流域中,将与土壤容重具有显著相关性的影响因子作为RBFNN模型的输入变量,土壤容重作为输出变量,建立土壤容重与影响因素间关系的预测模型。
(c)通过编程搜索,获得各亚流域RBFNN预测模型的最优扩展常数和隐含层节点数。即在0.01至3.00范围内以0.01作为间隔,隐含层节点数以1为间隔,逐步搜索将验证点预测结果均方根误差最小的最优参数组合,进而确定各亚流域土壤容重的最优RBFNN预测模型,记为RBFNN_分流域。
为对比分流域建模与不分区建模和分土类建模的预测效果,根据上述过程依次建立不分区的RBFNN预测模型(记为RBFNN_不分区)和分土类的RBFNN预测模型(记为RBFNN_分土类)。其中,潮土和新积土合并后能更好找到影响这两个土类容重的影响因子,故在分土类建模时将这两个土类进行合并。上述方法建模过程均在MATLAB 2022软件中完成。
(2)随机森林模型。随机森林(Random Forest,RF)模型是一种基于决策树延伸出的机器学习算法,对多元共线性不敏感,不仅可以通过减少模型过拟合提高预测精度,更能对缺失数据和非平衡数据实现稳健估计[24]。本研究中采用与RBFNN模型相同的建模过程,按不分区、分流域和分土类3种方式建立基于随机森林模型的土壤容重预测模型,分别记为RF_不分区、RF_分流域和RF_分土类。为获得不同方式下构建的RF模型最优参数,本研究以验证点预测结果均方根误差最小作为评价指标,采用迭代法编程搜索决策树数(ntree)和最佳分裂次数(mtry)的最优组合。RF模型的建模过程在软件R中完成。
(3)多元线性回归模型。多元线性回归(Multiple Linear Regression,MLR)模型是一种通过多个自变量的最优组合对因变量进行预测的数学方法,建模过程简单快捷。本研究中,与RBFNN模型的建模过程相同,采用多元逐步回归方法按不分区、分流域和分土类建立土壤容重的回归预测模型,分别记为MLR_不分区、MLR_分流域和MLR_分土类。MLR模型的建模过程在软件IBM Statistics SPSS 27.0中完成。
(4)土壤传递函数。土壤传递函数(Pedotransfer Functions,PTFs)是一种根据已有土壤理化性质间的关系对未知理化性质进行模拟的数学方法。由于土壤有机质与土壤容重的相关性最为密切,且历史土壤数据库中的土壤有机质数据一般均被较完整的记录,因此本研究选用的传统土壤传递函数为土壤容重与土壤有机质间的非线性模型[12],具体表达式如下:
BD=a×bb×SOM+a×(1−SOM) | (1) |
式中,a和b为常数项,BD为土壤容重值(g·cm–3),SOM为土壤有机质含量(g·kg–1)。本研究中,根据上式按不分区、分流域和分土类建立土壤容重与土壤有机质间的非线性模型,分别记为PTFs_不分区、PTFs_分流域和PTFs_分土类。模型中的参数a和b通过MATLAB 2022软件拟合获得。
(5)精度评价方法。本研究采用决定系数(Coefficient of Determination,R2)、平均绝对误差(Mean Absolute Error,MAE)、平均相对误差(Mean Relative Error,MRE)和均方根误差(Root Mean Square Error,RMSE)作为模型的精度评价指标[25,31-32],通过对比验证样点的实测值和各方法的预测值确定最优预测方法。一般认为,R2越接近1,MRE、MAE和RMSE越接近0,预测值越接近实测值,即模型的预测精度越高。
2 结果 2.1 土壤容重统计特征统计结果表明(表 1),全国第二次土壤普查时四川盆地耕地表层土壤容重变化范围在0.60~1.71 g·cm–3之间,均值为1.29 g·cm–3,变异系数为11.90%,属中度变异。不同流域的耕地表层土壤容重均值存在显著差异(P < 0.05)。其中,嘉陵江流域土壤容重最高,平均值为1.36 g·cm–3;岷江流域土壤容重最低,平均值为1.23 g·cm–3;涪江流域和渠江流域的土壤容重显著低于嘉陵江流域(P < 0.05),但显著高于沱江流域和长江干流区(P < 0.05)。涪江流域耕地表层土壤容重为弱变异,变异系数为8.38%;其余流域为中度变异,变异系数处于10.25%~13.25%之间。
![]() |
表 1 四川盆地耕地表层土壤容重统计特征 Table 1 Statistical characteristics of cropland topsoil bulk density in the Sichuan Basin |
(1)成土母岩。方差分析结果表明(表 2),研究区不同成土母岩发育的土壤容重存在显著差异(P < 0.05)。蓬莱镇组、城墙岩群、沙溪庙组和遂宁组的土壤容重均值最高,但与嘉定群和自流井组不存在显著差异(P > 0.05)。更系统的土壤容重均值低于嘉定群和自流井组,高于夹关组,名山组、全新统和其他群组,但与这6个地层间均不存在显著差异(P > 0.05)。须家河组和灌口组的土壤容重均值最低,为1.22 g·cm–3,较其他母岩低0.02~0.10 g·cm–3。名山组的土壤容重呈弱变异,变异系数为9.86%;其余成土母岩的土壤容重为中度变异,变异系数在10.56%~13.31%之间。
![]() |
表 2 不同成土母岩发育土壤的容重统计特征 Table 2 Statistical characteristics of cropland topsoil bulk density in different soil parent rocks |
(2)土壤类型和耕地利用类型。不同土类的土壤容重存在显著差异(表 3,P < 0.05)。紫色土的容重均值最高,为1.34 g·cm–3,但与灰潮土和石灰(岩)土间差异不显著(P > 0.05)。黄壤的容重均值低于灰潮土和石灰(岩)土,高于新积土,但与这3个土类差异均不显著(P > 0.05)。水稻土的容重均值最低,较紫色土低0.08 g·cm–3,但与新积土无显著差异(P > 0.05)。四川盆地灰潮土、新积土和紫色土容重的变异系数介于7.73%~8.86%之间,具有较弱程度的变异性;而水稻土、石灰(岩)土和黄壤容重的变异系数介于11.36%~13.16%之间,均为中等变异。
![]() |
表 3 不同土类表层土壤容重统计特征 Table 3 Statistical characteristics of cropland topsoil bulk density in different soil groups |
对不同土壤亚类而言,石灰性紫色土、中性紫色土、灰潮土、石灰(岩)土和淹育水稻土的容重均值最高,但与漂洗水稻土差异不显著(表 3,P > 0.05)。潴育水稻土、酸性紫色土和黄壤的容重均值略低于漂洗水稻土,高于新积土0.03~0.05 g·cm–3,但与漂洗水稻土和新积土均无显著差异(P > 0.05)。渗育水稻土表层容重低于新积土且无显著差异(P > 0.05),但较潜育水稻土显著高出0.14 g·cm–3(P > 0.05)。从变异程度看,灰潮土、新积土、石灰性紫色土和中性紫色土的容重变异系数处于7.73%~9.46%之间,变异性较弱;其余土壤亚类的容重具有中等程度的变异性,潜育水稻土的变异系数最高,为15.67%。
3种耕地利用类型中,旱地的土壤容重均值最高,为1.32 g·cm–3,较水旱轮作地和水田分别显著高出0.05 g·cm–3和0.08 g·cm–3;水田的土壤容重均值最低,显著低于另外2种利用类型(表 4,P < 0.05)。研究区水田和水旱轮作地的土壤容重变异系数分别为14.46%和11.68%,变异程度均为中等;而旱地的土壤容重变异系数为9.66%,变异性较弱。
![]() |
表 4 不同耕地利用类型的表层土壤容重统计特征 Table 4 Statistical characteristics of cropland topsoil bulk density in different cropland use types |
(3)质地类型、土壤pH和有机质。方差分析结果表明(图 2a),不同质地类型的土壤容重略有不同,但差异并不显著(P > 0.05)。其中,砂壤的土壤容重均值最高,为1.32 g·cm–3,较黏土和砂土高0.03 g·cm–3。轻壤、中壤和重壤的土壤容重均值最低,较砂壤低0.04 g·cm–3。研究区轻壤和砂壤的土壤容重变异系数分别为8.46%和8.90%,变异性均较弱;其余各质地类型的土壤容重变异系数在10.45%~13.17%之间变化,表现为中等程度的变异性。
![]() |
注:不同小写字母表示不同质地之间的表层土壤容重均值存在显著差异(P < 0.05)。 Note: Different lowercase letters indicate significant differences in the mean bulk density among different soil texture types(P < 0.05). ①Sandy loam, ②Light loam, ③Clay soil, ④Medium loam, ⑤Heavy loam, ⑥Sandy soil 图 2 耕地表层土壤容重与质地、土壤pH和有机质的相关关系 Fig. 2 Relationships between cropland topsoil bulk density and soil texture, soil pH and soil organic matter |
相关分析表明(图 2b,图 2c),研究区耕地表层土壤容重与土壤pH呈极显著正相关关系(P < 0.001),与有机质呈极显著负相关关系(P < 0.001)。土壤容重与土壤pH和有机质的相关系数分别为0.081和0.485,表明有机质对该区耕地表层土壤容重的影响程度远高于土壤pH。
(4)地形和气候。地形因子中,坡度、坡向、平面曲率和剖面曲率与土壤容重间的相关关系不显著(P > 0.05),但高程和地形湿度指数与土壤容重之间均呈显著负相关,相关系数分别为–0.158和–0.049(P < 0.01)。气象因子中,研究区耕地表层土壤容重与气温均呈极显著正相关关系(P < 0.001),与年降雨量和夏季降雨量呈极显著负相关关系(P < 0.001),与春季降雨量和秋季降雨量呈极显著正相关关系(P < 0.001),与冬季降雨量不具有相关性(P > 0.05)。土壤容重与夏季气温的相关系数最大,为0.281(P < 0.001);与冬季降雨量均值的相关系数最小,为–0.017(P > 0.05)。
(5)主控因素。采用RF模型揭示不同影响因素对四川盆地耕地表层土壤容重的相对重要性,结果表明不同影响因子在整个四川盆地、不同亚流域和不同土类中对土壤容重的相对重要性存在明显差异(图 3)。对整个四川盆地而言,对土壤容重影响最大的因素为土壤有机质、土壤亚类和降雨量,其次为气温、高程和地质地层,而耕地利用类型、土壤pH、土壤质地和其他地形因子的影响程度较低。
![]() |
图 3 不同亚流域和土类表层土壤容重影响因素的相对重要性 Fig. 3 The relative importance of factors affecting topsoil bulk density in different sub-basins and soil groups |
不同土类中,气温和降雨量对潮土和新积土的容重影响程度最大,超过土壤有机质和高程;土壤有机质、降雨量和耕地利用类型则是石灰(岩)土容重的最重要影响因素。水稻土容重最重要的影响因素为土壤有机质、土壤亚类和降雨量,与整个四川盆地的情况基本一致。相较于其他土类,高程分别是紫色土和黄壤容重第1和第2重要因素。尽管土壤有机质是其他四类土壤容重最重要的影响因素,但对紫色土的影响程度相对较低。
不同亚流域上,岷江流域、渠江流域和沱江流域耕地土壤容重最重要的影响因素为土壤有机质、土壤亚类和降雨量,与整个四川盆地一致,但其他3个亚流域则有所不同。涪江流域耕地土壤容重最重要的因素为土壤有机质、高程、气温和降雨量此外,质地类型也具有较重要的影响。对嘉陵江流域而言,土壤亚类是该区土壤容重最重要的影响因素,其余依次为土壤有机质、气温、降雨量和土壤pH。长江干流区则是以土壤有机质、土壤亚类和耕地利用类型为土壤容重最重要的3个影响因素,其次为气温、降雨量和高程等因素。
2.3 预测精度评价对432个验证样点的预测结果表明(图 4),分流域建立的RBFNN预测模型(RBFNN_分流域)各项预测误差明显小于其他建模方式和预测方法,预测值与实测值间的决定系数(R2)为0.519,也远高于其他建模方式和预测方法。具体而言,4种方法中,RBFNN模型和RF模型对验证样点的预测精度远高于MLR模型和PTFs模型;仅以土壤有机质作为自变量的PTFs模型在3种建模方式(不分区、分流域和分土类)下预测精度均为最低,对验证样点预测结果的MRE和RMSE分别在7.157%~7.204%和0.340~0.378之间;MLR模型对验证样点预测结果的精度虽略高于PTFs模型,但其预测值与实测值间的决定系数(R2)也未超过0.4;相比MLR模型和PTFs模型,RBFNN模型和RF模型预测值与实测值间的R2均在0.4以上,各项预测误差也明显降低。对比3种建模方式可以发现,总体上分流域建模的预测精度效果最好,分土类和不分区建模的预测精度相对较低。如,RF_分流域的预测值与实测值间的R2较分土类和不分区分别提高了0.01和0.016,MRE从6.82%和6.739%降低至6.635%;RBFNN模型分流域的预测结果R2从不分区和分土类建模方式的0.414和0.466提升至0.519,MRE从6.833%和6.399%降至6.036%,RMSE则低于0.1。此外,对比RBFNN模型和RF模型的不同建模方式可以发现,尽管RBFNN_分流域模型精度达到最高,但RBFNN_不分区模型的各项精度评价指标远不如RF_分流域模型和RF_分土类模型。这说明,RBFNN_分流域模型之所以具有较高预测精度,不仅与模型本身有关,还与分流域的建模方式和将更多的影响因素作为模型的输入变量有关。
![]() |
图 4 不同预测方法下表层土壤容重预测结果的比较 Fig. 4 The prediction results of topsoil bulk density under different prediction methods |
填补土壤属性数据库中缺失的土壤容重值一直备受关注[9-12,17-19,21,25],已有研究对预测模型和精度评价方法的选取各不相同。在精度评价方法上,少部分研究从样点数据中划分出20%~30%的样点作为独立验证数据集对预测方法进行验证[17,25],但大部分研究则未划分出独立的验证数据集,而是直接将全部的样点用于建模,然后以建模样点的拟合结果作为精度评价依据[9-12,18-19,21]。已有研究中,对我国人为土土纲的土壤容重拟合R2达到0.551,均方根误差0.16 g·cm–3(建模样本数N=878,土壤容重均值为1.35 g·cm–3)[12]。利用多种方法拟合的河北省土壤容重传递函数模型均方根误差(RMSE)在0.16~0.46 g·cm–3之间(建模样本数N=695,土壤容重均值为1.37 g·cm–3)[9]。东北松嫩黑土区土壤容重预测研究中,各方法的拟合R2在0.544~0.717之间,均方根误差(RMSE)在0.112~0.145 g·cm–3之间(建模样本数N=146,土壤容重均值为1.26 g·cm–3)[18]。而采用独立验证数据集的土壤容重预测研究中,新疆主要草地的土壤容重最优预测结果R2为0.29,均方根误差(RMSE)为0.238 g·cm–3(验证样本数N=672,土壤容重均值为1.24 g·cm–3)[17]。在安徽省土壤容重的预测研究中,验证样本的预测结果R2为0.22,均方根误差为0.12 g·cm–3(验证样本数N=28,土壤容重均值为1.24 g·cm–3)[25]。本研究采用4种预测方法分3种建模方式对四川盆地耕地土壤容重进行预测,所选方法既包括了土壤容重填补常用方法(PTFs和MLR模型),也有当前在土壤性质预测中性能较好而备受关注的机器学习算法(RBFNN模型和RF模型)。由于RBFNN模型和RF模型对建模样点的拟合精度较高,RBFNN模型甚至可以零误差逼近建模样点实测值,因此本研究未列出两种方法对建模样点的拟合结果,而是选用了独立验证数据集对模型精度进行评价。研究结果发现,以多种影响因素作为模型输入变量构建的RBFNN_分流域模型获得了最高的预测精度,对432个验证样点的预测结果R2达到了0.519,均方根误差(RMSE)小于0.1 g·cm–3,相对误差为6.036%,非常接近实验室实测过程中5%的平行误差要求。同时,RBFNN_分流域模型对验证样点的预测能力达到甚至超过了部分研究中各方法对建模样点的拟合能力。
对比3种建模方式下的4种方法可以发现,RBFNN_分流域模型具有较高的预测能力主要源于将多种影响因素作为模型输入变量、分流域建模方式以及RBFNN的模型性能3个方面。首先,土壤是多种因素共同作用下的产物,其性质受各种因素的共同影响。研究表明,土壤容重与成土母岩、气象因子和土地利用等因素密切相关[4,12-16,34]。如,母岩决定着土壤中矿物组成,进而影响着土壤密度和土壤容重[34]。气候和地形则控制着母岩的风化与物质的运移,从而与土壤容重呈显著的相关关系[4,12-13]。不同土地利用类型的耕作管理措施差异明显,影响着土壤孔隙度和压实度等土壤理化性质,使得不同利用方式下土壤容重存在显著差异[15,34]。因此,仅以一两个因子作为自变量很难揭示土壤容重的变异性[30]。本研究中仅以土壤有机质作为模型输入的PTFs模型预测效果最差也证明了这一点。类似的,新疆主要草地土壤容重预测模型中也仅以土壤有机碳作为自变量,未考虑地形、气候和母质等因素,使得其预测精度提高有限[17]。引入多种因素作为模型输入变量可以获得更好的预测效果,这与已有研究观点一致[12,17,25]。其次,土壤性质与各影响因素间的关系存在着空间非平稳性,即不同土壤类型、不同地区或同一区域的不同亚区各因素对土壤性质的影响程度不同[31-32],大区域尺度下只建立一个模型很难准确捕捉这种空间非平稳性。已有研究中,在不同土壤类型是建立土壤容重与有机质和土壤质地间的预测模型[9,12],正是利用了这种空间非平稳性。四川盆地面积广阔,区内地形、气候和成土母岩等因素差异较大,导致不同亚流域和不同土类的土壤容重主要控制因素与整个盆地存在差异(图 3)。因此,分流域和分土类建模的方式总体上优于不分区(图 4)。本研究中,分流域建模的效果优于分土类建模,这是因为盆地内几种最主要的土壤类型,包括紫色土、水稻土、黄壤、潮土和新积土,均广泛地分布于整个盆地,分土类建模仍不能较好地揭示某些因素在盆地内不同区域对土壤容重影响程度的差异。而相同亚流域范围缩小,土壤容重与各影响因素间关系的空间非平稳性降低,各预测模型能更好地描述各因素在不同流域的影响差异。第三,土壤性质与各种影响因素间的关系多表现为复杂的非线性关系[30-31]。ANN模型具有较强的自学习能力和处理非线性问题能力[22-23],特别是RBFNN模型是一种能以任意精度逼近任意连续函数、需要调节的参数较少的理想非线性计算工具,通过选择合适的扩展常数和隐含层节点数据,即可在土壤性质预测中取得较好的预测效果[30-32]。虽然近年来RF模型在土壤性质预测中表现出了较好的预测性能[33,35],但本研究中RF模型的预测能力略逊于RBFNN模型。两种方法在各个亚流域的预测结果,也是RBFNN模型的预测效果优于RF模型(由于需要制作的图表较多,文中没有一一列出不同方法对各个亚流域的预测结果)。相似的,在采用RF模型对安徽省耕地土壤容重的预测研究中,其预测结果R2仅为0.22 [25]。另一项填补我国第二次土壤普查土壤容重缺失值的研究也发现[36],人工神经网络模型对验证数据集预测结果的R2为0.47,RMSE为0.14 g·cm–3(样本数N=315,容重均值为1.32 g·cm–3),预测能力优于包括梯度增强回归树模型在内的其他方法。
本研究中RBFNN_分流域模型对验证样点集的预测结果R2为0.519,精度仍需要进一步提升。原因如下,一是全国第二次土壤普查资料中未提供采样点的准确坐标信息,当前使用的样点坐标是依据文献[37]和[38]的方法对所有样点进行逐一定位获得的,即根据相似的成土环境和具有相近的土壤性质这一规律,充分利用各种成土因素的图件数据,在资料记录的采样地点寻找与样点具有一致的环境信息(相同的地形部位、成土母质、土壤类型、土地利用方式等)的位置作为样点的采样位置。虽然该方法具有科学性,但所获得的采样位置可能与实际采样点存在一定的偏差,使得以此位置提取的样点地形因子、气象因子等信息也会与实际采样点有一定的差异。二对耕地土壤而言,一些耕作施肥管理措施也会影响土壤容重,合理地引入并量化这些因素将有助于预测精度的进一步提高。三是辅助变量的精度有待进一步提高,如可利用更高精度的地形图生成地形因子空间分布图,以及在引入相关辅助因素后采用更优的空间预测方法获得气象因子的空间分布格局。本研究中,由于大部分样点未给出详细的土壤颗粒组成数据,建模过程中采用土壤质地类型代替,同时选择对土壤颗粒组成有较大影响或相关性较强的地形[15-16,25]、气候[2,4]以及其他土壤性质(如pH[3,39-40])作为替代。因素分析结果表明所选指标与土壤容重均存在不同程度的相关性,RBFNN_分流域模型也表现出了相对较优的预测性能,这为一些关键指标(如颗粒组成)缺失情况下进行容重值插补提供了参考。RBFNN_分流域模型对验证数据集的预测结果R2和RMSE表明,采用该方法对四川盆地耕地土壤容重缺失值进行填补,将极大地降低现有各方法预测结果的不确定性,从而更好地揭示该区域耕地土壤碳、氮、磷等元素自全国第二次土壤普查以来的储量变化。当前,包括深度学习等在内的一系列先进方法日益成熟,今后可在不同亚流域内采用多种先进方法进行预测,分流域择优选择不同的预测模型,进而在整个区域尺度上达到最佳的预测效果,也将是一个理想可行的建模策略。
4 结论四川盆地耕地表层土壤容重变化范围介于0.60~1.71 g·cm–3之间,均值为1.29 g·cm–3。土壤有机质、土壤亚类和降雨量是影响该区域土壤容重最重要的因素,不同亚流域和土类容重的主控因素存在明显差异。分流域构建RBFNN模型能准确捕捉土壤容重与各影响因素的非线性关系以及这种关系的空间非平稳性,获得了优于其他方法的预测能力。以该方法填补四川盆地耕地表层土壤容重的缺失值,有助于极大地降低现有方法预测结果的不确定性。同时,本研究提出的建模策略也可为其他区域土壤性质缺失值的填补提供方法参考。
[1] |
Martín M Á, Reyes M, Taguas F J. Estimating soil bulk density with information metrics of soil texture[J]. Geoderma, 2017, 287: 66-70. DOI:10.1016/j.geoderma.2016.09.008
( ![]() |
[2] |
Zhao Y L, Wang Y Q, Zhang X C. Distribution characteristics of bulk density and saturated hydraulic conductivity in intensive land restoration project areas on the Loess Plateau (In Chinese)[J]. Transactions of the Chinese Society of Agricultural Engineering, 2020, 36(10): 83-89. [赵亚丽, 王云强, 张兴昌. 黄土高原生态工程区土壤容重及饱和导水率的分布特征[J]. 农业工程学报, 2020, 36(10): 83-89.]
( ![]() |
[3] |
Benites V M, Machado P L O A, Fidalgo E C C, et al. Pedotransfer functions for estimating soil bulk density from existing soil survey reports in Brazil[J]. Geoderma, 2007, 139(1/2): 90-97.
( ![]() |
[4] |
Yi X B, Shao M A, Zhao C L, et al. Variation analysis and simulation of soil bulk density within different soil depths along south to north transect of Loess Plateau (In Chinese)[J]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(4): 198-205. [易小波, 邵明安, 赵春雷, 等. 黄土高原南北样带不同土层土壤容重变异分析与模拟[J]. 农业机械学报, 2017, 48(4): 198-205.]
( ![]() |
[5] |
Han G Z, Zhang G L, Gong Z T, et al. Pedotransfer functions for estimating soil bulk density in China[J]. Soil Science, 2012, 177(3): 158-164. DOI:10.1097/SS.0b013e31823fd493
( ![]() |
[6] |
Yi X S, Li G S, Yin Y Y. Pedotransfer functions for estimating soil bulk density: A case study in the three-river headwater region of Qinghai Province, China[J]. Pedosphere, 2016, 26(3): 362-373. DOI:10.1016/S1002-0160(15)60049-2
( ![]() |
[7] |
Feng Z J, Nie W B, Yu M, et al. Multiple scale variability of soil infiltration characteristics and establishment of pedo-transfer function (In Chinese)[J]. Transactions of the Chinese Society of Agricultural Engineering, 2022, 38(13): 64-75. [冯正江, 聂卫波, 余淼, 等. 多尺度土壤入渗特性的变异特征和传递函数构建[J]. 农业工程学报, 2022, 38(13): 64-75.]
( ![]() |
[8] |
Xu L, He N P, Yu G R. Methods of evaluating soil bulk density: Impact on estimating large scale soil organic carbon storage[J]. Catena, 2016, 144: 94-101. DOI:10.1016/j.catena.2016.05.001
( ![]() |
[9] |
Men M X, Peng Z P, Xu H, et al. Investigation on pedo-transfer function for estimating soil bulk density in Hebei Province (In Chinese)[J]. Chinese Journal of Soil Science, 2008, 39(1): 33-37. [门明新, 彭正萍, 许皞, 等. 河北省土壤容重的传递函数研究[J]. 土壤通报, 2008, 39(1): 33-37.]
( ![]() |
[10] |
Liu J H, Lan C B, Chen J. Fitting and precision evaluation of regional PTFs for soil bulk density—A case study from Fengqiu County, Henan Province (In Chinese)[J]. Chinese Journal of Soil Science, 2013, 44(1): 77-82. [刘继红, 兰传宾, 陈杰. 区域土壤容重转换函数构建与预测结果评价——以河南省封丘县为例[J]. 土壤通报, 2013, 44(1): 77-82.]
( ![]() |
[11] |
Li Y, Liu X M, Wang S J, et al. A study on the pedo-transfer functions and influencing factors for prediction of soil bulk density for limestone soil in Karst area of South China (In Chinese)[J]. Journal of Earth Environment, 2018, 9(3): 245-256. [李颖, 刘秀明, 王世杰, 等. 中国南方喀斯特地区石灰土容重传递函数模型及影响因素研究[J]. 地球环境学报, 2018, 9(3): 245-256.]
( ![]() |
[12] |
Han G Z, Wang D C, Xie X J. Pedotransfer functions for prediction of soil bulk density for major types of soils in China (In Chinese)[J]. Acta Pedologica Sinica, 2016, 53(1): 93-102. DOI:10.11766/trxb201504200151 [韩光中, 王德彩, 谢贤健. 中国主要土壤类型的土壤容重传递函数研究[J]. 土壤学报, 2016, 53(1): 93-102.]
( ![]() |
[13] |
Yu D X, Jia X X, Huang L M, et al. Spatial variation of soil bulk density in different soil layers in the loess area and simulation (In Chinese)[J]. Acta Pedologica Sinica, 2019, 56(1): 55-64. DOI:10.11766/trxb201802040086 [于冬雪, 贾小旭, 黄来明, 等. 黄土区不同土层土壤容重空间变异与模拟[J]. 土壤学报, 2019, 56(1): 55-64.]
( ![]() |
[14] |
Zhu L T, Wang X Z, Jiao F. Research of soil bulk density distribution in Loess Hilly Region based on TPS interpolation methods (In Chinese)[J]. Chinese Journal of Soil Science, 2012, 43(5): 1043-1048. [朱乐天, 王信增, 焦峰. 基于TPS插值的黄土丘陵区土壤容重空间分布研究[J]. 土壤通报, 2012, 43(5): 1043-1048.]
( ![]() |
[15] |
Wei J B, Xiao D N, Zhang X Y, et al. Spatial variation of soil bulk density in relation to terrain and land use in eroded of black soil region (In Chinese)[J]. Journal of Soil and Water Conservation, 2006, 20(3): 118-122. [魏建兵, 肖笃宁, 张兴义, 等. 侵蚀黑土容重空间分异与地形和土地利用的关系[J]. 水土保持学报, 2006, 20(3): 118-122.]
( ![]() |
[16] |
Zhang L, Liu Y X, Peng H W, et al. Spatial characteristics of bulk density and related influencing factors of Bijie tobacco-planting soils (In Chinese)[J]. Soils, 2022, 54(1): 145-151. [张龙, 刘燕翔, 彭华伟, 等. 毕节市植烟土壤耕层容重的空间特征及影响因素[J]. 土壤, 2022, 54(1): 145-151.]
( ![]() |
[17] |
Di X S, Wu H Q, Jia H T, et al. Construction of relationship model between soil bulk density and soil organic carbon content of main grasslands in Xinjiang (In Chinese)[J]. Chinese Journal of Soil Science, 2021, 52(6): 1323-1329. [狄晓双, 武红旗, 贾宏涛, 等. 新疆主要草地土壤容重与有机碳含量关系模型构建[J]. 土壤通报, 2021, 52(6): 1323-1329.]
( ![]() |
[18] |
Wang S C, Wang Z Q, Cheng C C, et al. Pedotransfer functions to estimate soil bulk density in Song Nen black soil region of Northeast China (In Chinese)[J]. Journal of Beijing Normal University(Natural Science), 2018, 54(3): 381-390. [王思楚, 王志强, 成聪聪, 等. 东北松嫩黑土区土壤密度传递函数及其适用性[J]. 北京师范大学学报(自然科学版), 2018, 54(3): 381-390.]
( ![]() |
[19] |
Fang B, Wu S C, Chen H Y, et al. Comparison of modeling methods for region soil bulk density in different soil layers (In Chinese)[J]. Southwest China Journal of Agricultural Sciences, 2021, 34(10): 2258-2268. [方兵, 吴思聪, 陈弘扬, 等. 区域不同土层土壤容重建模方法比较[J]. 西南农业学报, 2021, 34(10): 2258-2268.]
( ![]() |
[20] |
Nie C Y, Hu K L, Shao Y H, et al. Comparison of predicting results of soil hydraulic parameters by SVR and Rosetta models (In Chinese)[J]. Journal of China Agricultural University, 2010, 15(6): 102-107. [聂春燕, 胡克林, 邵元海, 等. 基于支持向量机和神经网络的土壤水力学参数预测效果比较[J]. 中国农业大学学报, 2010, 15(6): 102-107.]
( ![]() |
[21] |
[21] Yang W, Lan H, Li M Z, et al. Prediction of top soil layer bulk density based on image processing and gradient boosting regression tree model (In Chinese)[J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(9): 193-200. [杨玮, 兰红, 李民赞, 等. 基于图像处理和GBRT模型的表土层土壤容重预测[J]. 农业机械学报, 2020, 51(9): 193-200.]
( ![]() |
[22] |
Guo L N, Fan G S. Prediction of surface soil bulk density based on grey theory and BP Neural Network (In Chinese)[J]. Water Saving Irrigation, 2018(2): 93-97. [郭李娜, 樊贵盛. 基于灰色理论—BP神经网络方法的表层土壤容重预测[J]. 节水灌溉, 2018(2): 93-97.]
( ![]() |
[23] |
Gao R T, Chen H W, Li B G, et al. Prediction of soil hydraulic characteristic parameters based on BP Neural Network (In Chinese)[J]. Chinese Journal of Soil Science, 2005, 36(5): 641-646. [高如泰, 陈焕伟, 李保国, 等. 基于BP神经网络的土壤水力学参数预测[J]. 土壤通报, 2005, 36(5): 641-646.]
( ![]() |
[24] |
Yang W, Lan H, Li M Z, et al. Predicting bulk density and porosity of soil using image processing and support vector regression (In Chinese)[J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(12): 144-151. [杨玮, 兰红, 李民赞, 等. 基于图像处理和SVR的土壤容重与土壤孔隙度预测[J]. 农业工程学报, 2021, 37(12): 144-151.]
( ![]() |
[25] |
Lu H L, Zhao M S, Liu B Y, et al. Spatial prediction of soil properties based on Random Forest Model in Anhui Province (In Chinese)[J]. Soils, 2019, 51(3): 602-608. [卢宏亮, 赵明松, 刘斌寅, 等. 基于随机森林模型的安徽省土壤属性空间分布预测[J]. 土壤, 2019, 51(3): 602-608.]
( ![]() |
[26] |
Li A W, Ran M, Song L Y, et al. Spatial distribution characteristics and influencing factors of cropland topsoil organic carbon content in the Sichuan Basin (In Chinese)[J]. Resources and Environment in the Yangtze Basin, 2023, 32(5): 1102-1112. [李艾雯, 冉敏, 宋靓颖, 等. 四川盆地耕地表层土壤有机碳含量空间分布特征及其影响因素[J]. 长江流域资源与环境, 2023, 32(5): 1102-1112.]
( ![]() |
[27] |
Hu S J, Deng O P, Zhang S R, et al. Spatial-temporal variability of soil organic carbon and total nitrogen in paddy soils in Sichuan Basin (In Chinese)[J]. Soils, 2016, 48(2): 401-408. [胡嗣佳, 邓欧平, 张世熔, 等. 四川盆地水稻土有机碳与全氮的时空变异及影响因素研究[J]. 土壤, 2016, 48(2): 401-408.]
( ![]() |
[28] |
Li A W, Zhang Y Y, Li C J, et al. Divergent responses of cropland soil organic carbon to warming across the Sichuan Basin of China[J]. Science of the Total Environment, 2022, 851: 158323.
( ![]() |
[29] |
Li A W, Song L Y, Ran M, et al. Impact of climate warming on paddy soil organic carbon change in the Sichuan Basin of China (In Chinese)[J]. Environmental Science, 2023, 44(8): 4679-4688. [李艾雯, 宋靓颖, 冉敏, 等. 气候变暖对四川盆地水稻土有机碳含量变化的影响[J]. 环境科学, 2023, 44(8): 4679-4688.]
( ![]() |
[30] |
Li Q Q, Wang C Q, Yue T X, et al. Method for spatial variety of soil organic matter based on radial basis function neural network (In Chinese)[J]. Transactions of the Chinese Society of Agricultural Engineering, 2010, 26(1): 87—93, 6. [李启权, 王昌全, 岳天祥, 等. 基于RBF神经网络的土壤有机质空间变异研究方法[J]. 农业工程学报, 2010, 26(1): 87—93, 6.]
( ![]() |
[31] |
Li Q Q, Yue T X, Wang C Q, et al. Spatially distributed modeling of soil organic matter across China: An application of artificial neural network approach[J]. Catena, 2013, 104: 210-218.
( ![]() |
[32] |
Li Q Q, Zhang H, Jiang X Y, et al. Spatially distributed modeling of soil organic carbon across China with improved accuracy[J]. Journal of Advances in Modeling Earth Systems, 2017, 9(2): 1167-1185.
( ![]() |
[33] |
Zhang X H, Meng X T, Tang H T, et al. Random forest prediction model for the soil organic matter with optimized spectral inputs (In Chinese)[J]. Transactions of the Chinese Society of Agricultural Engineering, 2023, 39(2): 90-99. [张笑寒, 孟祥添, 唐海涛, 等. 优化光谱输入量的土壤有机质随机森林预测模型[J]. 农业工程学报, 2023, 39(2): 90-99.]
( ![]() |
[34] |
Li S, Li Q Q, Wang C Q, et al. Spatial variability of soil bulk density and its controlling factors in an agricultural intensive area of Chengdu Plain, Southwest China[J]. Journal of Integrative Agriculture, 2019, 18(2): 290-300.
( ![]() |
[35] |
[35] Sun Y Q, Sun X M, Wu Z F, et al. Impact of sample size and sampling method on accuracy of topsoil pH prediction on a regional scale (In Chinese)[J]. Acta Pedologica Sinica, 2023, 60(6): 1595-1609. DOI:10.11766/trxb202112010651 [孙越琦, 孙笑梅, 巫振富, 等. 样点规模与采样方法对表层土壤pH空间预测精度的影响[J]. 土壤学报, 2023, 60(6): 1595-1609.]
( ![]() |
[36] |
Liang Z Z. Research and application of high-resolution digital mapping of key properties of soil at national scale[D]. Hangzhou: Zhejiang University, 2019.[梁宗正. 国家尺度土壤关键属性高分辨率数字制图研究及应用[D]. 杭州: 浙江大学, 2019.]
( ![]() |
[37] |
Li Q Q, Yue T X, Fan Z M, et al. Spatial simulation of topsoil TN at the national scale in China (In Chinese)[J]. Geographical Research, 2010, 29(11): 1981-1992. [李启权, 岳天祥, 范泽孟, 等. 中国表层土壤全氮的空间模拟分析[J]. 地理研究, 2010, 29(11): 1981-1992.]
( ![]() |
[38] |
Li Q Q, Yue T X, Fan Z M, et al. Study on method for spatial simulation of topsoil SOM at national scale in China (In Chinese)[J]. Journal of Natural Resources, 2010, 25(8): 1385-1399. [李启权, 岳天祥, 范泽孟, 等. 中国表层土壤有机质空间分布模拟分析方法研究[J]. 自然资源学报, 2010, 25(8): 1385-1399.]
( ![]() |
[39] |
Bernoux M, Cerri C, Arrouays D, et al. Bulk densities of Brazilian Amazon soils related to other soil properties[J]. Soil Science Society of America Journal, 1998, 62(3): 743-749.
( ![]() |
[40] |
Brahim N, Bernoux M, Gallali T. Pedotransfer functions to estimate soil bulk density for Northern Africa: Tunisia case[J]. Journal of Arid Environments, 2012, 81: 77-83.
( ![]() |