检索项 检索词
  土壤学报  2025, Vol. 62 Issue (3): 653-664      DOI: 10.11766/trxb202404120152       CSTR: 32215.14.trxb202404120152
0

引用本文  

孔祥麒, 高维常, 潘文杰, 等. 土壤碳氮比的可见-近红外与中红外光谱预测. 土壤学报, 2025, 62(3): 653-664.
KONG Xiangqi, GAO Weichang, PAN Wenjie, et al. Prediction of Soil Carbon-to-Nitrogen Ratio Based on Visible-Near Infrared and Mid-Infrared Spectroscopy. Acta Pedologica Sinica, 2025, 62(3): 653-664.

基金项目

国家自然科学基金项目(42107322)、中国烟草总公司项目(110202102038)、中国烟草总公司贵州省公司项目(2023XM11)共同资助

通讯作者Corresponding author

曾荣,E-mail:rzeng@nuist.edu.cn

作者简介

孔祥麒(2002—),男,湖北荆州人,主要从事土壤遥感方面的研究。E-mail:15895861869@163.com
土壤碳氮比的可见-近红外与中红外光谱预测
孔祥麒1, 高维常2, 潘文杰3, 蔡凯2, 杨静3, 李德成4, 郑光辉5, 曾荣5    
1. 南京信息工程大学长望学院, 南京 210044;
2. 贵州省烟草科学研究院, 贵阳 550081;
3. 中国烟草总公司贵州省公司, 贵阳 550004;
4. 土壤与农业可持续发展重点实验室(中国科学院南京土壤研究所), 南京 211135;
5. 南京信息工程大学地理科学学院, 南京 210044
摘要:土壤碳氮比(C/N)不仅可以反映土壤质量,也可以衡量土壤碳氮元素的营养平衡状况,其数值和等级的快速准确测定对指导实时科学施肥和提升土壤质量具有重要意义。本研究利用贵州省501个烤烟-玉米轮作典型农田耕层(0~20 cm)土壤样品的可见-近红外光谱(VNIR)和中红外光谱(MIR)信息以及总有机碳(TOC)、全氮(TN)和C/N数据,对光谱进行Savitzky-Golay(SG)平滑去噪和标准规一化处理后,分别应用偏最小二乘回归(PLSR)、随机森林(RF)和Cubist三种方法进行建模,通过直接预测C/N和间接预测(先分别预测TOC和TN再计算C/N)两种方式构建了土壤C/N预测模型,并对C/N数值和等级预测精度进行了解析。结果表明:(1)对于C/N数值预测,虽然最优预测策略为MIR-PLSR的直接预测,但预测精度(相对标准误差,RPD)仅为1.20;(2)C/N等级可以被准确预测,最优策略为MIR-PLSR模型的直接预测,等级判定精度为0.71;(3)C/N数值预测精度较低的原因主要有两方面,其一是烟田较为一致的严格施肥措施降低了耕层土壤碳氮含量的空间差异,从而也降低了C/N的空间变异(变异系数为17.15%,中度变异),二是C/N与VNIR、MIR光谱的相关性均较低。因此,基于MIR-PLSR可以对C/N等级进行直接预测。
关键词土壤有机碳    碳氮比    偏最小二乘回归    高光谱预测    
Prediction of Soil Carbon-to-Nitrogen Ratio Based on Visible-Near Infrared and Mid-Infrared Spectroscopy
KONG Xiangqi1, GAO Weichang2, PAN Wenjie3, CAI Kai2, YANG Jing3, LI Decheng4, ZHENG Gaunghui5, ZENG Rong5    
1. Changwang School of Honors, Nanjing University of Information Science & Technology, Nanjing 210044, China;
2. Guizhou Academy of Tobacco Science, Guiyang 550081, China;
3. China National Tobacco Corporation Guizhou Provincial Company, Guiyang 550004, China;
4. State Key Laboratory of Soil and Sustainable Agriculture, Institute of Soil Science, Chinese Academy of Sciences, Nanjing 211135, China;
5. School of Geographical Science, Nanjing University of Information Science & Technology, Nanjing 210044, China
Abstract: 【Objective】The soil carbon-to-nitrogen ratio (C/N) reflects not only soil quality but also the nutrient balance of soil carbon and nitrogen elements. Thus, rapid and accurate determination of this ratio and the grade is crucial for guiding real-time scientific fertilization and improvement of soil quality.【Method】This study used visible-near infrared (VNIR) and mid-infrared (MIR) spectroscopic data, along with total organic carbon (TOC), total nitrogen (TN), and C/N data from 501 typical tobacco-corn rotation farmland topsoil samples(0~20 cm)in Guizhou Province for characterization. After processing the spectra with Savitzky-Golay (SG) smoothing and standard normalization, three modeling methods were applied: partial least squares regression (PLSR), random forest (RF), and Cubist. Models for predicting soil C/N were constructed using both direct prediction of C/N and indirect prediction (first predicting TOC and TN, then calculating C/N), and the precision of C/N value and grade predictions was analyzed.【Result】The results revealed that: (1) For C/N value prediction, the optimal prediction strategy was direct prediction using MIR-PLSR, which had a prediction precision(relative standard error, RPD)of 1.20; (2) C/N grade could be accurately predicted, with the optimal strategy being direct prediction using the MIR-PLSR model, achieving a grade determination accuracy of 0.71; (3) The main reasons for the low prediction accuracy of C/N values are twofold. First, the uniform stringent fertilization measures in the tobacco fields have reduced the spatial variation in the carbon and nitrogen content of the plow layer soil, thereby also reducing the spatial variation of C/N(the coefficient of variation is 17.15%, indicating moderate variation). Second, the correlation between C/N and both VNIR and MIR spectra was relatively low.【Conclusion】Therefore, the MIR-PLSR model can be used for direct prediction of C/N grades.
Key words: Soil organic carbon    Carbon-to-nitrogen ratio    Partial least squares regression    Hyperspectral prediction    

土壤有机碳和氮素是植物生长必要的重要养分,土壤碳氮比(总有机碳TOC与全氮TN的比值,C/N)不仅可以反映土壤的质量,也可以衡量土壤碳氮元素的营养平衡状况[1],较低的C/N有助于促进有机质的分解和有效氮的增加,而较高的C/N则可能导致有机质分解时受到氮元素的限制[2]。C/N传统获取方法需要化学测定土壤有机碳和全氮含量后计算出,存在实时性差、有污染且效率低等缺点[3]。而利用可见-近红外光谱(VNIR)和中红外光谱(MIR)预测土壤属性,具有快速、低成本、无污染等优势[4-5]

对土壤C/N的直接预测研究相对较少,预测精度也高低不一。如Cozzolino和Morón [6]对乌拉圭160个土壤样品构建了基于近红外光谱(NIR)的偏最小二乘回归(PLSR)模型,结果显示,对于不同的土壤质地,预测的C/N精度较低,其决定系数(R2)介于0.10~0.41,相对标准误差(RPD)介于1.0~1.3。任红艳等[7]基于江都市真武镇146个潴育型水稻土农田表层土壤(0~20 cm),研究了利用一阶微分等不同光谱预处理方式下PLSR模型预测C/N的效果,最优模型的RPD仅为1.21,预测结果不太理想。张清文等[8]利用可见-近红外光谱(VNIR)预测了盐城市大丰区33个滨海湿地土壤C/N,发现PLSR 模型精度高于回归随机森林(RFR)模型,基于 PLSR- R′(一阶微分光谱)构建的最优模型R2为 0.995,均方根误差(RMSE)为 0.216,平均绝对误差(MAE)为 0.165。Geng等[9]对比了单时相与多时相遥感影像在中国东北黑土区C/N预测性能,采用增长回归树模型(BRT)、随机森林(RF)和极致梯度提升决策树(XGBoost)三种机器学习算法,发现多时相Sentinel-2数据结合XGBoost模型在C/N预测中达到最优性能(R2 = 0.713,RMSE = 0.585,MAE = 0.484,RPD = 1.718)。Zhou等[10]基于瑞士的150个土壤样本,比较了卫星传感器Landsat-8、Sentinel-2和Sentinel-3在800 m、400 m、100 m 和 20 m四种空间分辨率下预测C/N的潜力,发现BRT 模型100 m分辨率下C/N预测精度最高(R2 = 0.404、RMSE = 0.223和MAE = 0.167)。

C/N预测也可以通过先利用光谱预测TOC和TN,再计算C/N的方法。基于VNIR构建TOC和TN的预测模型已较为成熟,通过PLSR构建的TOC预测模型精度较高,R2介于0.44~0.81,RPD介于1.27~3.12[11-14]。对TN预测,VNIR-PLSR模型表现出更高的预测精度,R2介于0.69~0.82,RPD介于1.67~2.00[15-17]。此外,基于随机森林(RF)、RFR和Cubist等机器学习方法预测TN模型也取得了良好的预测效果,Morellos等[16]利用VNIR-Cubist方法较为精准地预测了TN,其RPD为 1.96。随着中红外光谱(MIR)技术的发展,其在土壤预测中的研究也备受关注,研究发现其预测TOC和TN的精度高于VNIR,如MIR-PLSR预测TOC的R2介于0.64~0.96之间,RPD介于1.30~4.70之间[18-21];预测TN的R2介于0.71~0.91之间,RPD介于1.80~3.12之间[22-24]。尽管针对TOC和TN的光谱预测已取得较多成果,且均取得了较高的精度,但C/N间接预测方法的精度分析尚未见报道。

本研究基于贵州省典型烤烟-玉米轮作农田耕作层(0~20 cm)土壤光谱和属性数据库,通过直接预测和间接预测两种策略,分别构建基于VNIR和MIR的C/N预测模型,并比较了不同策略、不同光谱、不同算法对C/N预测精度的影响,以期筛选C/N的最优建模方法。

1 材料与方法 1.1 研究区概况

贵州省位于中国云贵高原东部,地处24°37′—29°13′N,103°36′—109°35′E,总面积17.62万km2,属亚热带湿润季风气候区,气候温暖湿润,年均气温约15 ℃,降雨量介于1 000~1 400 mm之间,无霜期介于250~300 d之间,相对湿度70%以上。主要分布有黄壤、红壤、黄棕壤等地带性土壤,在独特的气候条件、地形地貌以及人类活动影响下,贵州省内还分布有石灰土、紫色土以及水稻土[25]

1.2 土壤样品采集与测定

本研究综合考虑贵州省土壤的成土母质、地形、气候等成土因素信息,利用代表性采样法在贵州省全省范围内确定了501个烤烟—玉米轮作典型农田(图 1)。在每个典型农田采用梅花形或S形选取5个点采集耕作层(0~20 cm)土壤,并且记录经纬度、海拔高度、成土因素等信息,土样充分混匀后采用四分法留取1.5 kg带回实验室,经自然风干、去杂和磨碎,过60目(0.25 mm)筛,用于化学组分测定和光谱分析。TOC采用重铬酸钾氧化—分光光度法测定,TN采用凯氏法测定[26]

图 1 研究区域样点分布图 Fig. 1 Distribution of sample points in the study area
1.3 土壤光谱测定

土样经45 ℃烘干24 h后,利用Agilent Cary 5000分光光度计测定VNIR漫反射光谱,波长范围为350~2 500 nm,其中350~700 nm的光谱分辨率小于等于0.048 nm,700~2 500 nm的分辨率小于等于0.20 nm。MIR采用傅立叶变换红外光谱(FT-IR,Thermo Scientific Nicolet iS50)测定其衰减全反射光谱,测定范围为4 000~650 cm–1,光谱分辨率小于等于0.09 cm–1。同一样品进行三次压实测量,取平均值以提高测量准确性。

1.4 数据预处理

本文比较了不同预处理方法对模型预测精度和运行效率的影响后,对光谱进行以下预处理:(1)光谱反射率转换为吸收率;(2)SG平滑(Savitzky-Golay Filtering);(3)变量的标准归一化(Standard normalized variate);(4)光谱降维重采样:考虑到VNIR和MIR波段数目的差异,VNIR按每5 nm降维,MIR按每10 nm降维。在降维过程中,VNIR数据从原先2 151个波段减少至431个波段;MIR数据从原先的6 950个波段减少至1 289个波段。相关光谱变换以及数据处理操作均在R 4.2.3中完成。

1.5 模型建立及评价

本研究采用PLSR、RF和Cubist三种方法来构建光谱预测模型。PLSR在多个自变量高度相关的情况下可解决回归中的多重共线性问题,其作为定量光谱分析中的方法在红外光谱与土壤组分预测研究中应用最为广泛[27]。RF是一种分类器,可以利用多个决策树对土壤样本进行训练以及预测,RF的两个关键参数设置如下:每次分割时测试的变量数量(mtry)为训练集变量总数减一后的平方根,森林中的树木数量(ntree)为1 000。Cubist是机器学习中的一种非参数回归树算法,在处理因变量和预测变量之间的非线性关系上较为适合[28]。Cubist的两个关键参数设置如下:委员会数目(Committees)用于指定要创建的回归树数量,设置为1。邻居数(Neighbors)用于指定在生成分段线性模型时要考虑的最近邻数目,设置为0。

本文采用前文提到的直接和间接两种策略预测C/N,采用留一交叉验证法(leave-one-out crossvalidation,LOOCV)进行精度评价,每次只留下501个样本中的一个作为验证集,其余500个样本作为建模集。通过R2、RPD和RMSE[29]进行模型评价。R2可以用来反映模型的精度,R2与1越接近,模型的拟合程度就越高。RMSE可以用来衡量观测值与预测值之间的偏离程度,RMSE越小,模型预测值与真实值之间偏差越小,准确度越高。RPD则是样本标准差与均方根误差RMSE的比值,它可以反映该模型的预测能力,一般分为3类,在RPD≤1.4的情况下,模型不可用于样本的预测;当1.4 < RPD < 2.0时,模型的预测能力较好;当RPD≥2.0时,模型的预测能力非常好[30]

C/N在实际应用中通常会根据其等级来选择合适的有机肥和化学氮肥施用措施,因此除评估模型对C/N数值的预测精度外,本研究还评估了模型对C/N等级的预测精度,即根据C/N分级标准,对C/N的观测值和预测值进行等级划分,将预测值和观测值等级相同的样本数与总样本数的比值作为C/N等级判定精度。

2 结果与讨论 2.1 土壤目标属性含量的统计特征

本文根据全国第二次土壤普查土壤组分分级标准以及Biswas和Micallef [31]的研究,将土壤TOC、TN和C/N划分为5个等级。结合表 1的统计情况,计算各属性在每个等级下所占比重(表 2)。统计结果表明,TOC含量适中,变异系数为32.66%;TN大多数含量低于1.73 g⋅kg–1,变异系数较低,仅为26.85%。C/N平均值为10.32,变异系数为17.15%,在三个目标属性中变异最小。C/N<5、介于15~20以及≥20的样本合计不到总样本数量的2%,但有60%的样本C/N集中在10~15之间,导致其变异性较低。

表 1 土壤目标属性含量描述性统计特征 Table 1 Descriptive statistical characteristics of soil target attribute contents

表 2 土壤总有机碳、全氮和碳氮比分级标准及各等级所占比重 Table 2 Grading standards of soil TOC, TN contents and C/N ratios
2.2 土壤光谱曲线特征

图 2展示了各等级土壤TOC、TN和C/N的平均光谱反射率曲线。在VNIR区间内,随着TOC和TN含量的增加,光谱反射率总体下降,这种趋势相似性源于二者的高相关性[32],相关系数为0.86。C/N与TOC同样显示出较高相关性(相关系数为0.52),土壤反射率整体也随C/N增加而降低。光谱反射率在可见光范围内随着波长的增加迅速上升,在近红外范围内趋于平缓,并于1 400 nm、1 900 nm和2 200 nm附近有三个吸收谷,1 400 nm处的吸收谷主要由土壤表面吸附水及黏土矿物O-H晶格结构水的吸收所致,1 900 nm和2 200 nm附近则分别存在蒙脱石类矿物和Al-OH黏土矿物的吸收带[33]

图 2 不同总有机碳、全氮含量和碳氮比反射光谱曲线 Fig. 2 Reflection spectral curves of different TOC, TN contents and C/N ratios

MIR区间内,不同等级TOC、TN和C/N的光谱反射率均没有明显规律,并且均表现出较小的变异。针对C/N,仅在3 900~2 600 cm–1和1 700~1 300 cm–1范围内不同等级C/N光谱反射率有较大变异,并且这种变异较VNIR光谱中的变异程度更小。中红外光谱的测量采用衰减全反射傅里叶变换红外光谱(ATR-FTIR)。ATR-FTIR的测量结果主要受样品化学成分和分子结构的影响[34],即使C/N数值变化,光谱反射率变化也不明显。MIR范围内的光谱反射率变化相对平缓,在3 300 cm–1和1 600 cm–1附近出现小幅度的吸收谷,在1 000 cm–1附近出现一个大的吸收谷,光谱反射率在1 000 cm–1前快速下降后又经历快速上升,且在1 000 cm–1后形成多个吸收谷(790 cm–1、700 cm–1)和反射峰(850 cm–1、730 cm–1)。从已有研究可知,790、730 cm–1和3 300 cm–1附近波段变化可能与C-H的伸缩振动和N-H的弯曲振动有关;1 000 cm–1和1 630 cm–1附近的吸收谷可能受黏土矿物和土壤束缚水影响;700 cm–1和850 cm–1附近的波段变化可能受到黏土矿物和石英的影响[35]

对比C/N与TOC和TN光谱反射率在不同等级上的变异,VNIR和MIR波段上C/N的变异明显大于TOC和TN的变异,不同C/N等级的光谱反射率区分度更高。

2.3 光谱反射率与TOC、TN、C/N的相关性

图 3展示了TOC、TN和C/N与VNIR及MIR光谱反射率的相关性。TOC和TN与光谱反射率的相关性曲线高度一致,呈现出较强协同性。C/N与光谱反射率的相关性曲线形状与前两者相似,但整体相关性较前两者低。

图 3 总有机碳、全氮以及碳氮比和各个波段的Pearson相关系数 Fig. 3 TOC, TN, C/N ratio and Pearson correlation coefficient of each band

在VNIR区域,C/N和光谱反射率呈负相关,负相关性在600~800 nm达到最高,在770 nm处相关系数达到-0.23。在1 400 nm、1 900 nm和2 200 nm形成了三个小峰值,这三个峰值与光谱反射率曲线的三个吸收谷相匹配,实际上代表了相关系数较低,可能是由于水分或羟基官能团的强烈吸收,导致了目标属性与光谱反射率之间的相关性降低[33]

在MIR区域,TOC和TN与光谱反射率整体呈负相关。C/N与部分波段(4 000~3 698 cm–1、2 940~1 700 cm–1、1 625~1 060 cm–1)光谱反射率呈负相关,而与其他波段光谱反射率呈正相关,总体上这种相关性在接近0的水平上。C/N与4 000~3 765 cm–1和2 670~1 965 cm–1波段呈现最高负相关性,相关系数约为-0.1;在1 100~810 cm–1范围内与光谱反射率呈现最高正相关性,相关系数最高达到0.28。其余波段上,C/N与光谱反射率相关系数大致在0上下浮动。

TOC和TN整体上呈现较强的协同性,但在部分波段上也存在差异,而C/N在这部分波段与光谱反射率的相关性明显增强。VNIR光谱中600~773 nm、930~1 330 nm、1 475~1 834 nm、1 923~4 174 nm处TOC和TN与光谱反射率相关性差异增大,对应波段下C/N与光谱数据相关性增强,而在862~1 000 nm、1 365~1 401 nm、1 892~1 945 nm、2 191~2 263 nm处TOC和TN与光谱数据的差异性减小,对应波段下C/N与光谱数据的负相关性减弱,在MIR光谱中同样存在类似现象。

2.4 目标属性预测结果

表 3展示了不同光谱和模型预测的TOC、TN和C/N的预测精度。基于VNIR和MIR两种光谱,TOC和TN的预测结果表现出相似趋势。针对VNIR,TOC的RPD介于1.14~1.40,TN的RPD介于1.14~1.49,整体预测精度较低;而基于MIR,TOC(RPD介于1.33~2.07)和TN(RPD介于1.37~2.17)的预测精度均有大幅提升,其中MIR结合PLSR模型的预测最优,这与已有研究的结果高度一致。马宏瑞等[36]比较了VNIR和MIR预测土壤TOC的精度,结果表明MIR较VNIR更具优势;此外,Yin等[22]利用中国东北黑土区的样品及其MIR和VNIR光谱预测土壤TN,发现基于实验室中红外光谱的PLSR模型具有最高的预测准确性。

表 3 基于可见-近红外和中红外光谱的PLSR、RF和Cubist模型的验证结果 Table 3 Validation results of PLSR, RF and Cubist models based on VNIR and MIR spectra

针对C/N的预测,基于VNIR构建的模型中,C/N预测精度RPD介于0.65~1.14。无论采用直接预测或间接预测亦或是不同的机器学习算法,整体预测能力均不理想。在三类算法模型中,基于直接预测的PLSR和Cubist模型精度最高(RPD = 1.14),但采用间接预测策略时,这两类模型精度均大幅度降低。而采用间接预测时,RF模型的精度最优(RPD = 1.07),但基于直接预测的RF模型精度低于PLSR和Cubist。

相较于VNIR,基于MIR预测C/N的精度有所提升(RPD介于0.86~1.20),但精度依然较低,无法实现对C/N的合理估算。其中最优模型为PLSR结合直接预测(RPD = 1.20),同时所有光谱模型中VNIR和MIR预测效果最佳。C/N的这一最优预测模型正好对应了TOC(RPD = 2.07)和TN(RPD = 2.17)的最优预测模型。采用间接预测时,RF模型的RPD最高(1.09)。而针对Cubist模型,无论是直接还是间接预测,其估算C/N的精度均为最低。

总体而言,基于MIR构建的C/N预测模型精度优于VNIR。其中,最优模型是MIR结合PLSR模型直接预测C/N,其预测精度RPD达到1.20。然而,与TOC和TN的预测结果相比,仍存在显著差距。这一结果与任红艳等[7]利用VNIR对TN和C/N进行反演的研究结果相似,在其研究中,全波段PLSR模型预测TN含量最为准确(RPD = 3.49),而C/N的预测精度并不理想(最优模型RPD = 1.21),其以为这可能是与样本中C/N较小的变异范围有关。

整体来看,无论采用何种光谱,何种建模算法,C/N的直接预测均优于间接预测。其中,PLSR模型直接预测和间接预测的精度差异最大。在VNIR的建模结果中,直接预测的RPD为1.14,而间接预测的RPD仅为0.65。RF模型两种预测方式的精度非常接近,可能是因为在直接预测和间接预测中,RF会选择相似的特征子集进行建模,从而导致预测结果的相似性较高。Cubist模型同样存在直接预测大幅优于间接预测的情况,但其差异相比于PLSR模型略小一些。因此,在构建C/N预测模型时,选择直接预测策略可能更为可靠和准确,其可能的原因是在采用间接策略时,分别预测TOC和TN时均存在误差,在计算比值时可能造成了误差的累计。

2.5 C/N等级预测

依据表 2 C/N分级标准,表 4列举了不同模型下C/N等级的预测结果。整体上C/N等级判定精度较高,介于0.60~0.71,可能是因为不同C/N等级的光谱反射率区分度较高。在VNIR范围内,C/N等级判定精度在0.6~0.7之间,其中最优模型为PLSR结合直接预测(等级判定精度为0.70);在MIR范围,三种模型预测性能均有提升(等级判定精度介于0.65~0.71),最优模型为PLSR结合直接预测,等级判定精度为0.71,意味着71%的土壤能够被准确分级,这对农业土壤C/N等级的快速划分以及相应固碳和增产措施的采取和决策具有重要意义。结合C/N数值预测结果进一步分析表明:(1)C/N等级预测最优模型为MIR结合PLSR的直接预测(等级判定精度为0.71),与C/N数值的最优模型一致;(2)MIR的预测效果优于VNIR,且直接预测普遍优于间接预测,与数值预测结果相似;(3)基于MIR结合Cubist模型的间接预测C/N数值的RPD仅为0.86,但其C/N等级的判定精度能达到0.68。这表明本文研究的多种模型对C/N数值预测精度很低,但对C/N等级可以进行较为准确地估算。

表 4 碳氮比等级预测结果 Table 4 Prediction results of grade of C/N ratio
2.6 C/N值对预测精度影响

针对C/N数值的最优预测模型(MIR-PLSR)统计不同C/N范围内C/N的预测情况(表 5)。C/N预测值与观测值之间的差异以百分比表示,超过5%为偏高,小于–5%为偏低,介于两者之间则视为无明显差异。在C/N<5的样本中,直接和间接预测方式结果均为高估;C/N值介于5~10间的样本中,直接预测结果中有56%高估,11%低估,间接预测结果与之相似;然而C/N介于10~15间的样本中,直接预测的高估率为21.84%,低估率为44.71%,与C/N值介于5~10的结果相反。C/N值介于15~20的4个样本中,直接预测结果全部低估,间接预测1/2被低估;而C/N≥20的这个样点两种方式预测结果均低估。总体趋势是,C/N观测值较低时,预测值倾向于高估;而C/N观测值较高时,则更容易低估。

表 5 不同碳氮比含量下的碳氮比预测情况 Table 5 Prediction of C/N ratio under different C/N ratios
2.7 C/N间接预测结果

针对TOC和TN数值预测的最佳模型(MIR- PLSR)列举了C/N间接预测结果与TOC和TN预测情况之间的关系(表 6),以此推断造成C/N高估或低估的可能影响因素。TOC和TN预测值与观测值之间的差异同样以百分比表示,超过5%为偏高,小于-5%为偏低,介于两者之间视为无明显差异。

表 6 不同碳氮比预测情况下的总有机碳、全氮预测情况 Table 6 Prediction of TOC and TN under different C/N ratios

501个样本中,有187个样本C/N预测值偏高,149个样本预测值无明显偏移,165个样本预测值偏低,所占比重分别为37.33%、29.74%和32.93%。C/N预测值偏高的样本中,约70%的样本TOC预测值被高估,其中22.99%样本的TN值被高估,但高估程度低于TOC预测值,导致了C/N预测值的高估;此外,约30%样本TOC预测值无明显偏移或者偏低,但相应的TN预测值也被低估,且程度应大于TOC,导致C/N预测值的高估。

C/N预测值无明显偏移的样本中,有30.87%的样本TOC和TN预测值同样无明显偏移,而超过50%的样本TOC和TN预测值均偏高或偏低,但比值处理后未影响C/N的预测效果。C/N预测值偏低的样本中,TOC高估率为10.91%,其中TN全部高估且程度大于TOC,造成C/N预测值偏低;对于TOC无明显偏移的样本,TN预测值高估率也较高(25.46%);60%的TOC预测值偏低,其中,TN预测值大多为偏高(12.12%)或者无明显偏移(29.09%),造成C/N预测值偏低。

总体上,C/N预测值的偏差是由TOC与TN预测值的多种情况共同影响的结果,具体包括TOC与TN预测值的高估、低估或无显著偏差。在C/N预测值无明显偏移的情况下,也存在TOC和TN预测值均偏高或者偏低的情况,但比值处理后减小了C/N的偏离程度,从而并未导致C/N预测值的明显偏移。

2.8 C/N预测精度偏低的原因

综合上述研究结果,推测造成C/N预测精度较低的可能原因如下:(1)C/N变异范围较小,58.48%的样本C/N集中在10~15之间,变异系数仅为17.15%,数据区分度不高。造成C/N变异小的原因是烤烟-玉米轮作的农田,主要是烟季施肥,玉米季则是依据玉米长势情况酌情追肥,为了保证烟叶质量,烟季管理措施(耕作、施肥、灌溉等)较为一致,尤其是有机肥和化学氮肥施用,长期以往就降低了耕层土壤碳和氮含量的空间差异。(2)C/N与TOC和TN的相关性:C/N作为比值,本身不具备直接的光谱响应特性,其预测依赖于与TOC和TN的相关系数(分别为0.52和0.07)。由于C/N是TOC和TN的比值,这种处理降低了其与TOC和TN的相关性,进而影响预测精度。(3)C/N与光谱的相关性:C/N与VNIR(最高相关性为–0.23)和MIR(最高相关性为0.28)的相关性均较低。TOC与TN的光谱及相关性曲线表现出较强的协同性,这种协同性会造成C/N与光谱数据的相关性减弱。TOC和TN与光谱反射率相关性差异性较大的波段,与C/N相关性会更强,而在差异性较小的波段,C/N与光谱反射率相关性更弱。因此,TOC和TN的协同性在一定程度上减弱了C/N与光谱数据的相关性,从而影响了预测结果精度。

3 结论

本文通过对比不同策略的土壤C/N预测精度,发现对于C/N的数值预测,无论采用何种模型,何种光谱,均无法可靠预测(RPD < 1.20),可能是因为C/N的变异较小,并且与VNIR和MIR光谱的相关性均较低;而对于C/N的等级则可进行较为准确的预测,最优策略为MIR结合PLSR模型的直接预测(预测精度为0.71)。C/N的预测值与其观测值相关,当观测值较低时,预测值更容易高估;而当观测值较高时,则更容易低估。需要指出的是,本文仅使用了贵州省501个典型农田样本数据,研究结论有一定的局限性,下一步研究可尝试采用更多类型种植制度的农田土壤样本,确保训练样本具有更大的变异范围,也可以考虑选用更多波段的光谱数据进行拼接或融合,以增加可用信息,进而提升预测精度。

参考文献
[1]
Lin L, Zhang F W, Li Y K, et al. The soil carbon and nitrogen storage and C/N metrological characteristics of chemistry in Kobresia humilis meadow in degradation succession stages (In Chinese)[J]. Chinese Journal of Grassland, 2012, 34(3): 42-47. [林丽, 张法伟, 李以康, 等. 高寒矮嵩草草甸退化过程土壤碳氮储量及C/N化学计量学特征[J]. 中国草地学报, 2012, 34(3): 42-47.] (0)
[2]
Wang J L, Zhong Z M, Wang Z H, et al. Soil C/N distribution characteristics of alpine steppe ecosystem in Qinhai-Tibetan Plateau (In Chinese)[J]. Acta Ecologica Sinica, 2014, 34(22): 6678-6691. [王建林, 钟志明, 王忠红, 等. 青藏高原高寒草原生态系统土壤碳氦比的分布特征[J]. 生态学报, 2014, 34(22): 6678-6691.] (0)
[3]
Yu F J, Min S G, Ju X T, et al. Determination the content of nitrogen and organic substance in dry soil by using near infrared diffusion reflectance spectroscopy (In Chinese)[J]. Chinese Journal of Analysis Laboratory, 2002, 21(3): 49-51. [于飞健, 闵顺耕, 巨晓棠, 等. 近红外光谱法分析土壤中的有机质和氮素[J]. 分析试验室, 2002, 21(3): 49-51.] (0)
[4]
dos Santos U J, de Melo Demattê J A, Menezes R S C, et al. Predicting carbon and nitrogen by visible near-infrared(Vis-NIR)and mid-infrared(MIR)spectroscopy in soils of Northeast Brazil[J]. Geoderma Regional, 2020, 23: e00333. DOI:10.1016/j.geodrs.2020.e00333 (0)
[5]
Li S, Viscarra Rossel R A, Webster R. The cost-effectiveness of reflectance spectroscopy for estimating soil organic carbon[J]. European Journal of Soil Science, 2022, 73(1): e13202. DOI:10.1111/ejss.13202 (0)
[6]
Cozzolino D, Morón A. Potential of near-infrared reflectance spectroscopy and chemometrics to predict soil organic carbon fractions[J]. Soil and Tillage Research, 2006, 85(1/2): 78-85. (0)
[7]
Ren H Y, Shi X Z, Zhuang D F, et al. Effects on estimating soil nitrogen content and ratio of carbon to nitrogen using hyperspectral reflectance (In Chinese)[J]. Remote Sensing Technology and Application, 2012, 27(3): 372-379. [任红艳, 史学正, 庄大方, 等. 土壤全氮含量与碳氮比的高光谱反射估测影响因素研究[J]. 遥感技术与应用, 2012, 27(3): 372-379.] (0)
[8]
Zhang Q W, Yang X W, Yang R, et al. Modeling and analysis of soil carbon and nitrogen ratio prediction in coastal wetlands based on VIS-NIR spectroscopy (In Chinese)[J]. Journal of Chifeng University(Natural Science Edition), 2023, 39(10): 57-61. [张清文, 杨晓芜, 杨睿, 等. 基于VIS-NIR光谱的滨海湿地土壤碳氮比预测建模分析[J]. 赤峰学院学报(自然科学版), 2023, 39(10): 57-61.] (0)
[9]
Geng J, Tan Q Y, Lü J W, et al. Assessing spatial variations in soil organic carbon and C: N ratio in Northeast China's black soil region: Insights from Landsat-9 satellite and crop growth information[J]. Soil and Tillage Research, 2024, 235: 105897. DOI:10.1016/j.still.2023.105897 (0)
[10]
Zhou T, Geng Y J, Ji C, et al. Prediction of soil organic carbon and the C: N ratio on a national scale using machine learning and satellite data: A comparison between Sentinel-2, Sentinel-3 and Landsat-8 images[J]. Science of the Total Environment, 2021, 755: 142661. DOI:10.1016/j.scitotenv.2020.142661 (0)
[11]
Coûteaux M M, Berg B, Rovira P. Near infrared reflectance spectroscopy for determination of organic matter fractions including microbial biomass in coniferous forest soils[J]. Soil Biology and Biochemistry, 2003, 35(12): 1587-1600. DOI:10.1016/j.soilbio.2003.08.003 (0)
[12]
Ribeiro S G, dos Santos Teixeira A, de Oliveira M R R, et al. Soil organic carbon content prediction using soil-reflected spectra: A comparison of two regression methods[J]. Remote Sensing, 2021, 13(23): 4752. DOI:10.3390/rs13234752 (0)
[13]
Gomez C, Viscarra Rossel R A, McBratney A B. Soil organic carbon prediction by hyperspectral remote sensing and field vis-NIR spectroscopy: An Australian case study[J]. Geoderma, 2008, 146(3/4): 403-411. (0)
[14]
[14]Dotto A C, Dalmolin R S D, ten Caten A, et al. A systematic study on the application of scatter-corrective and spectral-derivative preprocessing for multivariate prediction of soil organic carbon by Vis-NIR spectra[J]. Geoderma, 2018, 314: 262-274. DOI:10.1016/j.geoderma.2017.11.006 (0)
[15]
Sisouane M, Cascant M M, Tahiri S, et al. Prediction of organic carbon and total nitrogen contents in organic wastes and their composts by Infrared spectroscopy and partial least square regression[J]. Talanta, 2017, 167: 352-358. DOI:10.1016/j.talanta.2017.02.034 (0)
[16]
Morellos A, Pantazi X E, Moshou D, et al. Machine learning based prediction of soil total nitrogen, organic carbon and moisture content by using VIS-NIR spectroscopy[J]. Biosystems Engineering, 2016, 152: 104-116. DOI:10.1016/j.biosystemseng.2016.04.018 (0)
[17]
Yao X Q, Yang W, Li M Z, et al. Prediction of total nitrogen content in different soil types based on spectroscopy[J]. IFAC-PapersOnLine, 2019, 52(30): 270-276. DOI:10.1016/j.ifacol.2019.12.533 (0)
[18]
Gomez C, Chevallier T, Moulin P, et al. Prediction of soil organic and inorganic carbon concentrations in Tunisian samples by mid-infrared reflectance spectroscopy using a French national library[J]. Geoderma, 2020, 375: 114469. DOI:10.1016/j.geoderma.2020.114469 (0)
[19]
Knox N M, Grunwald S, McDowell M L, et al. Modelling soil carbon fractions with visible near-infrared(VNIR)and mid-infrared(MIR)spectroscopy[J]. Geoderma, 2015, 239: 229-239. (0)
[20]
Sabetizade M, Gorji M, Roudier P, et al. Combination of MIR spectroscopy and environmental covariates to predict soil organic carbon in a semi-arid region[J]. Catena, 2021, 196: 104844. DOI:10.1016/j.catena.2020.104844 (0)
[21]
Jia X L, Chen S C, Yang Y Y, et al. Organic carbon prediction in soil cores using VNIR and MIR techniques in an alpine landscape[J]. Scientific Reports, 2017, 7(1): 2144. DOI:10.1038/s41598-017-02061-z (0)
[22]
Yin J X, Shi Z, Li B G, et al. Prediction of Soil Properties in a Field in Typical Black Soil Areas Using in situ MIR Spectra and Its Comparison with vis-NIR Spectra[J]. Remote Sensing, 2023, 15(8): 2053. DOI:10.3390/rs15082053 (0)
[23]
Wijewardane N K, Ge Y F, Wills S, et al. Predicting physical and chemical properties of US soils with a mid-infrared reflectance spectral library[J]. Soil Science Society of America Journal, 2018, 82(3): 722-731. DOI:10.2136/sssaj2017.10.0361 (0)
[24]
Li H, Wang J W, Zhang J X, et al. Combining variable selection and multiple linear regression for soil organic matter and total nitrogen estimation by DRIFT-MIR spectroscopy[J]. Agronomy, 2022, 12(3): 638. DOI:10.3390/agronomy12030638 (0)
[25]
Chen Q X, Lu X H, Zhao W X, et al. Spatial differentiation of main soil types in Guizhou Province under different topographical conditions (In Chinese)[J]. Jiangsu Agricultural Sciences, 2022, 50(7): 205-213. [陈清霞, 陆晓辉, 赵文轩, 等. 不同地形条件下贵州省主要土壤类型的空间分异[J]. 江苏农业科学, 2022, 50(7): 205-213.] (0)
[26]
Zhang G L, Gong Z T. Soil survey laboratory methods (In Chinese). Beijing: Science Press, 2012. [张甘霖, 龚子同. 土壤调查实验室分析方法[M]. 北京: 科学出版社, 2012.] (0)
[27]
Blanco M, Villarroya I. NIR spectroscopy: A rapid-response analytical tool[J]. Trends in Analytical Chemistry, 2002, 21(4): 240-250. DOI:10.1016/S0165-9936(02)00404-1 (0)
[28]
Wei Y C, Lu X L, Zhu C D, et al. High-resolution digital mapping of soil organic carbon at small watershed scale using landform element classification and assisted remote sensing information (In Chinese)[J]. Acta Pedologica Sinica, 2023, 60(1): 63-76. [魏宇宸, 卢晓丽, 朱昌达, 等. 基于地形与遥感辅助信息的小流域尺度高分辨率有机碳空间分布预测研究[J]. 土壤学报, 2023, 60(1): 63-76.] (0)
[29]
Shen Y, Zhang X P, Liang A Z, et al. Near infrared spectroscopy in determining organic carbon and total nitrogen in black soil of Northeast China (In Chinese)[J]. Chinese Journal of Applied Ecology, 2010, 21(1): 109-114. [申艳, 张晓平, 梁爱珍, 等. 近红外光谱分析法测定东北黑土有机碳和全氮含量[J]. 应用生态学报, 2010, 21(1): 109-114.] (0)
[30]
Guo P, Li T, Zhang S R, et al. Hyperspectral estimation of soil available potassium at different altitudes of the Xihe watershed (In Chinese)[J]. Chinese Journal of Soil Science, 2019, 50(2): 274-281. [郭鹏, 李婷, 张世熔, 等. 西河流域不同海拔区土壤有效钾的高光谱反演[J]. 土壤通报, 2019, 50(2): 274-281.] (0)
[31]
Biswas D, Micallef S A. Safety and practice for organic food . New York, USA: Academic Press, 2019: 196-197. (0)
[32]
Chen S C, Feng L L, Li S, et al. VIS-NIR spectral inversion for prediction of soil total nitrogen content in laboratory based on locally weighted regression (In Chinese)[J]. Acta Pedologica Sinica, 2015, 52(2): 312-320. [陈颂超, 冯来磊, 李硕, 等. 基于局部加权回归的土壤全氮含量可见-近红外光谱反演[J]. 土壤学报, 2015, 52(2): 312-320.] (0)
[33]
Zhao M S, Xie Y, Lu L M, et al. Modeling for soil organic matter content based on hyperspectral feature indices (In Chinese)[J]. Acta Pedologica Sinica, 2021, 58(1): 42-54. [赵明松, 谢毅, 陆龙妹, 等. 基于高光谱特征指数的土壤有机质含量建模[J]. 土壤学报, 2021, 58(1): 42-54.] (0)
[34]
Koçak A, Wyatt W, Comanescu M A. Comparative study of ATR and DRIFT infrared spectroscopy techniques in the analysis of soil samples[J]. Forensic Science International, 2021, 328: 111002. DOI:10.1016/j.forsciint.2021.111002 (0)
[35]
He J X. Prediction of fertility factors in paddy soil using VNIR and MIR spectroscopy[D]. Hangzhou: Zhejiang University, 2015.[何积秀. 基于VNIR和MIR光谱的水稻田土壌肥力因子预测[D]. 杭州: 浙江大学, 2015.] (0)
[36]
Ma H R, Dang N, Fan C H. Application of IR in correlation analysis on heavy metals and organic matters in soil (In Chinese)[J]. Journal of Anhui Agricultural Sciences, 2011, 39(33): 20451-20454. [马宏瑞, 党楠, 范春辉. 红外光谱法在土壤重金属·有机质关系预测分析中的应用[J]. 安徽农业科学, 2011, 39(33): 20451-20454.] (0)