检索项 检索词
  土壤学报  2024, Vol. 61 Issue (3): 687-698  DOI: 10.11766/trxb202210040548
0

引用本文  

李学兰, 李德成, 郑光辉, 等. 可见-近红外与中红外光谱预测土壤养分的比较研究. 土壤学报, 2024, 61(3): 687-698.
LI Xuelan, LI Decheng, ZHENG Guanghui, et al. Comparative Study on Prediction of Soil Nutrients by Visible-Near Infrared and Mid-infrared Spectroscopy. Acta Pedologica Sinica, 2024, 61(3): 687-698.

基金项目

国家自然科学基金项目(42107322)、中国烟草总公司贵州省公司科技项目(201910)、江苏省高校自然科学基金面上项目(20KJB210009)共同资助

通讯作者Corresponding author

曾荣, E-mail:rzeng@nuist.edu.cn

作者简介

李学兰(1997—),女,广西桂林人,硕士研究生,主要从事土壤遥感方面的研究。E-mail:lixuelan785@163.com
可见-近红外与中红外光谱预测土壤养分的比较研究
李学兰1, 李德成2, 郑光辉1, 曾荣1, 蔡凯3, 高维常3, 潘文杰4, 姜超英4, 曾陨涛4    
1. 南京信息工程大学地理科学学院, 南京 210044;
2. 土壤与农业可持续发展国家重点实验室(中国科学院南京土壤研究所), 南京 210008;
3. 贵州省烟草科学研究院烟草行业山地烤烟品质与生态重点实验室, 贵阳 550081;
4. 中国烟草总公司贵州省公司, 贵阳 550004
摘要:对土壤养分的快速和准确测定有助于适时指导施肥。为进一步研究可见-近红外(350~2500 nm)与中红外光谱(4000~650 cm–1)对土壤养分的预测能力,以贵州省500个土样为例,对光谱进行Savitzky-Golay(SG)平滑去噪处理,再用标准正态化(SNV)方法进行基线校正,然后分别应用偏最小二乘回归(PLSR)和支持向量机(SVM)两种方法进行建模,探讨了可见-近红外和中红外光谱对土壤全氮(TN)、全磷(TP)、全钾(TK)和碱解氮(AN)、有效磷(AP)、速效钾(AK)共六种土壤养分的预测效果。结果表明:(1)无论基于可见-近红外光谱还是中红外光谱,PLSR模型的预测精度整体均优于SVM模型。(2)中红外光谱对TN、TK和AN的预测精度均显著高于可见-近红外光谱,可见-近红外和中红外光谱均可以可靠地预测TN和TK(性能与四分位间隔距离的比率(RPIQ)大于2.10),中红外光谱可相对较可靠地预测AN(RPIQ=1.87);但两类光谱对TP、AP和AK的预测效果均较差(RPIQ < 1.34)。(3)当变量投影重要性得分(VIP)大于1.5时,PLSR模型在中红外光谱区域预测TN和TK的重要波段多于可见-近红外光谱区域,TN的重要波段主要集中于可见-近红外光谱区域的1910和2207 nm附近,中红外光谱区域的1 120、1 000、960、910、770和668 cm–1附近;TK的重要波段主要集中于可见-近红外光谱区域的540、2176、2225和2268 nm附近,中红外光谱区域的1 040、960、910、776、720和668 cm–1附近。因此,中红外光谱技术结合PLSR模型对土壤养分预测效果较好,可快速准确预测土壤TN和TK,可为指导适时施肥提供技术支撑。
关键词可见-近红外光谱    中红外光谱    土壤养分    偏最小二乘回归    支持向量机    
Comparative Study on Prediction of Soil Nutrients by Visible-Near Infrared and Mid-infrared Spectroscopy
LI Xuelan1, LI Decheng2, ZHENG Guanghui1, ZENG Rong1, CAI Kai3, GAO Weichang3, PAN Wenjie4, JIANG Chaoying4, ZENG Yuntao4    
1. School of Geographical Science, Nanjing University of Information Science & Technology, Nanjing 210044, China;
2. State Key Laboratory of Soil and Sustainable Agriculture, Institute of Soil Science, Chinese Academy of Sciences, Nanjing 210008, China;
3. Upland Flue-cured Tobacco Quality & Ecology Key Laboratory of China Tobacco, Guizhou Academy of Tobacco Science, Guiyang 550081, China;
4. China National Tobacco Corporation Guizhou Provincial Company, Guiyang 550004, China
Abstract: 【Objective】Predicting soil nutrients by visible-near infrared (vis-NIR) and mid-infrared (MIR) spectroscopy has the advantages of being fast, cost-effective and environmental friendly. Soil spectra contain abundant information of soil properties, and can be combined with machine learning methods to effectively and accurately predict soil nutrients, which can provide support and guidance for timely fertilization management. The objective of this study was to compare the predictive ability of vis-NIR (350-2500 nm) and MIR spectroscopy (4000-650 cm–1) for predicting both the total and available contents of soil nitrogen (N), phosphorus (P) and potassium (K), in order to construct an optimal model for estimation of different nutrient contents.【Method】In this study, 500 samples were collected from the surface layers (0-20 cm) of the dryland in Guizhou Province for determination of soil N, P and K contents and spectral analysis. The vis-NIR spectra were measured by Cary 5000 and the MIR spectra by Thermo Scientifit Nicolet iS50. Soil spectra were pre-processed by Savitzky-Golay (SG) smoothing for denoising and standard normal variate (SNV) transformation for baseline correction. Partial least squares regression (PLSR) and support vector machine (SVM) were used to predict the contents of total nitrogen (TN), total phosphorus (TP), total potassium (TK), alkali-hydrolyzable nitrogen (AN), available phosphorus (AP) and available potassium (AK).【Result】The results showed that: (1) Whether using the vis-NIR spectroscopy or the MIR spectroscopy, the prediction accuracy of PLSR model was better than that of SVM model. (2) The accuracy of MIR spectroscopy for prediction of TN, TK and AN was significantly higher than that of vis-NIR spectroscopy. Vis-NIR and MIR spectroscopy could reliably predict TN and TK(ratio of performance to interquartile distance (RPIQ) > 2.10), while MIR spectroscopy could predict AN with moderate accuracy (RPIQ = 1.87). However, both types of spectra had poor ability to predict TP, AP and AK (RPIQ < 1.34). (3) When the variable in the projection (VIP) score was > 1.5, there were more important bands selected by PLSR models in the MIR region than the vis-NIR region. The important bands selected for estimation of TN were mainly concentrated near 1910 and 2207 nm in the vis-NIR region, and centered around 1 120, 1 000, 960, 910, 770, and 668 cm–1 in the MIR region. The important bands of TK were mainly distributed around 540, 2 176, 2 225, and 2 268 nm in the vis-NIR region, and around 1 040, 960, 910, 776, 720, and 668 cm–1 in the MIR region.【Conclusion】Therefore, MIR spectroscopy combined with PLSR model proved to be promising for accurate prediction of soil nutrients, especially for the estimation of TN and TK, and can provide technical support for guiding timely fertilization.
Key words: Visible-near infrared spectroscopy    Mid-infrared spectroscopy    Soil nutrients    Partial least squares regression    Support vector machine    

土壤氮(N)、磷(P)、钾(K)是土壤肥力的重要组成部分[1]。常规土壤养分测定方法主要为实验室化学测量法,其周期长、成本高,存在环境风险。而可见-近红外(VNIR)和中红外(MIR)光谱预测土壤属性,具有快速、低成本、低环境风险的优势[2],已成为土壤养分预测的研究热点。

利用土壤光谱预测土壤养分的研究自21世纪开始逐步增多,早期的研究主要集中在可见-近红外光谱。如李伟等[3]利用近红外光谱有效预测了土壤碱解氮(AN),但对有效磷(AP)和速效钾(AK)含量的预测效果较差;吴茜等[4]发现土壤可见-近红外光谱可用于对水稻土N、P、K速效态预测;Yang等[5]采用可见-近红外光谱较好地预测了土壤氮含量,其预测精度决定系数(R2)最高达到0.70;Devianti等[6]同样利用可见-近红外光谱较好地预测了土壤全氮(TN)、全磷(TP)和全钾(TK)含量。近年来,伴随中红外光谱技术的发展与成熟,应用中红外光谱技术预测土壤养分受到了较多关注。相比于可见-近红外光谱,中红外光谱的波峰波谷主要源于基频振动引起的能级跃迁,包含的土壤属性信息更为丰富[7]。已有研究表明,与可见-近红外光谱相比,中红外光谱对土壤养分的预测更为精准,如蒋璐璐等[8]利用中红外光谱对AN的预测结果与近红外光谱相近,但对AP和AK的预测结果更优;Santos等[2]发现中红外光谱对土壤全碳(TC)和TN含量的预测要优于可见-近红外光谱;Greenberg等[9]发现中红外光谱技术可准确地预测土壤TN含量,性能与四分位间隔距离的比率(ratio of performance to interquartile distance,RPIQ)高达2.50;Hati等[10]利用中红外光谱较好地预测了有机碳(SOC)含量,而对AP和AK的含量预测较差。但迄今为止,结合可见-近红外和中红外光谱预测土壤N、P、K全量和有效态的比对研究甚少。此外,随着多元数据分析技术的发展,结合使用土壤光谱技术和机器学习方法能更好地实现对土壤属性的预测,偏最小二乘回归(PLSR)和支持向量机(SVM)作为常用的机器学习方法,对土壤属性的预测均取得了较好的结果[211]。本研究选取贵州全省500个土壤样本为研究对象,研究可见-近红外和中红外波段的光谱特征,比较两类光谱对TN、TP、TK和AN、AP、AK的预测能力;评估PLSR和SVM两种模型的预测精度,以期构建预测不同养分含量的最优模型;并筛选出土壤养分在可见-近红外和中红外光谱区域的重要建模波段,为快速预测土壤养分含量提供技术支撑。

1 材料与方法 1.1 研究区概况与土样采集和测定

贵州省(24°37′N~29°13′N,103°36′E~109°35′E)位于我国西南地区,平均海拔1100 m左右,是典型喀斯特地貌区,以高原山地为主,地势西高东低。土壤类型主要有黄壤、黄棕壤、红壤、水稻土等[12]

2019年11月至12月期间利用代表性采样法在贵州省全省范围内确定了500块农田,主要为烟草和玉米轮作的旱地,具体分布位置如图 1所示。在每块农田随机选取了5~8个点采集耕作层(0~20 cm)土样,记录采样点的经纬度、海拔高度、成土因素、土地利用类型等重要信息,将土样充分混合,采取四分法保留其中的1.5 kg土样。将采集的土样在实验室干燥处进行自然风干、去杂、磨碎,过60目(0.25 mm)筛,充分混匀后等分为两份,分别用于化学组分测定和光谱分析。

图 1 研究区采样点分布图 Fig. 1 Spatial distribution of sampling sites

土壤N、P、K含量的测定参考《土壤调查实验室分析方法》[13],TN采用重铬酸钾、硫酸消化—蒸馏法测定;TP采用酸溶—钼锑钪比色法测定;TK采用酸溶—火焰光度法测定;AN采用碱解扩散法测定;AP采用浸提—钼锑钪比色法测定;AK采用乙酸铵浸提—火焰光度法测定。

1.2 光谱数据的采集和预处理

测定光谱前,首先将土样于45℃烘箱烘烤24 h置于干燥器中待测。可见-近红外光谱的测定仪器为紫外-可见-近红外(UV-Vis-NIR)分光光度计(Agilent Cary 5000,马来西亚),波长范围为350~2500 nm,其中350~700 nm的光谱分辨率小于等于0.048 nm,700~2500 nm的分辨率小于等于0.20 nm,光谱重采样至1 nm,每次选取1~2 g样品置于样品仓;中红外光谱测定仪器为傅立叶变换红外光谱(FT-IR,Thermo Scientifit Nicolet iS50,美国),测定范围为4000~400 cm–1,光谱分辨率小于等于0.09 cm–1,将粉末状土样置于光滑圆盘上,旋回顶针压实样品,测定土样的光谱透过率,同一样品重复压实测量三次取平均值,最后通过OMNIC软件转化为吸光度。

在构建光谱模型之前,首先进行光谱预处理。在比较不同预处理方法对模型预测精度的影响后,优选了如下的预处理方法:对可见-近红外和中红外光谱进行Savitzky-Golay(SG)卷积平滑处理,以期去除光谱噪声的影响;再应用标准正态化(SNV)方法对平滑后的中红外光谱进行基线校正,以消除基线漂移[14]

1.3 预测模型的建立与检验

本研究采用偏最小二乘回归(PLSR)和支持向量机(SVM)两种方法来构建光谱预测模型。PLSR是应用最为广泛的线性建模方法,结合了主成分回归(PCR)与线性回归的优势,该方法建模时可允许样本量少于变量,对特征向量有很好的辨识能力,能够通过数据降维将光谱转化为有限的潜在变量(latent variable,LV)来预测土壤性质;SVM通过结构风险最小化原理来提高泛化能力,其优点是能够较好地解决非线性、高维数和局部极小等实际问题[15]

为避免随机划分建模集和验证集对模型精度的影响,本文采用留一法交叉验证(leave-one-out cross validation,LOOCV)。该方法是指假设有N个样本,每次仅留下一个样本作为预测集,其余N-1个样本做建模集[16]。PLSR和SVM均采用留一法交叉验证来构建土壤养分的预测模型。

预测模型的精度通过实测值与预测值的决定系数(R2)、均方根误差(RMSE)和性能与四分位间隔距离的比率(ratio of performance to interquartile distance,RPIQ)来进行评价。RPIQ综合考虑了预测误差和测量值本身的变异,且不对测量值的正态性作出任何假设。相对于相对分析误差(RPD),它对模型的精度评定更为客观[17]。当模型的R2越大、RMSE越小、RPIQ越大,说明模型预测精度越高,反之越低。

针对PLSR的最佳预测模型,采用变量投影重要性(variable in the projection,VIP)[18]的得分来筛选预测目标属性的重要光谱波段,具体计算公式如下:

$ {\text{VI}}{{\text{P}}_k}(a) = K\sum\limits_a {\omega _{ak}^2} \left( {\frac{{{\text{SS}}{{\text{Y}}_a}}}{{{\text{SS}}{{\text{T}}_t}}}} \right) $ (1)

式中,$ {\text{VI}}{{\text{P}}_k}(a) $是LV为a的模型中第k个预测变量的重要性得分,$ \omega _{ak}^{} $是第a个LV对应的第k个变量的载荷权重,$ {\text{SS}}{{\text{Y}}_a} $a个LV的PLSR模型中解释预测变量Y的总平方和,$ {\text{SS}}{{\text{T}}_t} $Y的总离差平方和,K为预测变量的个数。VIP分数是对每个解释变量的重要性的衡量。一般认为VIP得分大于1的有影响波段是重要波段,VIP得分越大说明该土壤属性对应的波长在PLSR模型的重要性越强[19]

2 结果与讨论 2.1 土壤氮磷钾含量的统计特征

本研究根据贵州省土壤养分管理情况,并参考全国第二次土壤普查养分分级标准,将土壤养分划分为5个等级(仅TP为4个等级),并结合N、P、K含量统计情况(表 1),计算各属性在每个分级标准下含量所占比重(表 2)。其中,TN含量适中,大多数含量低于1.73 g⋅kg–1,范围为0.55~3.51 g⋅kg–1,变异系数低(26.85%);TP含量偏低,平均值仅为0.91 g⋅kg–1,范围为0.11~10.73 g⋅kg–1,变异系数达到62.29%;TK含量在分级范围内占比均匀,处于2.17~41.37 g⋅kg–1之间,值域较宽,变异系数为50.44%。AN、AP和AK含量平均值分别为150.8、32.30和349.0 mg⋅kg–1,AN含量适中,变化范围为36.75~475.9 mg⋅kg–1,变异系数为29%,与TN变异系数相近;AP和AK含量比较富足,分别处于0.26~251.8 mg⋅kg–1和40.00~1480 mg⋅kg–1之间,变异系数分别为79.41%和54.37%。

表 1 土壤氮磷钾含量描述性统计特征 Table 1 Descriptive statistical characteristics of soil N, P and K contents

表 2 土壤氮磷钾分级标准及各等级所占比重 Table 2 Grading standards of soil N, P and K contents and the proportion of each grade
2.2 土壤光谱曲线特征

为探究不同N、P、K含量土壤光谱曲线特征的差异,依据表 2中TN、TP和TK的分级标准,统计不同等级TN、TP和TK含量的平均光谱吸光度曲线(图 2)。

注:全氮含量仅有四个等级,不存在极低含量。  Note: There are only four levels of TN content and no very low level. 图 2 不同氮磷钾含量的吸收光谱曲线 Fig. 2 Absorption spectral curves of different N, P and K contents

图 2a为可见-近红外光谱区域的吸收曲线,随波长的增加,在可见光波段土壤光谱吸光度迅速降低;在近红外波段光谱吸光度较低,随波长的增大吸光度变化平缓,逐渐缓慢上升。各样本的光谱曲线形态和吸收特征位置大致相似,均在吸收光谱的1400、1900、2200 nm附近出现不同幅度的吸收峰,这主要是由于水和黏土矿物引起的特征吸收带[20]。分析可见-近红外光谱吸收曲线变化规律发现,TN含量升高,光谱反射率降低,这与土壤有机质的光谱特性类似,其原因在于TN和有机质之间密切相关,相关系数达到0.86,与陈颂超等[21]的研究结果一致;对于TP而言,TP含量最低时(< 0.5 g⋅kg–1)所对应的吸光度也最低,但含量在1.0~1.5 g⋅kg–1的平均吸光度要略高于TP含量最高的等级(≥1.5 g⋅kg–1);对于TK而言,不同等级TK含量对应的吸收度平均值较为接近,差异不如TN和TP明显,但TK含量最低时(< 10.0 g⋅kg–1)所对应的吸光度最高,含量最高时(≥25.0 g⋅kg–1)所对应的吸光度最低。

图 2b为中红外光谱区域的吸收曲线,在4000~1250 cm–1范围内,光谱的吸光度变化较为平缓,在3300 cm–1和1630 cm–1附近出现小幅度的吸收峰,吸光度在1000 cm–1附近快速升高后急剧下降,在910 cm–1和810 cm–1附近形成反射谷后进行小幅度波动,最后在780 cm–1附近形成吸收峰,在730 cm–1附近形成反射谷。从已有研究可知,3300 cm–1附近波段变化可能与C-H的伸缩振动和N-H的弯曲振动有关;1630 cm–1附近的吸收峰可能与土壤中的束缚水有关;1000 cm–1附近的吸收峰可能与黏土矿物相关;910 cm–1和810 cm–1附近的波段变化可能受到黏土矿物(高岭石、蒙脱石)和石英的影响;780和730 cm–1附近波段变化可能由N-H弯曲振动引起[22]。相比于可见-近红外光谱,不同N、P、K含量等级下,中红外光谱吸收曲线的变异较小,尤其针对TK,其不同含量的吸光度曲线几乎重合,难以从视觉上区分;TN和TP在3900~2600和1700~1300 cm–1范围内各含量对应光谱吸光度有较大的变异。

2.3 土壤养分预测模型的构建与验证

表 3列举了基于可见-近红外和中红外光谱建立的PLSR和SVM模型的预测结果,本研究将比较不同光谱及不同模型的预测精度,以期筛选预测不同养分的最优预测模型。

表 3 基于可见-近红外和中红外光谱的PLSR和SVM模型的构建与验证 Table 3 Construction and validation of PLSR and SVM models based on VNIR and MIR spectra
2.3.1 可见-近红外光谱的建模

对于TN和TK,PLSR模型的预测精度RPIQ分别为2.10、2.20,SVM模型的预测精度RPIQ分别为1.84、1.86,PLSR模型的预测能力更优;对于TP,PLSR和SVM模型的预测精度均较低,RPIQ接近0.62。比较N、P、K有效态的预测精度,其中以AN的预测精度最高,PLSR模型的预测精度高于SVM模型的预测精度,RPIQ分别为1.62、1.36;对于AP和AK,PLSR和SVM模型的预测结果相似,RPIQ分别为1.01~1.07、1.26~1.34。

基于可见-近红外光谱所构建的模型中,N、P、K全量和有效态的预测精度由高到低依次为:TK > TN > AN > AK > AP > TP,PLSR模型能够对TN和TK进行可靠的预测(RPIQ > 2.00),但TP以及N、P、K有效态的预测效果均不佳(RPIQ < 1.62)。有机质在可见-近红外波段内存在不同的倍频峰和合频峰,具有很强的光谱相应特征,本研究中TN和有机质相关性较高,这应该是TN预测效果较好的原因[21]。李颉等[23]利用可见-近红外光谱对TN和TK的预测取得了相似的结果,Debaene等[24]对AP和AK的预测精度也均较低,R2不超过0.5。依据散点图 3a,PLSR模型的拟合曲线相比于SVM模型更接近1︰1线,PLSR模型的预测能力整体优于SVM模型,该结论可能与样本集的划分法或光谱的预处理方法有关[2],何积秀[22]也发现PLSR模型预测AN要优于SVM模型。

注:实线是散点图拟合线,虚线是实测值和预测值之间的相等线。  Note: The solid line is the fitted line of the scatter plot, and the dashed line is the line of equality between the measured and predicted values. 图 3 基于可见-近红外(a)和中红外(b)光谱的氮磷钾预测模型PLSR和SVM结果比较 Fig. 3 Comparison of PLSR and SVM models for predicting N, P and K based on VNIR(a) and MIR(b) spectra
2.3.2 中红外光谱的建模

基于中红外光谱所构建的土壤养分预测模型中,N、P、K全量的预测精度有大幅提升,TK预测精度最高,PLSR和SVM模型的预测精度RPIQ分别为5.02、4.44;其次为TN,预测精度RPIQ分别为2.93、2.86;TP的预测精度最低,PLSR和SVM的预测精度相近,RPIQ分别为0.63、0.64。对于N、P、K有效态含量的预测,AN预测精度最高,PLSR和SVM模型的预测精度相近,RPIQ分别为1.87、1.83;对于AP和AK,中红外光谱的预测精度未见提升,PLSR和SVM的预测结果相似,RPIQ分别为1.02~1.05、1.32~1.33。

N、P、K全量和有效态的预测精度由高到低依次为:TK > TN > AN > AK > AP > TP,基于中红外光谱,PLSR和SVM模型对TN和TK均能进行可靠的预测,对AN的预测较为可靠(2.0 > RPIQ > 1.80),对TP和N、P、K有效态的预测效果较差。依据散点图 3b,PLSR模型的拟合曲线相比于SVM模型更接近1︰1线,与可见-近红外光谱的预测结果类似,PLSR模型的预测能力也整体优于SVM模型。

2.3.3 可见-近红外与中红外光谱模型的比对

无论基于可见-近红外光谱还是中红外光谱,PLSR模型的预测精度整体优于SVM模型。因此,以下对可见-近红外光谱与中红外光谱预测能力的比较将仅针对PLSR模型。

针对TN、TK和AN,相比于可见-近红外光谱,中红外光谱的预测精度均有显著提升;其中,TK的预测精度提升幅度最大,RMSE由4.85 g⋅kg–1减少至2.12 g⋅kg–1R2由0.58提高至0.92,RPIQ由2.20提高至5.02;其次为TN,RMSE由0.29 g⋅kg–1减少至0.21 g⋅kg–1R2由0.61提高至0.80,RPIQ由2.10提高至2.93;AN的预测精度提升幅度最小,RMSE由31.75 mg⋅kg–1减少至27.51 mg⋅kg–1R2由0.47提高至0.60,RPIQ由1.62提高至1.87。中红外光谱可能由于CO、CH等官能团及光谱活跃成分(有机质、碳酸盐、黏土矿物等)较多,预测TN、TK和AN的模型性能得到明显改善,这与Ng等[25]发现中红外光谱预测土壤属性的能力更优的结论一致。对于TN和TK,可见-近红外和中红外光谱均能可靠地预测(RPIQ > 2.00);对于AN,中红外光谱的预测精度有所提高,说明土壤中红外光谱对AN含量进行预测是有可能的(RPIQ > 1.80)。

对于TP、AP和AK,可见-近红外和中红外光谱的预测效果均较差,预测精度的变化幅度不大。相比于可见-近红外光谱,中红外光谱对TP的预测精度有提升,RMSE由0.54 g⋅kg–1减少至0.53 g⋅kg–1R2由0.09提高至0.11,RPIQ由0.62提高至0.63;对AP和AK的预测精度略微降低,AP的RMSE由24.33 mg⋅kg–1提高至24.82 mg⋅kg–1R2由0.10减少至0.06,RPIQ由1.07减少至1.05;AK的RMSE由178.5 mg⋅kg–1提高至180.3 mg⋅kg–1R2由0.11减少至0.10,RPIQ由1.34减少至1.33。

利用可见-近红外和中红外光谱预测TP和AP的精度均较低,可能的原因是磷在这两类光谱区间均无特定的光谱吸收带。Mouazen等[26]和Wijewardane等[27]分别发现磷在可见-近红外和中红外光谱中无直接的光谱响应,需要借助与其相关性高的光谱活性成分(有机物、碳酸盐、黏土等)建立间接的光谱预测模型,但在不同的研究中,与磷相关的因子并不固定。因此,磷不易像TN和AN那样能被较好地预测。TK在可见-近红外和中红外光谱中预测精度均较高,而AK的预测精度均较低,预测结果差异较大的原因可能是土壤TK和AK的组成和含量不同[28]

2.4 土壤养分的可见-近红外和中红外光谱预测重要波段

在本研究中TN和TK的预测精度较高,而TP和N、P、K有效态的预测精度低。因此PLSR模型的重要波段分析以TN和TK为例。如图 4所示,当VIP > 1时,TK和TN在可见-近红外和中红外光谱区域内的重要波段入选较多,而当VIP > 1.5时,其重要波段减少,但对于预测贡献更大,因此本研究将VIP得分的阈值提高为1.5[29]

注:灰色虚线VIP=1.5,为本研究设定阈值。  Note: Black dotted line VIP = 1.5, set threshold for this study. 图 4 基于PLSR模型的土壤全氮和全钾的变量投影重要性(VIP)得分 Fig. 4 Variable in the projection(VIP) scores of soil TN and TK based on the PLSR model

在可见-近红外光谱区域(图 4a),预测TN的重要波段主要集中于1910和2207 nm附近,TK的重要波段主要集中于540、2176、2225和2268 nm附近。本研究中可见-近红外光谱区域TN的重要波段与陈颂超等[21]认为的1400和2200 nm的结论相似,TK的重要波段与张超等[11]认为的530、617、1988和2208 nm的结论比较一致。重要波段540 nm可能与土壤颜色或赤铁矿有关[19],1910、2207、2176和2225 nm可能与土壤水分子和黏土矿物有关[30],2268 nm可能与C-H伸缩振动有关[29]

在中红外光谱区域内(图 4b),预测TN和TK的重要波段多于可见-近红外光谱区域。其中,预测TN的重要波段主要集中在1120、1000、960、910、770和668 cm–1附近,TK的重要波段主要集中于1040、960、910、776、720和668 cm–1附近。TN和TK的重要波段重叠较多,与何积秀[22]和陈颂超等[29]认为有机质的重要波段在1220、1030、810 cm–1的结论相近。重要波段1120 cm–1可能与C-O伸缩振动有关[29],1040、1000和960 cm–1可能与黏土矿物中的Si-O伸缩振动有关[31],910 cm–1可能与高岭石、三水铝石等黏土矿物的O-H弯曲振动有关[32],776、770、720和668 cm–1可能与C-H弯曲振动有关或受N-H影响[2233]

3 结论

本文采用PLSR和SVM两种方法建立土壤N、P、K含量的光谱预测模型,探讨可见-近红外和中红外光谱技术对预测模型精度的影响。结果发现利用可见-近红外和中红外光谱对TN和TK含量预测是可行的,就建模结果而言,PLSR预测模型整体上优于SVM预测模型,中红外光谱预测TN、TK和AN精度均较可见-近红外光谱显著提升,两类光谱均对TN和TK的预测精度较高,其中MIR-PLSR-TK模型的预测精度最佳,但仅有中红外光谱可较可靠地预测AN。而对于TP、AP和AK的预测效果而言,两类光谱的预测能力均较差。结合可见-近红外和中红外光谱的最优预测模型筛选预测TN和TK的重要波段,两类光谱在中红外光谱区域预测TN和TK的重要波段多于可见-近红外光谱区域。因此,建议一是采用中红外光谱技术结合PLSR模型来实现对土壤TN和TK的预测;二是针对土壤TP和N、P、K有效态的预测精度较低的问题,进一步尝试提取N、P、K主成分或特征波段,通过光谱融合及探索其他模型等提升这些属性的预测精度。

参考文献
[1]
Gao X S, Xiao Y, Deng L J, et al. Spatial variability of soil total nitrogen, phosphorus and potassium in Renshou County of Sichuan Basin, China[J]. Journal of Integrative Agriculture, 2019, 18(2): 279-289. DOI:10.1016/S2095-3119(18)62069-6 (0)
[2]
Santos U J D, Demattê J a D M, Menezes R S C, et al. Predicting carbon and nitrogen by visible near-infrared(vis-NIR) and mid-infrared(MIR) spectroscopy in soils of Northeast Brazil[J]. Geoderma Regional, 2020, 23: e00333. DOI:10.1016/j.geodrs.2020.e00333 (0)
[3]
Li W, Zhang S H, Zhang Q, et al. Rapid prediction of available N, P and K content in soil using near-infrared reflectance spectroscopy (In Chinese)[J]. Transactions of the Chinese Society of Agricultural Engineering, 2007, 23(1): 55-59. DOI:10.3321/j.issn:1002-6819.2007.01.009 [李伟, 张书慧, 张倩, 等. 近红外光谱法快速测定土壤碱解氮、速效磷和速效钾含量[J]. 农业工程学报, 2007, 23(1): 55-59.] (0)
[4]
Wu Q, Yang Y H, Xu Z L, et al. Applying local neural network and visible/near-infrared spectroscopy to estimating available nitrogen, phosphorus and potassium in soil (In Chinese)[J]. Spectroscopy and Spectral Analysis, 2014, 34(8): 2102-2105. DOI:10.3964/j.issn.1000-0593(2014)08-2102-04 [吴茜, 杨宇虹, 徐照丽, 等. 应用局部神经网络和可见/近红外光谱法估测土壤有效氮磷钾[J]. 光谱学与光谱分析, 2014, 34(8): 2102-2105.] (0)
[5]
Yang J, Wang X, Wang R, et al. Combination of convolutional neural networks and recurrent neural networks for predicting soil properties using vis-NIR spectroscopy[J]. Geoderma, 2020, 380: 114616. DOI:10.1016/j.geoderma.2020.114616 (0)
[6]
Devianti D, Sufardi S, Bulan R, et al. Vis-NIR spectra combined with machine learning for predicting soil nutrients in cropland from Aceh Province, Indonesia[J]. Case Studies in Chemical and Environmental Engineering, 2022, 6: 100268. DOI:10.1016/j.cscee.2022.100268 (0)
[7]
Yang J B. Application of infrared spectroscopy in environmental monitoring (In Chinese)[J]. China Resources Comprehensive Utilization, 2020, 38(4): 148-150. DOI:10.3969/j.issn.1008-9500.2020.04.041 [杨家宝. 红外光谱技术在环境监测中的应用[J]. 中国资源综合利用, 2020, 38(4): 148-150.] (0)
[8]
Jiang L L, Zhang Y, Wang Y Y, et al. Fast determination of nutritional parameters in soil based on spectroscopic techniques (In Chinese)[J]. Journal of Zhejiang University(Agriculture & Life Sciences), 2010, 36(4): 445-450. [蒋璐璐, 张瑜, 王艳艳, 等. 基于光谱技术的土壤养分快速测试方法研究[J]. 浙江大学学报(农业与生命科学版), 2010, 36(4): 445-450.] (0)
[9]
Greenberg I, Seidel M, Vohland M, et al. Performance of in situ vs laboratory mid-infrared soil spectroscopy using local and regional calibration strategies[J]. Geoderma, 2022, 409: 115614. DOI:10.1016/j.geoderma.2021.115614 (0)
[10]
Hati K M, Sinha N K, Mohanty M, et al. Mid-infrared reflectance spectroscopy for estimation of soil properties of Alfisols from eastern India[J]. Sustainability, 2022, 14(9): 4883. DOI:10.3390/su14094883 (0)
[11]
Zhang C, Liu Y M, Sun Y N, et al. Hyperspectral prediction model of soil nutrient content in the loess hilly-gully region, China (In Chinese)[J]. Chinese Journal of Applied Ecology, 2018, 29(9): 2835-2842. [张超, 刘咏梅, 孙亚楠, 等. 黄土丘陵沟壑区土壤养分含量的高光谱预测模型[J]. 应用生态学报, 2018, 29(9): 2835-2842.] (0)
[12]
Chen Q X, Lu X H, Zhao W X, et al. Spatial differentiation of main soil types in Guizhou Province under different topographical conditions (In Chinese)[J]. Jiangsu Agricultural Sciences, 2022, 50(7): 205-213. [陈清霞, 陆晓辉, 赵文轩, 等. 不同地形条件下贵州省主要土壤类型的空间分异[J]. 江苏农业科学, 2022, 50(7): 205-213.] (0)
[13]
Zhang G L, Gong Z T. Soil survey laboratory methods (In Chinese). Beijing: Science Press, 2012. [张甘霖, 龚子同 . 土壤调查实验室分析方法[M]. 北京: 科学出版社, 2012.] (0)
[14]
Tiecher T, Moura-Bueno J M, Caner L, et al. Improving the quantification of sediment source contributions using different mathematical models and spectral preprocessing techniques for individual or combined spectra of ultraviolet-visible, near- and middle-infrared spectroscopy[J]. Geoderma, 2021, 384: 114815. DOI:10.1016/j.geoderma.2020.114815 (0)
[15]
de Santana F B, Otani S K, De Souza A M, et al. Comparison of PLS and SVM models for soil organic matter and particle size using vis-NIR spectral libraries[J]. Geoderma Regional, 2021, 27: e00436. DOI:10.1016/j.geodrs.2021.e00436 (0)
[16]
Chauhan R, Kumar R, Kumar V, et al. On the discrimination of soil samplesby derivative diffuse reflectance UV-vis-NIR spectroscopy and chemometric methods[J]. Forensic Science International, 2020, 319: 110655. (0)
[17]
Tang H T, Meng X T, Su X X, et al. Hyperspectral prediction on soil organic matter of different types using CARS algorithm (In Chinese)[J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(2): 105-113. [唐海涛, 孟祥添, 苏循新, 等. 基于CARS算法的不同类型土壤有机质高光谱预测[J]. 农业工程学报, 2021, 37(2): 105-113.] (0)
[18]
Hong Y S, Chen Y Y, Yu L, et al. Combining fractional order derivative and spectral variable selection for organic matter estimation of homogeneous soil samples by VIS-NIR spectroscopy[J]. Remote Sensing, 2018, 10(3): 479. DOI:10.3390/rs10030479 (0)
[19]
Qi H J, Li S W, Karnieli A, et al. Prediction method of soil available phosphorus using hyperspectral data based on PLS-BPNN (In Chinese)[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(2): 166-172. [齐海军, 李绍稳, Karnieli A, 等. 基于PLS-BPNN算法的土壤速效磷高光谱回归预测方法[J]. 农业机械学报, 2018, 49(2): 166-172.] (0)
[20]
Zhao M S, Xie Y, Lu L M, et al. Modeling for soil organic matter content based on hyperspectral feature indices (In Chinese)[J]. Acta Pedologica Sinica, 2021, 58(1): 42-54. [赵明松, 谢毅, 陆龙妹, 等. 基于高光谱特征指数的土壤有机质含量建模[J]. 土壤学报, 2021, 58(1): 42-54.] (0)
[21]
Chen S C, Feng L L, Li S, et al. Vis-NIR spectral inversion for prediction of soil total nitrogen content in laboratory based on locally weighted regression (In Chinese)[J]. Acta Pedologica Sinica, 2015, 52(2): 312-320. [陈颂超, 冯来磊, 李硕, 等. 基于局部加权回归的土壤全氮含量可见-近红外光谱反演[J]. 土壤学报, 2015, 52(2): 312-320.] (0)
[22]
He J X. Predictionof fertility factors in paddy soil using VNIR and MIR spectroscopy[D]. Hangzhou: Zhejiang University, 2015.[何积秀. 基于VNIR和MIR光谱的水稻田土壌肥力因子预测[D]. 杭州: 浙江大学, 2015.] (0)
[23]
Li J, Zhang X C, Yuan Y W, et al. Analysis of soil nutrient content based on near infrared reflectance spectroscopy in Beijing region (In Chinese)[J]. Transactions of the Chinese Society of Agricultural Engineering, 2012, 28(2): 176-179. DOI:10.3969/j.issn.1002-6819.2012.02.031 [李颉, 张小超, 苑严伟, 等. 北京典型耕作土壤养分的近红外光谱分析[J]. 农业工程学报, 2012, 28(2): 176-179.] (0)
[24]
Debaene G, Niedźwiecki J, Pecio A, et al. Effect of the number of calibration samples on the prediction of several soil properties at the farm-scale[J]. Geoderma, 2014, 214/215: 114-125. DOI:10.1016/j.geoderma.2013.09.022 (0)
[25]
Ng W, Minasny B, Montazerolghaem M, et al. Convolutional neural network for simultaneous prediction of several soil properties using visible/near-infrared, mid-infrared, and their combined spectra[J]. Geoderma, 2019, 352: 251-267. DOI:10.1016/j.geoderma.2019.06.016 (0)
[26]
Mouazen A M, Kuang B, de Baerdemaeker J, et al. Comparison among principal component, partial least squares and back propagation neural network analyses for accuracy of measurement of selected soil properties with visible and near infrared spectroscopy[J]. Geoderma, 2010, 158(1/2): 23-31. (0)
[27]
Wijewardane N K, Ge Y, Wills S, et al. Predicting physical and chemical properties of US soils with a mid‐infrared reflectance spectral library[J]. Soil Science Society of America Journal, 2018, 82(3): 722-731. DOI:10.2136/sssaj2017.10.0361 (0)
[28]
Liu X Y, Shi Z Y, Chang Q R, et al. Hyperspectral model for estimation of soil potassium content in loessal soil (In Chinese)[J]. Acta Pedologica Sinica, 2018, 55(2): 325-337. [刘秀英, 石兆勇, 常庆瑞, 等. 黄绵土钾含量高光谱估算模型研究[J]. 土壤学报, 2018, 55(2): 325-337.] (0)
[29]
Chen S C, Peng J, Ji W J, et al. Study on the characterization of VNIR-MIR spectra and prediction of soil organic matter in paddy soil (In Chinese)[J]. Spectroscopy and Spectral Analysis, 2016, 36(6): 1712-1716. [陈颂超, 彭杰, 纪文君, 等. 水稻土可见-近红外-中红外光谱特性与有机质预测研究[J]. 光谱学与光谱分析, 2016, 36(6): 1712-1716.] (0)
[30]
He J L, Cui J L, Zhang S Y, et al. Hyperspectral estimation of heavy metal Cu content in soil based on partial least square method (In Chinese)[J]. Remote Sensing Technology and Application, 2019, 34(5): 998-1004. [贺军亮, 崔军丽, 张淑媛, 等. 基于偏最小二乘的土壤重金属铜含量高光谱估算[J]. 遥感技术与应用, 2019, 34(5): 998-1004.] (0)
[31]
Liu C Y, Zhang J R, Zeng T, et al. Determination of soil organic carbon and total nitrogen contents in aggregate fractions from Fourier transform infrared spectroscopy (In Chinese)[J]. Spectroscopy and Spectral Analysis, 2020, 40(12): 3818-3824. [刘翠英, 张津瑞, 曾涛, 等. 傅里叶变换红外光谱的土壤团聚体有机碳和全氮含量估测[J]. 光谱学与光谱分析, 2020, 40(12): 3818-3824.] (0)
[32]
Hao X X, Han X Z, Zou W X. Studies on composition of soil organic matter by Fourier transform infrared spectroscopy differential analysis (In Chinese)[J]. Chinese Journal of Analytical Chemistry, 2018, 46(4): 616-622. [郝翔翔, 韩晓增, 邹文秀. 示差红外光谱在土壤有机质组成研究中的应用[J]. 分析化学, 2018, 46(4): 616-622.] (0)
[33]
Bernier M H, Levy G J, Fine P, et al. Organic matter composition in soils irrigated with treated wastewater: FT-IR spectroscopic analysis of bulk soil samples[J]. Geoderma, 2013, 209/210: 233-240. DOI:10.1016/j.geoderma.2013.06.017 (0)