检索项 检索词
  土壤学报  2021, Vol. 58 Issue (1): 42-54  DOI: 10.11766/trxb202004200691
0

引用本文  

赵明松, 谢毅, 陆龙妹, 等. 基于高光谱特征指数的土壤有机质含量建模. 土壤学报, 2021, 58(1): 42-54.
ZHAO Mingsong, XIE Yi, LU Longmei, et al. Modeling for Soil Organic Matter Content Based on Hyperspectral Feature Indices. Acta Pedologica Sinica, 2021, 58(1): 42-54.

基金项目

国家自然科学基金项目(41501226)、土壤与农业可持续发展国家重点实验室开放基金项目(Y412201431)、安徽省高校自然科学研究项目(KJ2015A034)

作者简介

赵明松(1983-), 男, 安徽省淮南人, 博士, 副教授, 主要从事土壤时空变异、数字土壤制图研究。E-mail:zhaomingsonggis@163.com
基于高光谱特征指数的土壤有机质含量建模
赵明松1,2,3,4 , 谢毅1,3,4 , 陆龙妹1 , 李德成2 , 王世航1,3,4     
1. 安徽理工大学空间信息与测绘工程学院, 安徽淮南 232001;
2. 土壤与农业可持续发展国家重点实验室(中国科学院南京土壤研究所), 南京 210008;
3. 矿山采动灾害空天地协同监测与预警安徽省教育厅重点实验室, 安徽淮南 232001;
4. 矿区环境与灾害协同监测煤炭行业工程研究中心, 安徽淮南 232001
摘要:以江苏中部的水稻土和潮土为研究对象,采集178个表层土壤(0~20 cm)样品,并测定了土壤有机质含量(Soil Organic Matter,SOM)。运用ASD FieldSpec 3光谱仪测量了土壤的高光谱曲线,首先对原始光谱进行倒数对数和去包络线变换,分析了不同SOM含量梯度和土壤类型的高光谱特征。其次,基于原始光谱、倒数对数变换和去包络线变换等三种光谱数据,分别计算弓曲差、差值指数、比值指数和归一化指数等光谱特征指数,并分析其与SOM含量的相关性。最后,筛选光谱特征指数建立SOM的回归预测模型,并比较模型精度。结果表明:(1)SOM含量与原始光谱呈极显著负相关,与倒数对数光谱呈极显著正相关,且在400~900 nm波段相关性最强,相关系数绝对值在0.6以上。去除包络线处理后,土壤光谱曲线特征差异明显,在420 nm、480 nm、660 nm和900 nm附近出现了明显吸收谷。(2)原始光谱、倒数对数变换和去包络线变换光谱在600 nm处的弓曲差与SOM含量极显著相关(P < 0.01),相关系数分别为-0.66,0.61和-0.33。(3)利用3种光谱数据的差值指数、比值指数和归一化指数分别结合弓曲差,建立的SOM预测模型效果较好,建模的R2和RMSE分别介于0.56~0.64和4.98~5.50 g·kg-1,验证的R2和RMSE介于0.67~0.73和3.21~3.51 g·kg-1。为快速有效测定苏中平原SOM含量提供技术支持。
关键词光谱特征指数    弓曲差    光谱变换    土壤有机质    
Modeling for Soil Organic Matter Content Based on Hyperspectral Feature Indices
ZHAO Mingsong1,2,3,4 , XIE Yi1,3,4 , LU Longmei1 , LI Decheng2 , WANG Shihang1,3,4     
1. School of Geomatics, Anhui University of Science and Technology, Huainan, Anhui 232001 China;
2. State Key Laboratory of Soil and Sustainable Agriculture, Institute of Soil Science, Chinese Academy of Sciences, Nanjing 210008 China;
3. Key Laboratory of Aviation-aerospace-ground Cooperative Monitoring and Early Warning of Coal Mining-induced Disasters of Anhui Higher Education Institutes, Huainan, Anhui 232001 China;
4. Coal Industry Engineering Research Center of Collaborative Monitoring of Mining Area's Environment and Disasters, Huainan, Anhui 232001 China
Abstract: 【Objective】 The analysis of soil properties using routine chemical analysis method is rather costly and time-consuming, and so hard to meet the requirement for handling large volumes of soil samples fast and efficiently to monitor soil properties. Continuous soil spectral curves obtained with the aid of the hyperspectral technology encompass abundant spectral information, and reflect comprehensively various soil attribute information. Therefore, modeling can be done to predict some soil properties efficiently and accurately based on the hyperspectral technology. This paper was oriented to build a model for predicting soil organic matter (SOM) content based on hyperspectral feature indices with an expectation to provide a new method for rapid and effective determination of SOM content.【Method】 In this study, a total of 178 soil samples were collected from the surface soil layers (0~20 cm) of farmlands of paddy soil and fluvo-aquic soil in the central plain of Jiangsu province for analysis of SOM content. Hyperspectral curves of the soil samples were obtained with the aid of the ASD FieldSpec 3 spectrometer. Firstly, the original spectra were processed with the algorithms of reciprocal log transformation (Log(1/R)) and continuum-remova l (CR) for analysis of hyperspectral characteristics of the soil samples different in SOM content and in soil type. Secondly, based on the data of the original, Log (1/R) and CR spectra, spectral feature indices, including deviation of arch (DOA), difference index (DI), ratio index (RI), and normalized difference index (NDI), were calculated, and relationships of SOM content with the four indices were analyzed. Finally, linear regression models for SOM content were established based on the selected spectral feature indices. Accuracies of the models were evaluated and compared.【Result】 Results show:(1) SOM content was significantly and negatively related to original spectra, but significantly and positively to reciprocal log spectra. The relationship was the most significant at the waveband of 400~900 nm, with the absolute correlation coefficient value reached above 0.6. After the spectral curves being CR transformed, their differences in characteristic became extraordinarily significant different, and significant absorption valleys appeared near 420 nm, 480 nm, 660 nm, and 900 nm; (2) The DOAs of the original, Log (1/R) and CR spectra showed extra-significant relationships with SOM content (P < 0.01) at wavelength of 600 nm, with correlation coefficient being -0.66, 0.61 and-0.33, respectively; and (3) Based on the combinations of DOA with DI, RI, and NDI of the three different spectra, the model established for predicting SOM content performed quite effectively, with relative percent deviation ranging from 1.78 to 1.94, R2 from 0.56 to 0.64, and RMSE from 4.98 g·kg-1to 5.50 g·kg-1. And the validation sets had R2 ranging from 0.67 and 0.73, and RMSE from 3.21 g·kg-1 to 3.51 g·kg-1.【Conclusion】 The spectral feature indices, including DOA, DI, RI, and NDI, can be used effectively for modeling for SOM content, and the model may explain about 67%~73% of the SOM variability. The model established with RI and DOA of the Log (1/R) spectrum is an optimal one.
Key words: Spectral characteristic index    Deviation of arch    Spectral transformation    Soil organic matter    

连续的土壤高光谱曲线包含较多的波段和丰富的光谱信息,能够综合反映多种土壤属性信息,能够用于高效精确地土壤属性预测建模[1-5]。传统的土壤有机质(Soil Organic Matter,SOM)含量测试方法较繁琐且成本高,利用高光谱技术可以满足大量样本的SOM含量快速精确测定的需求[6-8]。国内外学者利用可见-近红外反射高光谱(350~2 500 nm)技术在土壤属性的建模预测方面开展了较多的研究。

由于成土环境的差异,不同地理区域和类型的土壤高光谱特征存在差异,已有研究分别结合土壤类型、区域等建立了多种SOM含量光谱预测模型[58-11]。史舟等[5]分析了中国主要土壤类型的高光谱反射特性,并提出了采用土壤光谱分类方法结合偏最小二乘回归方法建立SOM的光谱分类-局部预测模型。张娟娟等[8]研究了我国中、东部地区5种土壤类型的光谱特征,并利用特征光谱参数和神经网络建立SOM的预测模型。赵小敏和杨梅花[10]分析江西省4种主要土壤亚类的高光谱特征,并尝试利用光谱特征进行土壤分类。邬登巍和张甘霖[12]讨论了母质和土地利用类型对SOM光谱反演模型精度的影响以及模型的异地适用性。

不同的光谱变换处理[13-17]、建模和验证样本集的划分[18]会影响SOM预测模型的精度。光谱变换处理通过增强土壤在某些波段的吸收或反射特征,从而提高土壤属性光谱建模的精度等,研究表明使用光谱预处理后模型精度优于原始光谱数据模型[13],根据不同波段范围采用不同光谱变换处理,能够提高模型的稳定性和预测能力等[15]。于雷等[14]认为采用连续统去除变换结合偏最小二乘回归模型是江汉平原SOM含量的最优预测模型。王一丁等[17]对比了3种光谱变换处理后建立的潮褐土的SOM预测模型的精度。基于不同建模方法的SOM光谱建模研究较多,其中偏最小二乘回归模型总体精度较高,应用较广[619-22]。Shi等[2]提出了一种基于空间约束的局部偏最小二乘回归模型,并利用中国土壤光谱库精确预测了SOM含量。Viscarra Rossel和Behrens [19]利用偏最小二乘回归、多元自适应回归样条等7种算法预测了SOM和黏粒含量等,对比评估了模型精度以及结果的可解释性。纪文君等[20]利用多种数据挖掘技术建立了浙江省水稻土SOM预测模型,并与偏最小二乘回归模型进行了对比。上述研究多是利用全谱段的光谱数据进行土壤属性的预测建模。土壤高光谱曲线包含波段较多,且波段间有不同程度的相关性,存在一定的信息冗余。

提取土壤光谱特征指数,一定程度上可以减少土壤属性光谱建模输入变量,提高建模效率,是土壤属性光谱建模的另一种思路。构建或计算光谱特征指数的方法有很多,如两两波段组合的代数运算(如比值、差值等)、弓曲率等计算相对较简单、方便。此外,还有基于光谱吸收特征的计算稍微较复杂,如吸收谷深度,吸收带宽、面积等。张娟娟等[8]利用光谱反射率通过波段间代数运算提取了比值指数(Ratio Index,RI)、差值指数(Difference Index,DI)和归一化差值指数(Normalized Difference Index,NDI),选出与有机质相关系数最高的特征指数建立SOM估测模型,表明利用光谱特征指数预测SOM含量精度较高。贺军亮等[23]通过计算有机质诊断指数建立了SOM线性回归预测模型,预测结果较好。卢艳丽等[24]利用1 280 nm处反射峰高度较好地预测了东北地区主要土壤类型有机质含量。彭杰等[25]利用吸收峰总面积、最大吸收深度、面积归一化最大吸收深度等光谱特征,建立了新疆地区土壤盐分含量的光谱预测模型。

苏中平原系江苏省长江和苏北灌溉总渠之间的广阔平原,属江淮平原的一部分,主要包括泰州、扬州、南通和淮安等大部分市县。该区地处北亚热带,水热条件充裕、土壤肥沃,是江苏省主要的粮食生产基地之一。本研究以苏中平原的典型土壤为研究对象,进行可见光-近红外高光谱采集和有机质测定,分析土壤光谱特征,计算弓曲差、光谱特征指数等建立SOM预测模型并进行分析,为快速有效测定苏中平原SOM含量提供技术支持。

1 材料与方法 1.1 研究区概况

研究区位于江苏省中部平原(119°53′37″~120°14′4″ E,32°20′17″~32°44′50″ N),主要包括姜堰市和兴化市南部(图 1),面积约为1 350 km2。研究区属温暖带北亚热带季风气候,年平均气温14.5 ℃,降水量991.7 mm,海拔5~10 m。成土母质主要为泻湖相沉积物和长江冲积物,分布在研究区北部和南部,主要土壤类型为水稻土和潮土。研究区土地利用以水田为主,占总面积的81.25%(2009年),轮作制度主要为稻-油(麦)轮作。

图 1 研究区位置(左)和样点分布图(右) Fig. 1 Location(left)and distribution of sampling points(right)in the studied area
1.2 土壤样品采集与测试

土壤样品采集于2009年11月,共采集表层(0~20 cm)土壤样品178个,其中水稻土111个,潮土67个。在田块的中心以10~20 m为半径(S形)取8~12个土壤样品,然后将采集的土壤样品混合在一起并用四分法留下1 kg,同时记录田块中心的坐标信息。

样品在室内经自然风干后用木棒碾磨,剔除砂砾及植物残体,然后过10目和60目筛,前者用于光谱测试,后者用于有机质测试。采用重铬酸钾(K2Cr2O7)氧化滴定法测定有机质含量。

运用ASD FieldSpec 3地物高光谱仪测量土壤样品的反射光谱数据,其波长范围为350~2 500 nm,重采样间隔为1 nm,输出波段数为2 151。操作过程在黑暗环境的实验室进行,光源使用仪器配套的两个1 000 W的卤素灯,光纤探头视场角为5°,光源照射方向与垂直方向夹角30°,探头到土样表面距离30 cm,取适量过10目筛的土壤样品倒入盛样皿中,用玻璃稍稍压实,刮平整。每个样品旋转4次,每个角度扫描10次,共40次,取平均值作为样本光谱。详细的土壤光谱测试条件描述具体参见文献[8]。

1.3 土壤光谱特征指数构建

本研究主要采用以下光谱特征指数。

(1)弓曲差(C)。通过选取光谱曲线中550、600和650 nm处的光谱反射率计算,C值与SOM含量存在负相关,同时在550~650 nm范围光谱曲线表现出平直状态[26]。公式如下[26-27]

$C = {R_{{\rm{600}}}} - ({R_{{\rm{550}}}} - {R_{{\rm{650}}}})/2$ (1)

(2)土壤光谱指数。构建的土壤光谱指数有:DI、RI和NDI等[11]

$DI = {R_i} - {R_j}$ (2)
$RI = {R_i}/{R_j}$ (3)
$NDI = ({R_i} - {R_j})/({R_i} + {R_j})$ (4)

式中,R500R600R650代表500 nm、600 nm和650 nm波段上的光谱反射率;RiRj分别代表ij波段的土壤光谱反射率。

1.4 建模与精度评价

为了保证一定的建模样本数量得到稳定的预测模型,本研究使用Kennard-Stone(KS)方法划分建模集和预测集,该方法普遍用于光谱数据的分析中,详细计算过程参见文献[18]。按照建模与验证样本的3︰1数量关系,利用该方法选取133个建模样本和45个验证样本。

采用交叉验证和独立验证的方式评价预测精度,选取决定系数(Determination Coefficients,R2)、均方根误差(Root Mean of Squared Error,RMSE)和相对分析误差(Relative Percent Deviation,RPD)作为评价指标。R2的值越接近于1,RMSE越小,说明模型的稳定性和精度较高。当RPD < 1.4时模型的估算能力差;当1.4≤RPD < 2时模型估测精度有所提高,能对样本进行粗略估测;当RPD≥2时表明模型具有很好的预测能力[28]。计算公式如下:

${R^2}{\rm{ = }}1{\rm{ - }}{\sum\nolimits_{i = 1}^n {({y_i} - {{\hat y}_i})} ^2}/{\sum\nolimits_{i = 1}^n {({y_i} - \bar y)} ^2}$ (5)
$RMSE{\rm{ = }}\sqrt {\frac{1}{n}{{\sum\nolimits_{i = 1}^n {({y_i} - {{\hat y}_i})} }^2}} $ (6)
$RPD{\rm{ = }}SD/RMSE$ (7)

式中,${y_i}$${\hat y_i}$表示样本i的实测值和预测值,$\bar y$表示平均值,n为样本数,SD为预测样本的标准差。

1.5 数据处理与分析

本研究对原始光谱反射率进行光谱倒数对数变换(Inverse-log Reflectance,Log(1/R))和去包络线变换(Continuum Removal,CR),识别土壤属性与光谱反射率的敏感关系。倒数对数变换主要目的是扩大可见光区的光谱差异,避免背景噪音的干扰;去包络线变换可以有效提取土壤的光谱吸收特征,更加直观地观察土壤的光谱特征[2529]

基于原始和变换后的土壤光谱曲线,本研究首先综合分析不同SOM含量梯度和不同土壤类型的光谱特征、以及SOM含量与高光谱信息的相关性。其次,计算弓曲差、DI、RI和NDI等特征指数及其与SOM的相关系数。最后利用筛选后的光谱特征指数,基于多元线性回归进行SOM含量建模,并进行精度对比分析。

Log(1/R)变换在The Unscrambler 9.7软件中完成,CR变换在ENVI 4.8中进行。KS方法,DI、RI和NDI的计算以及相关系数等势图,在MATLAB R2012a软件中完成。数据统计分析及绘图分别在SPSS 22.0和OriginPro 9.0中完成。多元回归建模及验证在The Unscrambler 9.7软件中进行。

2 结果与讨论 2.1 土壤光谱曲线特征

研究区SOM含量总体较高且变化范围较大,平均值为28.54±7.80 g·kg-1,介于11.85~58.22 g·kg-1;变异系数为27.33%,属于中等强度变异。其中水稻土的SOM含量平均为32.13±7.21 g·kg-1,潮土的SOM含量平均为22.60±4.34 g·kg-1。水稻土的SOM含量变异较潮土稍大,其变异系数为22.44%,潮土为19.20%。

按照SOM含量 < 20 g·kg-1、20~30 g·kg-1、30~40 g·kg-1和 > 40 g·kg-1区间,计算各区间内的土壤光谱反射率的平均值,得到研究区SOM所有区间对应平均光谱反射率曲线(图 2)。随着波长的增加,在可见光波段土壤光谱反射率值迅速赠大,光谱曲线呈现较陡的状态;在近红外波段内土壤光谱反射率较高,但是反射率增加较平缓(图 2a)。在1 400 nm、1 900 nm和2 200 nm处可以看出光谱反射率值出现不同幅度的升降。在原始光谱曲线中出现吸收特征并不明显,经去包络线处理后的光谱吸收特征明显增强,吸收谷深度加深(图 2b),除了1 400 nm、1 900 nm和2 200 nm附近吸收谷更加突出外,在480 nm、660 nm、900 nm附近也出现了较明显的吸收特征。在560~660 nm总体上随着SOM含量的增加吸收谷深度加深,吸收谷的面积增大;在480 nm、900 nm和1 650~1 850 nm处趋势相反,总体上随着SOM含量增加,吸收谷变浅。可见通过CR变换后,土壤光谱曲线的吸收特征更加突出,不同SOM含量光谱曲线的差异得到增强。在近红外波段,主要受到NH,CH和CO等基团的分子振动的倍频与合频吸收影响[30]。1 400 nm附近的吸收谷主要是受到土壤表面吸附水、黏土矿物O-H晶格结构水等吸收引起,2 200 nm附近主要存在Al-OH黏土矿物(高岭石)的吸收带[519]。蒙脱石类矿物在1 900 nm和2 300 cm附近有较强的吸收带。

图 2 不同SOM含量的土壤反射率均值光谱曲线和去包络线的光谱曲线 Fig. 2 Spectral curves of mean soil reflectance and continuum removed spectral curves relative to SOM content in the soil

图 3为SOM含量与不同光谱变换反射率的相关系数曲线。SOM与原始光谱在全波段范围上均呈极显著负相关(P < 0.01),与Log(1/R)光谱呈极显著正相关(P < 0.01),相关系数绝对值均在0.4以上。在400~900 nm波段相关性远高于其他波段,相关系数绝对值均在0.6以上,最高接近0.7(图 3ab)。SOM与CR光谱,在可见光390~750 nm、近红外800~900 nm、短波红外1 450~1 700 nm和2 200~2 400 nm处,呈现不同程度的正或负相关,相关程度总体上小于原始光谱和Log(1/R)光谱(图 3c)。研究区SOM含量反演的敏感波段主要位于为400~900 nm,1 450~1 700 nm和2 200~2 400 nm处,这与众多研究结果基本一致[8111520]。徐彬彬等[31]比较了去除有机质前后的土壤光谱反射曲线的差异,发现对有机质响应最大的区域主要在600~800 nm。以上分析结果表明,采用原始和Log(1/R)光谱进行研究区SOM含量反演时,敏感波段主要位于可见光和近红外波段范围;若选用CR光谱数据,敏感波段范围选择较广,可见光、近红外和短波红外波段范围均有覆盖。

图 3 土壤光谱数据与SOM含量的相关系数分布 Fig. 3 Distribution of correlation coefficients between soil spectral data and soil organic matter content

分别选取水稻土和潮土中SOM含量最小值、25%分位数、中位数、75%分位数和最大值所对应的光谱曲线进行光谱特征分析(图 4)。两种土壤类型的原始光谱曲线总体趋势基本一致,光谱曲线在可见光范围内快速上升,在近红外波段范围内上升缓慢且较为平稳。总体上,随着SOM含量的增加,两种土壤的光谱曲线逐渐变低平,光谱反射率值减小,反映出二者间的负相关性。潮土在可见光范围光谱曲线的斜率较大,水稻土的光谱斜率相对较小。腐殖质是土壤有机质的主体,腐殖质中胡敏酸的反射能力较弱,富里酸在黄红光部分反射率开始增强,徐彬彬等[31]研究表明不同地带的土壤尽管其有机质含量相同,但由于胡敏酸和富里酸的比值不同,也会使土壤有不同的光谱反射特性。这可能也是两种土壤类型光谱特征差异的一个主要原因。

图 4 不同土壤类型的光谱曲线 Fig. 4 Spectral curve relative to soil type
2.2 基于弓曲差的SOM建模

图 5为研究区原始光谱在600 nm波段的弓曲差与SOM关系。随着SOM含量的增加,在550~650 nm范围内原始光谱曲线逐渐趋于平直状态,弓曲差值逐渐变小。SOM与原始光谱的弓曲差呈极显著负相关,相关系数为-0.66(n = 178,P < 0.01)(图 6)。这与徐彬彬和戴昌达[26]、Zheng等[27]的研究结果一致。计算Log(1/R)光谱和CR光谱在600 nm波段的弓曲差,二者分别与SOM呈极显著相关,相关系数分别为0.61和-0.33(n = 178,P < 0.01)。

图 5 SOM与弓曲差相关波段的关系 Fig. 5 Relationship between SOM and deviation of arch related bands

图 6 SOM与弓曲差的散点图 Fig. 6 Scatter plot of SOM and deviation of arch

利用三种光谱数据的弓曲差建立研究区SOM含量的线性回归模型,结果见表 1。基于原始光谱和Log(1/R)光谱的弓曲差的回归模型稍好,建模集的R2分别为0.45和0.38,验证集的R2分别为0.37和0.36;两个模型RPD分别为1.28和1.26,模型的预测能力较差。基于CR光谱的弓曲差的建模结果最差,其建模集和预测集的R2均不足0.1,RPD仅为1.06,模型预测效果较差。以上结果表明,单独利用弓曲差建立的SOM回归模型,估测能力有限,最高仅能解释SOM变异的37%。

表 1 基于弓曲差的SOM线性回归建模结果 Table 1 Modeling via SOM linear regression based on DOA

Zheng等[27]研究发现江苏滨海盐土SOM含量与弓曲差呈极显著负相关,相关系数为-0.74(n= 142,P < 0.01),利用4种模型预测了SOM含量,模型的R2介于0.38~0.51,RMSE介于4.12~4.62 g·kg-1。高志海等[32]利用600 nm和800 nm波段的两个弓曲差预测了甘肃省荒漠地区SOM含量,600 nm弓曲的模型精度较高,验证集的R2为0.84,RMSE为4.57 g·kg-1n=53)。高志海等[32]认为可能由于SOM含量增加光谱逐渐趋于饱和的原因,当SOM含量较低时,预测值均高于实测值,而SOM含量较高时,预测值基本接近实测值。本研究利用弓曲差建立的SOM预测模型的精度(除CR光谱)与Zheng等[27]研究相似,验证集的R2为0.37和0.38,RMSE为4.89 g·kg-1和4.95 g·kg-1。上述分析表明,利用原始和Log(1/R)光谱在600 nm波段的弓曲差的SOM预测模型解释能力有限。

2.3 基于土壤光谱指数的SOM建模

图 7为研究区SOM含量与光谱指数的相关系数等势图,不同数值表示两个波段组合计算的DI、RI或NDI与SOM的相关系数绝对值。相关系数等势图清晰地展示出,相关系数较高的特征指数构成波段的分布范围。

图 7 SOM含量与光谱特征指数的相关系数等势图 Fig. 7 A contour map of the relationships between SOM content and spectral feature indices

在原始光谱数据中,SOM含量与DI相关性较高的波段组合主要分布在400~800 nm和2 180~2 220 nm处,相关系数绝对值均在0.6以上(图 7a)。相关性最高的3个波段组合为2 215 nm和2 202 nm、2 219 nm和2 198 nm、2 217 nm和2 199 nm波段,相关系数分别为0.73、0.73和0.72。SOM含量与RI和NDI的高相关性的波段组合范围一致且较宽,在1 000~2 400 nm之间,最大的3个相关系数值相同,均为0.68、0.68和0.67,构成RI和NDI的波段组合也相同,分别为2 202 nm和2 215 nm、2 203 nm和2 214 nm、2 203 nm和2 215 nm(图 7b图 7c)。

在Log(1/R)光谱的相关性等势图中(图 7d ~ 图 7f),SOM含量与DI的相关性较高的波段组合主要分布在1 100~2 400 nm处,相关系数绝对值均在0.5以上。相关性最高的3个波段组合为2 202 nm和2 215 nm、2 203 nm和2 214 nm、2 203 nm和2 215 nm,相关系数分别为0.68、0.68和0.67。RI和NDI的相关系数等势图分布相似,相关性较高的波段组合范围分布较窄,在2 180~2 220 nm处。相关性最高的3个波段组合均为2 215 nm和2 202 nm、2 219 nm和2 198 nm、2 199 nm和2 217 nm,相关系数分别为0.73、0.72和0.71。在CR光谱的相关性等势图中,相关性较高的波段组合范围较窄,且分布较散,DI、RI和NDI与SOM的相关性等势图分布一致(图 7g~图 7i)。3种光谱指数与SOM的相关性最高的波段组合均为2 223 nm和2 182 nm、2 223 nm和2 183 nm、2 171 nm和1 877 nm,相关系数分别为0.71、0.70和0.70。

图 3a显示,原始光谱在2 198 nm、2 199 nm、2 202 nm、2 203 nm、2 214 nm、2 215 nm、2 217 nm和2 219 nm处反射率与SOM的相关系数介于-0.44~-0.43之间,经计算DI、RI、NDI后与SOM的相关性显著提高,相关系数绝对值在0.67以上。Log(1/R)光谱在2 202 nm、2 203 nm、2 214 nm和2 215 nm处经计算DI、RI、NDI后与SOM的相关性显著提高;CR光谱在1 877 nm、2 171 nm、2 182 nm、2 183 nm和2 223 nm处计算的光谱指数与SOM的相关性也显著提高。这表明不同波段的光谱反射率经过适当的特征指数计算后,增强了光谱数据与SOM的相关性,一定程度上提高了建模预测的精度。

在3种光谱指数中,分别选择与SOM相关性最高的前3个指数,进行研究区SOM多元线性回归建模及验证,结果见表 2。在原始光谱中,由于RI和NDI的波段组合及与SOM的相关系数均相同,其建模结果也相同;在Log(1/R)光谱中,选择的RI和NDI的波段组合也相同,其建模结果相同。基于原始、Log(1/R)和CR光谱指数模型中,除了原始光谱的RI和NDI、Log(1/R)光谱的DI预测模型精度较低外,其余的SOM预测模型精度均相对较高,建模集的R2均在0.53以上,RMSE在5.5 g·kg-1以下,验证集的R2均在0.65以上,RMSE较低均不超过4 g·kg-1。基于CR光谱指数的SOM预测模型的建模集和验证集的R2较接近,表明该模型的泛化能力较高。总体上,基于3种光谱数据和3种光谱指数建立的9个SOM预测模型中,RPD范围介于1.4~2,表明建立的回归模型能够粗略估算研究区的SOM含量。9个预测模型中,基于原始光谱的DI回归模型的预测能力最优,其RPD为1.98;CR光谱中基于DI的SOM回归模型的RPD虽然稍低,但模型具有较高的泛化能力。

表 2 基于光谱指数的SOM建模结果 Table 2 SOM modeling based on spectral indices

表 3为3种光谱数据的DI、RI、NDI分别结合弓曲差C,进行SOM的回归建模结果。结果表明,由于利用了较多的光谱特征指数,研究区的SOM建模精度总体有不同程度的提升,建模集的R2和RMSE分别介于0.56~0.64和4.98~5.50 g·kg-1,验证集的R2和RMSE介于0.67~0.73和3.21~3.51 g·kg-1,较表 2的建模精度有较大提升。9种SOM模型的RPD均在1.78以上,其预测能力较表 2的SOM模型有不同程度的提升。基于CR光谱指数和弓曲差的SOM预测模型的泛化能力较高。

表 3 基于光谱指数和弓曲差的SOM建模结果 Table 3 The results of modeling SOM using spectral index and deviation of arch

表 2表 3的建模结果中,分别选择R、Log(1/R)和CR的光谱数据中最优的SOM预测模型,绘制独立验证结果图(图 8)。可以看出,回归模型的预测值与实测值之间均存在不同程度的偏离,在SOM含量低于20 g·kg-1处,样本存在一定程度的高估现象;SOM含量在20 g·kg-1以上实测值和预测值明显较接近,这与高志海等[32]研究结果一致。总体上,基于Log(1/R)光谱的RI结合弓曲差的SOM预测模型在所有模型中相对最优,其预测值和实测值较均匀且集中分布在1︰1线附近(图 8e)。

图 8 SOM含量的实测值与预测值比较 Fig. 8 Comparison between measured and predicted SOM contents

张娟娟等[8]研究认为光谱指数构成形式以DI最好,其次为RI和NDI。本文的结果显示对于原始和CR光谱,DI的建模效果较好;而对于Log(1/R)光谱,RI和NDI的建模效果较好,与张娟娟等[8]结论有一定程度上的相似。贺军亮等[23]采用DI的计算思路,利用507~516 nm反射率均值对450~750 nm反射率均值进行比值处理后获得有机质诊断指数,建立SOM含量的预测模型精度较高,R2在0.65以上,但是其样本较少(建模和验证样本分别为19个和8个)需要进一步研究。卢艳丽等[24]利用570~590 nm波段的一阶导数光谱和1 280 nm处反射峰高度较好地预测东北地区主要土壤类型有机质含量,但是其建模和验证的R2差别较大,训练集和验证集的R2分别为0.41~0.47和0.72~0.75。沈掌泉等[33]认为光谱数据经过波段算术组合处理后,能降低模型建立过程中产生过配的风险,使模型能包括更多的成分和信息,其研究表明通过RI或NDI处理后的光谱数据可以提高SOM预测的精度。本研究利用光谱特征指数建立的SOM预测模型建模和验证的R2均在0.6以上且差异较小,能够解释研究区SOM变异的65%以上,精度较高模型相对稳定。

本研究依据SOM与光谱指数相关性排序进行筛选建模,选择的光谱组合均在短波红外2 200 nm波段附近,但实际上研究区的SOM含量与其他谱段范围内计算的光谱指数的相关性也较高。如原始光谱数据,在400~800 nm波段范围计算的DI与SOM相关系数绝对值均在0.6以上(图 7a)。在可见光、近红外和短波红外波段范围,土壤的光谱会反映不同的土壤组分信息,因此在后期的研究中尝试在不同波段范围内分别按照土壤属性与光谱指数的相关性等级,选取光谱指数进行预测建模。此外,本研究选取的光谱特征形式单一,在后期的研究中需尝试进一步构建或计算多种光谱特征指数,比较不同类型的光谱特征指数的建模效果。

3 结论

(1)江苏省中部平原,不同SOM含量和不同土壤类型的光谱曲线特征在全波段范围内变化趋势基本一致。去除包络线处理后,土壤光谱曲线特征差异明显,在480 nm、660 nm、900 nm和1 800 nm附近出现了明显吸收谷。SOM与原始光谱呈极显著负相关,与Log(1/R)光谱呈极显著正相关,且在400~900 nm波段相关性较强。SOM与CR光谱,在可见光390~750 nm、近红外800~900 nm、短波红外1 450~1 700 nm和2 200~2 400 nm处,呈现不同程度的正或负相关。(2)原始光谱和Log(1/R)光谱在600 nm波段的弓曲差与SOM含量呈极显著相关,能够解释研究区36%的SOM变异,模型的RPD分别为1.28和1.26,模型预测效果差。(3)原始光谱、Log(1/R)光谱和CR光谱等不同波段的反射率经过DI、RI和NDI特征指数计算后,增强了光谱数据与SOM的相关性,一定程度上能提高建模预测的精度。选择不同光谱数据的DI、RI和NDI等指数建立的SOM模型能够解释53%~69%的SOM变异。将DI、RI和NDI等指数分别结合弓曲差,建立的SOM预测模型效果最优,能够解释研究区67%~73%的SOM变异。其中Log(1/R)光谱的RI和NDI结合弓曲差的SOM预测模型精度最高。

参考文献
[1]
Allen R M, Laird D A. Quantitative prediction of biochar soil amendments by near-infrared reflectance spectroscopy[J]. Soil Science Society of America Journal, 2013, 77(5): 1784-1794. DOI:10.2136/sssaj2013.03.0118 (0)
[2]
Shi Z, Ji W, Viscarra Rossel R A, et al. Prediction of soil organic matter using a spatially constrained local partial least squares regression and the Chinese vis-NIR spectral library[J]. European Journal of Soil Science, 2015, 66(4): 679-687. DOI:10.1111/ejss.12272 (0)
[3]
Bartholomeus H M, Schaepman M E, Kooistra L, et al. Spectral reflectance based indices for soil organic carbon quantification[J]. Geoderma, 2008, 145(1/2): 28-36. (0)
[4]
Demattê J A M, Campos R C, Alves M C, et al. Visible-NIR reflectance:A new approach on soil evaluation[J]. Geoderma, 2004, 121(1/2): 95-112. (0)
[5]
Shi Z, Wang Q L, Peng J, et al. Development of a national VNIR soil-spectral library for soil classification and prediction of organic matter concentrations (In Chinese)[J]. Science China:Earth Science, 2014, 44(5): 978-988. [史舟, 王乾龙, 彭杰, 等. 中国主要土壤高光谱反射特性分类与有机质光谱预测模型[J]. 中国科学:地球科学, 2014, 44(5): 978-988.] (0)
[6]
Shen R P, Ding G X, Wei G S, et al. Retrieval of soil organic matter content from hyper-spectrum based on ANN (In Chinese)[J]. Acta Pedologica Sinica, 2009, 46(3): 391-397. [沈润平, 丁国香, 魏国栓, 等. 基于人工神经网络的土壤有机质含量高光谱反演[J]. 土壤学报, 2009, 46(3): 391-397.] (0)
[7]
Ye Q, Jiang X Q, Li X C, et al. Comparison on inversion model of soil organic matter content based on hyperspectral data (In Chinese)[J]. Transactions of the Chinese Society of Agricultural Machinery, 2017, 48(3): 164-172. [叶勤, 姜雪芹, 李西灿, 等. 基于高光谱数据的土壤有机质含量反演模型比较[J]. 农业机械学报, 2017, 48(3): 164-172.] (0)
[8]
Zhang J J, Tian Y C, Zhu Y, et al. Spectral characteristics and estimation of organic matter contents of different soil types (In Chinese)[J]. Scientia Agricultura Sinica, 2009, 42(9): 3154-3163. [张娟娟, 田永超, 朱艳, 等. 不同类型土壤的光谱特征及其有机质含量预测[J]. 中国农业科学, 2009, 42(9): 3154-3163.] (0)
[9]
Guo D D, Huang S M, Zhang S Q, et al. Comparative analysis of various hyperspectral prediction models of fluvo-aquic soil organic matter (In Chinese)[J]. Transactions of the Chinese Society of Agricultural Engineering, 2014, 30(21): 192-200. [郭斗斗, 黄绍敏, 张水清, 等. 多种潮土有机质高光谱预测模型的对比分析[J]. 农业工程学报, 2014, 30(21): 192-200.] (0)
[10]
Zhao X M, Yang M H. Hyper-spectral characteristics of major types of soils in red soil region of Jiangxi Province, China (In Chinese)[J]. Acta Pedologica Sinica, 2018, 55(1): 31-42. [赵小敏, 杨梅花. 江西省红壤地区主要土壤类型的高光谱特性研究[J]. 土壤学报, 2018, 55(1): 31-42.] (0)
[11]
Peng J, Zhou Q, Zhang Y Z, et al. Effect of soil organic matter on spectral characteristics of soil (In Chinese)[J]. Acta Pedologica Sinica, 2013, 50(3): 517-524. [彭杰, 周清, 张杨珠, 等. 有机质对土壤光谱特性的影响研究[J]. 土壤学报, 2013, 50(3): 517-524.] (0)
[12]
Wu D W, Zhang G L. Effects of parent materials and land use types on inversion models by using soil spectral data (In Chinese)[J]. Soils, 2016, 48(1): 173-179. [邬登巍, 张甘霖. 母质与土地利用类型对土壤光谱反演模型的影响[J]. 土壤, 2016, 48(1): 173-179.] (0)
[13]
Nawar S, Buddenbaum H, Hill J, et al. Estimating the soil clay content and organic matter by means of different calibration methods of vis-NIR diffuse reflectance spectroscopy[J]. Soil and Tillage Research, 2016, 155: 510-522. DOI:10.1016/j.still.2015.07.021 (0)
[14]
Yu L, Hong Y S, Geng L, et al. Hyperspectral estimation of soil organic matter content based on partial least squares regression (In Chinese)[J]. Transactions of the Chinese Society of Agricultural Engineering, 2015, 31(14): 103-109. [于雷, 洪永胜, 耿雷, 等. 基于偏最小二乘回归的土壤有机质含量高光谱估算[J]. 农业工程学报, 2015, 31(14): 103-109.] (0)
[15]
Wang M, Xie X L, Zhou R, et al. Determination of soil organic matter in red soils using VIS-NIR diffuse reflectance spectroscopy and selection of optimal spectral bands (In Chinese)[J]. Acta Pedologica Sinica, 2011, 48(5): 1083-1089. [王淼, 解宪丽, 周睿, 等. 基于可见光-近红外漫反射光谱的红壤有机质预测及其最优波段选择[J]. 土壤学报, 2011, 48(5): 1083-1089.] (0)
[16]
Tian Y C, Zhang J J, Yao X, et al. Quantitative modeling method of soil organic matter content based on near-infrared photoacoustic spectroscopy (In Chinese)[J]. Transactions of the Chinese Society of Agricultural Engineering, 2012, 28(1): 145-152. [田永超, 张娟娟, 姚霞, 等. 基于近红外光声光谱的土壤有机质含量定量建模方法[J]. 农业工程学报, 2012, 28(1): 145-152.] (0)
[17]
Wang Y D, Zhao M Q, Liu P F, et al. Prediction of organic matter and total nitrogen contents in tobacco-growing soil based on hyper-spectral analysis (In Chinese)[J]. Acta Tabacaria Sinica, 2016, 22(3): 44-51. [王一丁, 赵铭钦, 刘鹏飞, 等. 基于高光谱分析的植烟土壤有机质和全氮含量预测研究[J]. 中国烟草学报, 2016, 22(3): 44-51.] (0)
[18]
Liu W, Zhao Z, Yuan H F, et al. An optimal selection method of samples of calibration set and validation set for spectral multivariate analysis (In Chinese)[J]. Spectroscopy and Spectral Analysis, 2014, 34(4): 947-951. [刘伟, 赵众, 袁洪福, 等. 光谱多元分析校正集和验证集样本分布优选方法研究[J]. 光谱学与光谱分析, 2014, 34(4): 947-951.] (0)
[19]
Viscarra Rossel R A, Behrens T. Using data mining to model and interpret soil diffuse reflectance spectra[J]. Geoderma, 2010, 158(1/2): 46-54. (0)
[20]
Ji W J, Li X, Li C X, et al. Using different data mining algorithms to predict soil organic matter based on visible-near infrared spectroscopy (In Chinese)[J]. Spectroscopy and Spectral Analysis, 2012, 32(9): 2393-2398. [纪文君, 李曦, 李成学, 等. 基于全谱数据挖掘技术的土壤有机质高光谱预测建模研究[J]. 光谱学与光谱分析, 2012, 32(9): 2393-2398.] (0)
[21]
Luan F M, Zhang X L, Xiong H G, et al. Comparative analysis of soil organic matter content based on different hyperspectral inversion models (In Chinese)[J]. Spectroscopy and Spectral Analysis, 2013, 33(1): 196-200. [栾福明, 张小雷, 熊黑钢, 等. 基于不同模型的土壤有机质含量高光谱反演比较分析[J]. 光谱学与光谱分析, 2013, 33(1): 196-200.] (0)
[22]
Mouazen A M, Kuang B, de Baerdemaeker J, et al. Comparison among principal component, partial least squares and back propagation neural network analyses for accuracy of measurement of selected soil properties with visible and near infrared spectroscopy[J]. Geoderma, 2010, 158(1/2): 23-31. (0)
[23]
He J L, Jiang J J, Zhou S L, et al. The hyperspectral characteristics and retrieval of soil organic matter content (In Chinese)[J]. Scientia Agricultura Sinica, 2007, 40(3): 638-643. [贺军亮, 蒋建军, 周生路, 等. 土壤有机质含量的高光谱特性及其反演[J]. 中国农业科学, 2007, 40(3): 638-643.] (0)
[24]
Lu Y L, Bai Y L, Yang L P, et al. Prediction and validation of soil organic matter content based on hyperspectrum (In Chinese)[J]. Scientia Agricultura Sinica, 2007, 40(9): 1989-1995. [卢艳丽, 白由路, 杨俐苹, 等. 基于高光谱的土壤有机质含量预测模型的建立与评价[J]. 中国农业科学, 2007, 40(9): 1989-1995.] (0)
[25]
Peng J, Chi C M, Xiang H Y, et al. Inversion of soil salt content based on continuum-removal method (In Chinese)[J]. Acta Pedologica Sinica, 2014, 51(3): 459-469. [彭杰, 迟春明, 向红英, 等. 基于连续统去除法的土壤盐分含量反演研究[J]. 土壤学报, 2014, 51(3): 459-469.] (0)
[26]
Xu B B, Dai C D. Correlation analysis of soil spectral reflection characteristics and organic matter content in southern Xinjiang (In Chinese)[J]. Chinese Science Bulletin, 1980(6): 282-284. [徐彬彬, 戴昌达. 南疆土壤光谱反射特性与有机质含量的相关分析[J]. 科学通报, 1980(6): 282-284.] (0)
[27]
Zheng G H, Ryu D, Jiao C X, et al. Estimation of organic matter content in coastal soil using reflectance spectroscopy[J]. Pedosphere, 2016, 26(1): 130-136. DOI:10.1016/S1002-0160(15)60029-7 (0)
[28]
Chang C W, Laird D A. Near-infrared reflectance spectroscopic analysis of soil c and N[J]. Soil Science, 2002, 167(2): 110-116. DOI:10.1097/00010694-200202000-00003 (0)
[29]
Bai J W, Zhao Y C, Zhang B, et al. Study on the classification methods of the hyperspectral image based on the continuum removed (In Chinese)[J]. Computer Engineering and Applications, 2003, 38(13): 88-90. [白继伟, 赵永超, 张兵, 等. 基于包络线消除的高光谱图像分类方法研究[J]. 计算机工程与应用, 2003, 38(13): 88-90.] (0)
[30]
Stenberg B, Viscarra Rossel R A, Mouazen A M, et al. Visible and near infrared spectroscopy in soil science[J]. Advances in Agronomy, 2010, 107: 163-215. DOI:10.1016/S0065-2113(10)07005-7 (0)
[31]
Xu B B, Ji G S, Zhu Y H. A preliminary research of geographic regionalization of China land background and spectral reflectance characteristics of soil (In Chinese)[J]. Remote Sensing of Environment, 1991, 6(2): 142-151. [徐彬彬, 季耿善, 朱永豪. 中国陆地背景和土壤光谱反射特性的地理分区的初步研究[J]. 环境遥感, 1991, 6(2): 142-151.] (0)
[32]
Gao Z H, Bai L N, Wang B Y, et al. Estimation of soil organic matter content in desertified lands using measured soil spectral data (In Chinese)[J]. Scientia Silvae Sinicae, 2011, 47(6): 9-16. [高志海, 白黎娜, 王琫瑜, 等. 荒漠化土地土壤有机质含量的实测光谱估测[J]. 林业科学, 2011, 47(6): 9-16.] (0)
[33]
Shen Z Q, Wang K, Huang X W. Estimating the content of soil carbon by using near-infrared spectra (In Chinese)[J]. Journal of Infrared and Millimeter Waves, 2010, 29(1): 32-37. [沈掌泉, 王珂, Xuewen Huang. 用近红外光谱预测土壤碳含量的研究[J]. 红外与毫米波学报, 2010, 29(1): 32-37.] (0)