检索项 检索词
  土壤学报  2021, Vol. 58 Issue (3): 755-766  DOI: 10.11766/trxb201912170507
0

引用本文  

章明清, 李娟, 张立成, 等. 三元肥料效应模型的整合与优化建模策略. 土壤学报, 2021, 58(3): 755-766.
ZHANG Mingqing, LI Juan, ZHANG Licheng, et al. Integration and Optimization Modeling Strategy for Ternary Fertilizer Response Model. Acta Pedologica Sinica, 2021, 58(3): 755-766.

基金项目

国家自然科学基金项目(31572203)、福建省公益科研专项(2018R1022-3)和福建省农业科学院科技创新团队项目(STIT2017-1-9)资助

作者简介

章明清(1963-), 男, 博士, 研究员, 主要从事作物施肥原理与技术以及施肥与环境领域研究。E-mail: zhangmq2001@163.com
三元肥料效应模型的整合与优化建模策略
章明清1, 李娟1, 张立成1, 姚宝全2, 张华2    
1. 福建省农业科学院土壤肥料研究所, 福州 350013;
2. 福建省农田建设与土壤肥料技术推广站, 福州 350003
摘要:针对当前作物肥效模型建模成功率普遍偏低的问题,探讨了提高建模成功率的优化建模策略。在分析整合三元非结构肥效模型非线性最小二乘(NLS)和三元二次多项式肥效模型普通最小二乘(OLS)、主成分回归(PCR)和可行广义最小二乘回归(FGLS)四种建模法的适用性基础上,根据水稻和露地蔬菜的1 122个氮磷钾田间肥效试验结果,探讨三元肥效模型的综合应用方法。结果表明,三元肥效模型不同函数式及其建模法的适用性有明显差别。三元二次多项式肥效模型OLS建模法的典型式比例平均仅有19.8%,克服多重共线性危害的PCR建模法和克服异方差危害的FGLS建模法均有利于提高典型式比例,而同时克服了模型设定偏误和多重共线性危害的非结构肥效模型及其NLS建模法的典型式比例则提高至41.4%。根据不同模型及其建模法的适用性,提出三元肥效模型四步建模法,结果使典型式的比例进一步提高至57.5%,且在双季稻、单季稻和露地蔬菜中的相关比例差异很小。因此,四步建模法是大幅度提高三元肥效模型建模成功率的有效技术方法。
关键词非结构肥效模型    建模    非线性最小二乘(NLS)    普通最小二乘(OLS)    主成分回归(PCR)    可行广义最小二乘回归(FGLS)    
Integration and Optimization Modeling Strategy for Ternary Fertilizer Response Model
ZHANG Mingqing1, LI Juan1, ZHANG Licheng1, YAO Baoquan2, ZHANG Hua2    
1. Soil and Fertilizer Institute, Fujian Academy of Agricultural Sciences, Fuzhou 350013, China;
2. Fujian Cropland Construction and Soil and Fertilizer Station, Fuzhou 350003, China
Abstract: 【Objective】To tackle the present problem of fertilizer response modeling being generally low in success rate, this paper was devoted to discussions about strategies to optimize modeling and to improve its success rate.【Method】Based on collation and analysis of the following four modeling methods, i.e. nonlinear least-squares (NLS) modeling method for ternary non-structured fertilizer response model (TNFM), and ordinary least squares (OLS) method, principal component regression (PCR) method and feasible generalized least squares regression (FGLS) method for ternary quadratic polynomial fertilizer response mode l(TPFM), for adoptability and 1122 NPK fertilizer field experiments conducted in paddy fields and open vegetable gardens, an optimal modeling technology was designed and brought forth for comprehensive application of ternary fertilizer response models.【Result】Results show that ternary fertilizer response modeling using different functional equations and different modeling methods varied significantly in adoptability. The OLS modeling method for TPFM reached only 19.8% on average in proportion of typical models, while the PCR and FGLS modeling methods that had overcome the impacts of multicollinearity and heteroscedasticity, did up to 34.0% and 27.1%, respectively, and the NLS modeling method for TNFM after overcoming the obstacles of model specification bias and multicollinearity simultaneously rose further up to 41.4%, which improved the success rate of modeling. Using the classical OLS modeling method for TPFMs, the modeling had 28.7% failing the Duncan test, 30.1% having unreasonable model coefficient symbols, 15.2% missing maximum yield points and 6.1% extrapolating fertilization recommendation. However, the PCR modeling method reduced significantly the proportion having unreasonable coefficient symbols and increased that extrapolating fertilization recommendation, and the FGLS modeling method brought down to zero the proportion failing the Duncan test, but increased by a large margin in the proportion having unreasonable coefficient symbols. The ternary non-structural fertilizer response model significantly reduced the proportion having unreasonable coefficient symbols or missing maximum yield points, while increasing the proportion of non-typical models extrapolating fertilizer recommendation. Since agricultural production goes on in conditions of extreme complexity and diversity, it is certain that the curve or surved surface that reflects crops response to fertilization diversifies. Therefore, in the light of the applicability of the models and their modeling methods, a four-step modeling method is brought forth herewith for comprehensive application of the ternary fertilizer response model, which may raise the proportion of typical models up to 57.5%, and minimize the differences between double-cropping rice, single-cropping rice and vegetable crops in relevant proportion.【Conclusion】The four-step modeling method is an effective technical method to improve success rate of the modeling for ternary fertilizer response models.
Key words: Non-structural fertilizer response model    Modeling    Nonlinear least square (NLS)    Ordinary least squares (OLS)    Principal component regression (PCR)    Feasible generalized least squares (FGLS)    

二次多项式函数是当前常用的计量施肥理论模型[1-6],具有扎实的统计学理论基础和计算简便易行等优点。但在施肥实践中,二元、三元二次多项式肥效模型存在大量的非典型式[7-10],至今仍然困扰着计量施肥的研究和应用。近年的研究显示,二次多项式肥效模型及其他类似的多项式肥效模型存在设定偏误、多重共线性和异方差等问题[2],制约了普通最小二乘(OLS)的建模有效性。为此,针对二次多项式肥效模型设定偏误,作者构建了非结构肥效模型[11-12];针对三元二次多项式肥效模型的多重共线性和异方差危害,分别提出了主成分回归(PCR)[13]和可行广义最小二乘回归(FGLS)[14]的建模技术,显著提升了建模成功率。

迄今在三元肥效模型建模中,除了经典的二次多项式肥效模型OLS建模法外,还有PCR和FGLS建模法,以及三元非结构肥效模型及其非线性最小二乘(NLS)建模法等。那么,针对具体作物的肥效试验结果,该如何选择这些模型和建模法以达到最佳建模效果呢?作者在探讨PCR建模法时,曾发现“OLS建模法结合PCR建模法”的建模策略可使早稻的典型三元二次多项式肥效模型比例明显高于单独使用OLS回归或者PCR回归[13]的建模方法。本文在分析整合各三元肥效模型及其建模法的专业适用性基础上,提出优化建模策略,旨在尽可能提高典型式的比例和田间肥效试验结果的建模成功率。

1 材料与方法 1.1 水稻和露地蔬菜氮磷钾田间肥效试验资料的收集整理

近十年来,福建省完成了众多氮磷钾“3414”设计的田间肥效试验。在汇总这些试验资料时,仅收集整理土肥技术力量较强的或项目负责人有能力严格把关的相关县市完成的试验结果。在此基础上,根据“3414”试验设计中,氮、磷、钾各4个施肥水平及其试验产量分别绘图,若3个图形均大致呈现抛物线型关系,则保留该试验点资料,反之,则弃除该点试验资料。截止2017年底,共收集整理了水稻和露地蔬菜田间试验资料1 122个(表 1)。供试土壤包括灰泥田、黄泥田、灰沙田、赤沙土等福建主要耕作土壤类型(土属),供试土壤主要理化性状(表 2)采用常规方法测定[15],处理(6)的N2、P2、K2施肥量及其试验产量结果见表 2。相关作物田间试验设计、土样采集和测定等,请参照文献[16]。

表 1 福建水稻和露地蔬菜“3414”设计试验资料收集情况 Table 1 Data collection of the field experiments in paddy fields and open vegetable gardens following the "3414" designing in Fujian Province

表 2 水稻和蔬菜供试土壤主要理化性状及其处理(6)施肥量和产量 Table 2 Main physical and chemical properties of the tested soils, fertilizer application rates and yields of the 6th treatment
1.2 三元肥效模型的整合 1.2.1 非结构肥效模型

近年的水稻盆栽和田间肥效试验均表明,施用单位养分的稻谷增产量与施肥量之间的关系是典型的指数函数关系[11]。在此基础上,作者构建了一元非结构肥效模型[11]

$Y = A(s{\rm{0}} + X){e^{ - cX}}$ (1)

式中,Y为作物产量,kg·hm-2X为施肥量,kg·hm-2s0为土壤供肥当量,以N、P2O5、K2O养分形态计量,kg·hm-2c为施肥对产量的效应系数;A表示基础土壤对作物产量的生产能力。式(1)模型克服了一元二次多项式肥效模型的设定偏误以及一次项和二次项回归变量间高度线性相关的问题,具有更高的拟合精度。

在式(1)模型中,当施肥量和土壤供肥当量均为零时,作物产量必等于零。因此,根据植物营养元素功能不可相互替代的原理,三元非结构肥效模型可由三个一元非结构肥效模型相乘导出[12]

$Y = A(N{\rm{0}} + N){\rm{(}}{\rm{P}}{\rm{0}} + P{\rm{)(}}{\rm{K}}{\rm{0}} + K{\rm{)}}{e^{{ - {\rm{c}}{\rm{1}}N}{ - {\rm{c}}{\rm{2}}P}{ - {\rm{c}}{\rm{3}}K}}}$ (2)

式中,N0P0K0分别表示供试土壤的氮、磷、钾供肥当量,kg·hm-2c1c2c3分别表示施用氮、磷、钾养分的增产效应系数;NPK分别表示N、P2O5、K2O施肥量,kg·hm-2;其他代数符号的含义与式(1)相同。

数学理论分析表明,式(1)和式(2)模型在一定施肥量范围内存在一个作物产量峰值,该峰值对应的施肥量即为最高产量施肥量。因此,根据微积分原理,令作物产量Y分别对氮、磷、钾施肥量的导数等于零,得到最高产量施肥量的计算式;令作物产量Y分别对氮、磷、钾施肥量的导数等于农产品和肥料价格倒数比,得到经济产量施肥量的计算式[11-12]

式(1)和式(2)肥效模型均为非线性模型,而且不能直接进行线性化处理,模型参数估计需采用非线性最小二乘法[17]。假设非线性模型为Y=fXa),为求得参数a的估计值,可求解最小二乘问题:

${\rm{min }}Q(a) = \sum\limits_{i = 1}^n {{{{\rm{(}}{Y_i} - f{\rm{(}}Xi, a{\rm{))}}}^2}} $ (3)

其解$\hat a$作为参数a的估计值。非结构肥效模型的回归显著性检验与二次多项式肥效模型相似,但式(1)模型的回归自由度为2,式(2)模型的回归自由度为6。

1.2.2 多项式肥效模型

传统上,假设施用单位养分的增产量与施肥量之间满足线性关系,导出了一元二次多项式肥效模型[18]。根据数理统计学的线性加和性原理,进一步导出三元二次多项式肥效模型;有的学者根据研究需要,对二次多项式模型进行变形处理,形成了0.5次方和1.5次方多项式肥效模型[18]。显然,这种多项式肥效模型的导出过程,虽然具有统计学理论支持,但缺乏植物营养学专业理论依据。

事实上,根据数学上的泰勒级数展开式:${e^x} = {\rm{1}} + x + G{\rm{(}}x{\rm{)}}, x \in {\rm{(}} - \infty , + \infty {\rm{)}}$,其中,$G{\rm{(}}x{\rm{)}} = \frac{{{x^{\rm{2}}}}}{{{\rm{2!}}}} + \cdots + \frac{{{x^n}}}{{n{\rm{!}}}} + \cdots $,可将非结构肥效模型简化为二次多项式肥效模型。对式(1)模型,因c大多在10-3次方级[11],若仅取ex展开式的前两项,则式(1)模型可转化为:Y=As0+(A-As0cX-AcX2,显然该式即为一元二次多项式肥效模型。

同理,将三元非结构肥效模型的组成项e-cN-c2P-c3K转化为e-c1N×e-c2P×e-c3K。由于模型参数c1c2c3均在10-3[12],取泰勒级数展开式的前两项,并忽略c1c2c3的两两乘积项以及c1c2c3乘积项和NPK三因子交互项等高次项,再令b0 = AN0P0K0b1 = A(1-N0c1P0K0b2 = A(1-P0c2N0K0b3 = A(1-K0c3N0P0b4 = -c1P0K0b5 = -c2N0K0,b6 = -c3N0P0b7 =(1-N0c1)(1-P0c2K0b8 =(1-N0c1)(1-K0c3P0b9 =(1-P0c2)(1-K0c3N0。则式(2)模型可转化为:

$\begin{gathered} Y = b{\rm{0}} + b{\rm{1}}N + b{\rm{2}}P + b{\rm{3}}K + b{\rm{4}}{N^{\rm{2}}} + b{\rm{5}}{P^{\rm{2}}} \\ + b{\rm{6}}{K^{\rm{2}}} + b{\rm{7}}NP + b{\rm{8}}NK + b{\rm{9}}PK \\ \end{gathered} $ (4)

这就是当前常用的三元二次多项式肥效模型,是三元非结构肥效模型的简化式。但是,这种经过简化导出的二次多项式肥效模型,导致最高施肥量之前和最高施肥量之后的施肥效应是对称关系,不符合生产实际。同时,导致强烈的多重共线性和异方差危害,制约了经典最小二乘法回归建模的有效性。

上述肥效模型整合过程可归纳为图 1所示。显然,非结构肥效模型的导出过程具有较强的专业逻辑性,二次方、0.5和1.5次方多项式肥效模型导出过程的专业逻辑性较差。

注:NFRM表示非结构肥效模型,PFRM表示二次多项式肥效模型;NLS表示非线性最小二乘,OLS表示普通最小二乘;PCR表示主成分回归,FGLS表示可行广义最小二乘。下同。  Note: TNFM stands for ternary non-structural fertilizer response model; TPFM for ternary quadratic polynomial fertilizer response model. NLS stands for nonlinear least squares, and OLS for Ordinary least squares. PCR stands for principal component regression, and FGLS for feasible generalized least squares. The same below. 图 1 常用计量施肥理论模型的相互关系与整合 Fig. 1 Relationship and integration of general theoretical model for metrological fertilization
1.2.3 三元肥效模型的典型性判别

肥效模型典型性涉及到边际产量导数法推荐施肥的可靠性。由于农业生产条件的复杂性,根据田间肥效试验结果建立的肥效模型,方程效应曲线或曲面的形状多种多样[7]。在通过统计显著性检验的前提下,三元二次多项式肥效模型存在典型式和3种不同类型的非典型式[9]。若肥效模型同时满足:(1)一次项系数的代数符号为正数,二次项系数的代数符号为负数;(2)肥效模型存在全局最高产量点;(3)边际产量导数法得到的推荐施肥量均落在试验设计施肥量范围内,这种肥效模型符合植物营养学的一般肥效规律,称为典型式,可用边际产量导数法推荐施肥。反之,若3个条件中有任何一个条件不能满足,则分别称为肥效模型系数符号不合理的非典型式、肥效模型无最高产量点的非典型式和肥效模型推荐施肥量外推的非典型式,此时边际产量导数法推荐施肥结果不可靠。如何判断三元二次多项式肥效模型是否存在全局最高产量点?章明清等[9]总结提出了简易方法。

三元非结构肥效模型在通过统计显著性检验的前提下,也可能存在不同类型的模型。(1)若模型参数AN0P0K0c1c2c3均大于零,而且氮磷钾推荐施肥量均落在试验设计施肥量范围内,此类模型满足了植物营养学的一般肥效规律,称为典型式,可用边际产量导数法计算推荐施肥量;(2)若模型系数AN0P0K0c1c2c3有一个或一个以上的系数值为负数,该类模型称为系数符号不合理的非典型式;(3)若模型参数均大于零,但边际产量导数法的推荐施肥量有一个或一个以上落在试验设计施肥量范围外,该类模型称为推荐施肥量外推的非典型式。因非结构肥效模型的数学结构特点,若模型参数均大于零,模型必有全局最高产量点,因而三元非结构肥效模型不存在无最高产量点的非典型式这种类型。

1.3 三元肥效模型建模与推荐施肥量计算的计算机实现

有许多数学软件和统计分析软件均能进行肥效模型的参数估计和显著性检验,本文采用MATLAB R2015b软件进行相关的编程和计算。其中,三元非结构肥效模型的参数估计调用nlinfit功能函数;三元二次多项式肥效模型OLS建模法则调用regress功能函数;三元二次多项式肥效模型的PCR建模法是调用pca功能函数进行主成分分析,然后根据提取的主成分得分矩阵与各处理的试验产量,用regress功能函数进行回归建模;三元二次多项式肥效模型FGLS建模法则调用fgls功能函数进行模型参数估计和统计显著性检验。

上述4种建模法的具体数学原理、计算过程和MATLAB R2015b软件功能函数的使用方法可参阅相关专著[19-21]

2 结果 2.1 三元肥效模型不同建模法的拟合效果

针对1 122个水稻和露地蔬菜氮磷钾田间肥效试验结果,分别采用三元二次多项式肥效模型OLS、PCR[13]和FGLS[14]建模法对各个试验点进行回归分析。表 3的统计结果表明,OLS建模法的三元典型式比例平均仅占试验点总数的19.8%,而PCR和FGLS建模法则分别提高至34.0%和27.1%。应用三元非结构肥效模型[12]及其NLS建模法,三元典型式平均比例达到试验点总数的41.4%,较三元二次多项式肥效模型的OLS、PCR和FGLS的建模法分别提高21.6、7.4、14.3个百分点。

表 3 水稻和蔬菜三元肥效模型不同建模法的拟合效果比较 Table 3 Comparison of fitting between ternary fertilizer response models using different modeling methods for rice and vegetable

土壤肥力水平对典型三元肥效模型比例有重要影响。菜后稻是蔬菜地的轮作水稻,因土壤肥力水平普遍较高,OLS建模法的典型三元二次多项式肥效模型比例平均低至4.8%,即使采用PCR、FGLS建模法或非结构肥效模型,三元典型式比例也分别仅有28.6%、12.7%和27.0%。

统计结果还显示,二次多项式肥效模型OLS、PCR和FGLS建模法的无最高产量点非典型式的平均比例大致相当;然而,非结构肥效模型由于数学结构特点,无最高产量点的非典型式比例则为零。在未通过统计显著性检验、模型系数不合理、推荐施肥量外推等模型种类方面,不同模型建模法之间的平均比例则差异较大。PCR建模法使未通过显著性检验的模型比例从OLS建模法的28.7%下降至19.2%,而FGLS建模法则下降至零;PCR建模法使二次多项式肥效模型系数符号不合理的非典型式比例从OLS建模法的30.1%下降至16.4%,非结构肥效模型则进一步下降至4.6%,但FGLS建模法则提高至48.3%。PCR建模法使二次多项式肥效模型推荐施肥量外推的非典型式比例从OLS建模法的6.1%提高至14.4%,FGLS建模法则与OLS建模法相当,但非结构肥效模型推荐施肥量外推的非典型式比例平均达30.8%。

由此可见,二次多项式肥效模型经典建模法的成功率明显偏低,克服多重共线性或异方差危害的建模法均有利于提高典型式比例,而同时克服了模型设定偏误和多重共线性危害的非结构肥效模型则较大程度地提高了建模成功率。因此,不同三元肥效模型及其建模法的适用性有明显差别,合理选择肥效模型及其参数估计方法对提高建模成功率具有重要价值。

2.2 供肥当量参数N0P0K0与对照区产量的关系

在建模成功率较高的三元非结构肥效模型中,N0P0K0分别表示土壤N、P2O5、K2O的供肥当量。为考察模型参数估计值的可靠性,本文对能得到典型三元非结构肥效模型的试验点,根据水稻和露地蔬菜收获时的氮、磷、钾对照区产量,与对应试验点的N0P0K0估计值进行线性回归分析。表 4的结果表明,除了土壤肥力水平较高的菜后稻的3个回归方程和烟后稻的磷素回归方程外,其他具有10个以上试验点的供试作物,N0P0K0估计值与对应作物对照区产量之间均有统计显著水平的线性正相关关系,显示N0P0K0估计值较好地反映了稻田和菜地土壤氮磷钾供肥潜力。因此,三元非结构肥效模型不仅具有较高的建模成功率,模型参数N0P0K0也具有较明确的物理意义。

表 4 非结构肥效模型参数N0P0K0与对照区作物产量的相关性 Table 4 Correlation analysis of model parameters of N0, P0 and K0 with crop yields in CK
2.3 三元肥效模型的四步建模法

在上述建模和统计过程中,作者发现三元二次多项式肥效模型能得到典型式的某些试验点资料,并不能保证三元非结构肥效模型也一定能得到典型式,反之亦然。某些田间试验结果可能仅适用于4种建模法中的一种或者几种。从尽可能提高典型肥效模型比例的实用角度出发,考虑到非结构肥效模型具有较高的拟合精度、更宽的适用范围[11-12]和较高的建模成功率(表 3),同时较好地克服了二次多项式肥效模型推荐施肥量偏高[1, 22]的问题,故将非结构肥效模型作为数据拟合的第一步;OLS建模法是具有最佳统计性能的经典方法,因而将第一步建模不能得到典型式的所有试验点,采用三元二次多项式肥效模型OLS建模法作为数据拟合的第二步;因PCR和FGLS建模法均为有偏估计[20],PCR建模成功率高于FGLS建模法(表 3),故将前两步不能得到典型式的余下试验点依次采用PCR和FGLS作为第三步和第四步的数据拟合技术依据。经过计算机多次反复试验比较,这种建模程序具有最佳的建模效果,简称为四步建模法,技术路线见图 2

图 2 三元肥效模型四步建模法的技术流程 Fig. 2 Technique flowchart of the four-step modeling method for the ternary fertilizer response model

表 5的拟合结果表明,在1 122个试验资料中,典型三元肥效模型占试验点总数的平均比例达到57.5%,较单独使用三元非结构肥效模型NLS建模法、三元二次多项式肥效模型OLS、PCR、FGLS建模法的典型式比例分别提高了16.1、37.7、23.5、30.4个百分点,大幅度提升了典型三元肥效模型比例和田间肥效试验建模成功率。分析还表明,除了供试土壤肥力普遍较高的菜后稻典型式比例较低外,四步建模法在双季稻、单季稻和露地蔬菜等作物间的典型式比例差异很小,显示该建模程序具有较好的可靠性。

表 5 四步建模法对水稻和露地蔬菜典型三元肥效模型比例的影响 Table 5 Effect of the four-step modeling method on the proportion of typical ternary fertilizer response models for paddy fields and open vegetable gardens
3 讨论 3.1 肥效模型不同建模法的适用性

1 122个水稻和露地蔬菜氮磷钾田间肥效试验资料,采用三元非结构肥效模型NLS建模法以及三元二次多项式肥效模型OLS、PCR和FGLS建模法,三元典型式比例平均分别为41.4%、19.8%、34.0%和27.1%,显示不同三元肥效模型及其建模法的建模成功率具有明显的差异。

经典回归分析的OLS建模法具有理想的统计性能,但合理使用必需满足10个基本假设条件[23]。在多项式肥效模型中,误差项方差为常数、自变量之间不存在线性相关和模型被正确设定等三个假设条件通常得不到满足,导致出现了异方差、多重共线性和模型设定偏误等问题,制约了OLS有效性和统计检验可靠性[2],成为当前二元、三元二次多项式肥效模型出现大量非典型式的主要技术原因。为提高建模精度和模型预测可靠性,PCR技术在土壤学中已得到普遍应用[24-26]。该法通过从试验设计矩阵中提取互不相关的主成分,利用主成分得分值和试验产量建立肥效模型,消除了多项式模型多重共线性危害,对提高肥效建模成功率具有重要作用[13]。FGLS建模法是消除异方差危害的有效方法,但在土壤学中的应用还较少[27]。在三元二次多项式肥效模型中,约有25%的肥效模型存在显著水平的异方差[14],导致建模结果发生异常。FGLS建模法是利用加权方法消除异方差,然后采用OLS法进行参数估计。因此,OLS建模法具有优良统计性能,但受到诸多假设条件限制;PCR和FGLS建模法分别单独克服多重共线性和异方差危害,且均属于有偏估计[20]

事实上,三元二次多项式肥效模型同时存在模型设定偏误、多重共线性、异方差等问题,只有同时消除或缓解这些已知问题的危害,才能在较大程度上提高典型式比例。非结构肥效模型假设施用单位养分的增产量与施肥量之间满足指数函数关系,克服了模型设定偏误;该模型是非线性模型,且不能直接线性化处理,克服了多重共线性危害。非结构肥效模型同时较好地克服了多项式肥效模型的这些已知问题,是建模成功率得到较大提升(表 3)的重要原因。

3.2 三元肥效模型的优化建模策略

表 3的建模过程中,作者发现某些田间试验结果要得到典型肥效模型,仅能适用上述4种建模法中的一种或者几种,其余的方法达不到预期目的,原因是作物产量具有随机性。三元二次多项式肥效模型和三元非结构肥效模型的数学形式不同,方程误差项对回归建模的影响程度不同。这种状况就可能出现三元二次多项式肥效模型能得到典型式的某些试验点,三元非结构肥效模型不能保证均得到典型式的结果,反之亦然。

可惜的是,什么样的试验资料会造成模型设定偏误或者多重共线性或者异方差对建模结果产生严重影响,目前在统计学上并无明确的答案[28]。考虑到农业生产条件的复杂性和多样性,反映到作物施肥效应曲线或曲面也必然具有多样性,期望通过一种模型或建模法来反映或概括这种多样性是不现实的。因此,多种肥效模型及其建模法的综合应用有其合理性。由于三元非结构肥效模型具有最高的建模成功率(表 3),OLS建模法具有优良的统计性能,PCR和FGLS能分别消除多重共线性和异方差危害。因此,从得到尽可能高的典型式比例的实用角度出发,多种模型或建模法综合应用的四步建模法是一种现实可行的建模策略。根据该建模策略得到的推荐施肥量,在已完成的234个水稻和14个露地蔬菜大田示范中[29-30],与习惯施肥相比,不同稻作间平均增产稻谷4.0%~12.5%,净增收为875~2 616 yuan·hm-2;不同蔬菜种类间平均增产6.8%~10.6%,净增收达692~3 834 yuan·hm-2。结果显示,四步建模法得到的推荐施肥量具有较好的可靠性。

3.3 计量施肥模型构建的若干思考

肥效模型是实现计量施肥的主要技术手段。但在模型构建研究中,普遍存在一个认识误区,即:施肥模型应包含尽可能多的变量,除施肥量外,还应包括气候条件、土壤条件、作物品种、田间管理措施等,否则模型就不完善。实际上,计量模型考虑的变量过多,必然导致各变量之间提供的信息出现重叠,造成计量不准或出现异常,就如统计学上的多重共线性等问题一样。影响施肥量的各种因素间大多数情况下是非线性关系,如何削弱或消除这种变量信息重叠对计量准确性的影响,目前尚无成熟和方便的方法可用。同时,作为研究对象的农作物具有生命特征,施肥量或其他变量与产量的关系是满足统计学规律的随机关系,既使将上述变量因子全部考虑进去也不可能变为确定性关系。可以说,产生上述认识误区的根源在于,研究者大都习惯于用确定性关系的经典思维模式来考虑和评价具有随机性质的施肥模型,而对现代统计思维模式的应用尚重视不够。

作者认为,计量施肥模型至少可分为计量施肥基础理论模型和区域推荐施肥应用模型两个层次,前者是后者的基础。基础理论模型的研究重点应在于探讨如何建立普遍适用的作物施肥效应模型,甚至包括养分损失的施肥效应模型。这种模型应该简洁美观,既要满足专业要求,又要符合统计学理论,就像理论生态学的逻辑斯蒂(Logistic)模型一样[31]。因此,考虑的变量指标仅需要抓住那些具有共性特点的因子就可以了,例如,施肥量和土壤肥力等变量因子。

区域推荐施肥应用模型应在基础理论模型的基础上,结合服务区域的农业生产条件和区域特点,构建适合当地生产实际的区域推荐施肥系统。由于考虑变量太多会造成难以对模型进行精确的参数估计和施肥计量的问题,区域推荐施肥模型宜采用分区模式。例如,当区域小至县域甚至村域,因为降水量、气温和作物管理水平等变量在区域内很可能无显著差异,在构建区域推荐施肥模型时就可以不考虑了。因此,既使在应用层面上,评价区域推荐施肥模型的合理性和可靠性,关键也在于该计量模型是否抓住了服务区域内具有显著水平差异的那些变量,并将这些变量纳入考虑中,而不是全部变量。

基于上述思考,三元非结构肥效模型和三元二次多项式肥效模型均应属于计量施肥的基础理论模型范畴,可为区域推荐施肥提供基础模型依据;三元非结构肥效模型的土壤供肥当量参数N0P0K0,与相应氮、磷、钾对照区作物产量具有显著水平的线性正相关(表 4),为将“测土”与肥效模型紧密结合提供了一条可能途径。

4 结论

非结构肥效模型具有较强的专业逻辑性,其简化式即为二次多项式肥效模型。四步建模法是提高典型三元肥效模型比例的优化建模策略。

参考文献
[1]
Wang X R, Chen X P, Zhang F S, et al. Application of fertilization model for fertilizer recommendation in China (In Chinese)[J]. Plant Nutrition and Fertilizer Science, 1998, 4(1): 67-74. DOI:10.3321/j.issn:1008-505X.1998.01.011 [王兴仁, 陈新平, 张福锁, 等. 施肥模型在我国推荐施肥中的应用[J]. 植物营养与肥料学报, 1998, 4(1): 67-74.] (0)
[2]
Zhang M Q, Li J, Kong Q B, et al. Progress and prospect of the study on crop-response-to-fertilization function model (In Chinese)[J]. Acta Pedologica Sinica, 2016, 53(6): 1343-1356. [章明清, 李娟, 孔庆波, 等. 作物肥料效应函数模型研究进展与展望[J]. 土壤学报, 2016, 53(6): 1343-1356.] (0)
[3]
Gascho G J, Parker M B. Nitrogen, phosphorus, and potassium fertilization of a coastal plain cotton-peanut rotation[J]. Communications in Soil Science and Plant Analysis, 2006, 37(9/10): 1485-1499. (0)
[4]
Thöle H, Richter C, Ehlert D. Strategy of statistical model selection for precision farming on-farm experiments[J]. Precision Agriculture, 2013, 14(4): 434-449. DOI:10.1007/s11119-013-9306-9 (0)
[5]
Valkama E, Uusitalo R, Turtola E. Yield response models to phosphorus application: A research synthesis of finnish field trials to optimize fertilizer P use of cereals[J]. Nutrient Cycling in Agroecosystems, 2011, 91(1): 1-15. DOI:10.1007/s10705-011-9434-4 (0)
[6]
Gregoret M C, Díaz Zorita M, Dardanelli J, et al. Regional model for nitrogen fertilization of site-specific rainfed corn in haplustolls of the central Pampas, Argentina[J]. Precision Agriculture, 2011, 12(6): 831-849. DOI:10.1007/s11119-011-9224-7 (0)
[7]
Wan X R. The positions of contour map of yield of binary quadratic fertilizer response curve in scientific fertilization(part 1) (In Chinese)[J]. Chinese Journa1 of Soil Science, 1985, 16(1): 30-34. [王兴仁. 二元二次肥料效应曲面等产线图在科学施肥中的位置(一)[J]. 土壤通报, 1985, 16(1): 30-34.] (0)
[8]
Wan X R. The positions of contour map of yield of binary quadratic fertilizer response curve in scientific fertilization(part 2) (In Chinese)[J]. Chinese Journa1 of Soil Science, 1985, 16(2): 86-88. [王兴仁. 二元二次肥料效应曲面等产线图在科学施肥中的位置(二)[J]. 土壤通报, 1985, 16(2): 86-88.] (0)
[9]
Zhang M Q, Lin R X, Lin D Y, et al. Function of distinguish analysis on extreme value in recommendatory fertilization for three-fertilizer efficiency model (In Chinese)[J]. Fujian Journal of Agricultural Sciences, 1995, 10(2): 54-59. [章明清, 林仁埙, 林代炎, 等. 极值判别分析在三元肥效模型推荐施肥中的作用[J]. 福建农业学报, 1995, 10(2): 54-59.] (0)
[10]
Zhang M Q, Xu Z P, Yao B Q, et al. Using Monte Carlo method for parameter estimation and fertilization recommendation of multivariate fertilizer response model (In Chinese)[J]. Plant Nutrition and Fertilizer Science, 2009, 15(2): 366-373. DOI:10.3321/j.issn:1008-505X.2009.02.017 [章明清, 徐志平, 姚宝全, 等. Monte Carlo法在多元肥效模型参数估计和推荐施肥中的应用[J]. 植物营养与肥料学报, 2009, 15(2): 366-373.] (0)
[11]
Zhang M Q, Li J, Chen F, et al. Unary non-structural fertilizer response model for rice crops and its field experimental verification[J]. Scientific Reports, 2018, 8: 2792. DOI:10.1038/s41598-018-21163-w (0)
[12]
Li J, Zhang M Q, Zhang Z D, et al. Increasing precision of fertilizer recommendation using ternary non-structural fertilizer response model (In Chinese)[J]. Journal of Plant Nutrition and Fertilizers, 2019, 25(2): 311-320. [李娟, 章明清, 章赞德, 等. 三元非结构肥效模型提高水稻施肥推荐的可靠性[J]. 植物营养与肥料学报, 2019, 25(2): 311-320.] (0)
[13]
Li J, Zhang M Q, Xu W J, et al. Principal component regression technology of ternary fertilizer response model for improving success rate of modeling (In Chinese)[J]. Acta Pedologica Sinica, 2018, 55(2): 467-478. [李娟, 章明清, 许文江, 等. 提高三元肥效模型建模成功率的主成分回归技术研究[J]. 土壤学报, 2018, 55(2): 467-478.] (0)
[14]
Kong Q B, Zhang M Q, Li J, et al. Heteroskedasticity diagnosis and feasible generalized least squares regression modeling of ternary fertilizer efficiency model (In Chinese)[J]. Scientia Agricultura Sinica, 2018, 51(4): 728-737. [孔庆波, 章明清, 李娟, 等. 三元肥效模型异方差诊断及其可行广义最小二乘回归建模研究[J]. 中国农业科学, 2018, 51(4): 728-737.] (0)
[15]
Lu R K. Analytical methods for soil and agro-chemistry (In Chinese). Beijing: China Agricultural Science and Technology Press, 2000: 146-196. [鲁如坤. 土壤农业化学分析方法[M]. 北京: 中国农业科学技术出版社, 2000: 146-196.] (0)
[16]
Li J, Zhang M Q, Kong Q B, et al. Soil testing and formula fertilization index for early rice in Fujian Province (In Chinese)[J]. Plant Nutrition and Fertilizer Science, 2010, 16(4): 938-946. [李娟, 章明清, 孔庆波, 等. 福建早稻测土配方施肥指标体系研究[J]. 植物营养与肥料学报, 2010, 16(4): 938-946.] (0)
[17]
马昌凤, 柯艺芬, 谢亚君. 最优化计算方法及其MATLAB程序实现[M]. 北京: 国防工业出版社, 2015: 31-45.
Ma C F, Ke Y F, Xie Y J, edited. Optimization calculation method and MATLAB program implementation[M]. Beijing: National Defence Industry Press, 2015: 31-45. (0)
[18]
Li R G. Fertilizer response function (In Chinese). Beijing: Agriculture Press, 1987: 1-42. [李仁岗. 肥料效应函数[M]. 北京: 农业出版社, 1987: 1-42.] (0)
[19]
Xue Y, Chen L P. Practical data analysis and MATLAB software (In Chinese). Beijing: Beijing University of Technology Press, 2015: 189-394. [薛毅, 陈立萍. 实用数据分析与MATLAB软件[M]. 北京: 北京工业大学出版社, 2015: 189-394.] (0)
[20]
He X Q, Liu W Q. Applied regression analysis (In Chinese). Beijing: China Renmin University Press, 2011: 158-170. [何晓群, 刘文卿. 应用回归分析[M]. 北京: 中国人民大学出版社, 2011: 158-170.] (0)
[21]
Yuan Z F, Song S D. Multivariate statistical analysis (In Chinese). Beijing: Science Press, 2009: 219-250. [袁志发, 宋世德. 多元统计分析[M]. 北京: 科学出版社, 2009: 219-250.] (0)
[22]
Chen X P, Zhou J C, Wang X R, et al. Economic and environmental evaluation on models for describing crop yield response to nitrogen fertilizers at winter-wheat and summer-corn rotation system (In Chinese)[J]. Acta Pedologica Sinica, 2000, 37(3): 346-354. DOI:10.3321/j.issn:0564-3929.2000.03.008 [陈新平, 周金池, 王兴仁, 等. 小麦-玉米轮作制中氮肥效应模型的选择——经济和环境效益分析[J]. 土壤学报, 2000, 37(3): 346-354.] (0)
[23]
费剑平, 译. 计量经济学基础(上册)[M]. 第5版. 北京: 中国人民大学出版社, 2011: 313-399.
Gujarati D N, Porter D C. Fei J P. trans. Econometrics foundation(the first volume)[M]. 5th ed. Beijing: China Renmin University Press, 2011: 313-399. Gujarati D N, Porter D C, (0)
[24]
Deng Y, Qin L T, Zeng H H, et al. Prediction of toxicity of heavy metal mixture by integrated model based on principal component regression (In Chinese)[J]. China Environmental Science, 2018, 38(5): 1970-1978. DOI:10.3969/j.issn.1000-6923.2018.05.043 [邓杨, 覃礼堂, 曾鸿鹄, 等. 基于主成分回归的整合模型预测重金属混合物毒性[J]. 中国环境科学, 2018, 38(5): 1970-1978.] (0)
[25]
Du C W, Wang J, Zhou Z J, et al. In situ measurement of Ammonia concentration in soil headspace using Fourier transform mid-infrared photoacoustic spectroscopy[J]. Pedosphere, 2015, 25(4): 605-612. DOI:10.1016/S1002-0160(15)30040-0 (0)
[26]
Lu Y L, Bai Y L, Yang L P, et al. Application of hyperspectral data for soil organic matter estimation based on principle components regression analysis (In Chinese)[J]. Plant Nutrition and Fertilizer Science, 2008, 14(6): 1076-1082. DOI:10.3321/j.issn:1008-505X.2008.06.008 [卢艳丽, 白由路, 杨俐苹, 等. 基于主成分回归分析的土壤有机质高光谱预测与模型验证[J]. 植物营养与肥料学报, 2008, 14(6): 1076-1082.] (0)
[27]
Zhang H, Li S P, Jin Y Y, et al. The spatial difference of the farmland use efficiency and its influencing factors in Hebei Province (In Chinese)[J]. Research of Soil and Water Conservation, 2016, 23(3): 185-191. [张浩, 李世平, 靳亚亚, 等. 河北省耕地利用效率空间差异及影响因素[J]. 水土保持研究, 2016, 23(3): 185-191.] (0)
[28]
Wang H W, Wu Z B, Meng J. Partial least-squares regression-linear and nonlinear methods (In Chinese). Beijing: National Defence Industry Press, 2006: 97-247. [王惠文, 吴载斌, 孟洁. 偏最小二乘回归的线性和非线性方法[M]. 北京: 国防工业出版社, 2006: 97-247.] (0)
[29]
Zhang M Q, Li J, Zhang Z D, et al. NPK fertilizations recommended based on agronomic benefits on vegetable farming (In Chinese)[J]. Fujian Journal of Agricultural Sciences, 2018, 33(10): 1023-1029. [章明清, 李娟, 章赞德, 等. 基于农学效应的露地蔬菜氮磷钾推荐施肥量研究[J]. 福建农业学报, 2018, 33(10): 1023-1029.] (0)
[30]
Li J, Zhang M Q, Zhang Z D, et al. NPK fertilizations recommended based on agronomic benefits on rice in Fujian (In Chinese)[J]. Fujian Journal of Agricultural Sciences, 2019, 34(2): 146-154. [李娟, 章明清, 章赞德, 等. 基于农学效应的福建省水稻氮磷钾施肥限量标准[J]. 福建农业学报, 2019, 34(2): 146-154.] (0)
[31]
主编, 陶毅, 王百桦, 译. 理论生态学-原理与应用[M]. 3版. 北京: 高等教育出版社, 2010: 1-153.
May R, McLean A, ed. Tao Y, Wang B H. trans. Theoretical ecology-Principles and applications[M]. 3rd Ed. Beijing: High Education Press, 2010: 1-153. May R, McLean A, (0)