检索项 检索词
  土壤学报  2022, Vol. 59 Issue (3): 709-622  DOI: 10.11766/trxb202012300343
0

引用本文  

王鑫, 于东升, 马利霞, 等. 基于万维网大数据的农药场地土壤污染快速预测方法研究. 土壤学报, 2022, 59(3): 709-622.
WANG Xin, YU Dongsheng, MA Lixia, et al. Research on the Method of Rapid Prediction of Soil Pollution in Pesticide Polluted-Sites Based on Network Big Data. Acta Pedologica Sinica, 2022, 59(3): 709-622.

基金项目

国家重点研发计划专项(2018YFC1800104,2021YFC1809104)、科技基础性工作专项(2015FY110700-S2)资助

通讯作者Corresponding author

于东升, E-mail: dshyu@issas.ac.cn

作者简介

王鑫(1993-),男,安徽安庆人,博士研究生,主要从事土壤环境评价与预测制图研究。E-mail:wangxin1@issas.ac.cn
基于万维网大数据的农药场地土壤污染快速预测方法研究
王鑫1,2, 于东升1,2, 马利霞1,2, 陆晓松1,2, 陈洋1,2, 冯凯月1,2    
1. 土壤与农业可持续发展国家重点实验室(中国科学院南京土壤研究所), 南京 210008;
2. 中国科学院大学, 北京 100049
摘要:及时高效预测和筛查潜在农药污染场地对环境污染风险管控具有重要意义。基于万维网公开的46个农药场地样本数据,利用五分制层次分析法建立农药场地土壤污染快速预测指标体系,包括产品特性、局部气象条件、土壤属性和场地生产特性4个因素及其相应的产品毒性、持久性、气温、降水、风速、光照、土壤质地、土壤pH、有机质含量、生产时间和闲置时间11个特征指标。结果表明,农药场地生产时间、产品毒性及其持久性指标五分制分级后与农药场地土壤污染均存在显著线性相关性,三个指标不同组合对场地土壤污染的线性综合预测精度小于65%,而基于11个指标的机器学习方法(SVM模型和神经网络模型BP)综合预测精度为82%,但存在污染场地严重漏判问题。以综合评价指数值P≥0.6作为农药场地土壤污染的预测阈值,五分制层次分析法综合预测精度达到91%,优于线性预测以及机器学习方法,具有关键数据需求少、预测快速高效特点,体现“宁严勿漏”的预测原则,可用于各类型农药场地的土壤污染筛查。
关键词农药场地    土壤污染    层次分析    五分制    大数据预测    
Research on the Method of Rapid Prediction of Soil Pollution in Pesticide Polluted-Sites Based on Network Big Data
WANG Xin1,2, YU Dongsheng1,2, MA Lixia1,2, LU Xiaosong1,2, CHEN Yang1,2, FENG Kaiyue1,2    
1. State Key Laboratory of Soil and Sustainable Agriculture, Institute of Soil Science, Chinese Academy of Sciences, Nanjing 210008, China;
2. University of the Chinese Academy of Sciences, Beijing 100049, China
Abstract: 【Objective】Predicting and screening potential pesticide-contaminated sites timely and efficiently is important for controlling environmental pollution.【Method】Based on 46 pesticide sites samples published on the World Wide Web, the index system and method for rapid prediction of soil pollution in pesticide sites was established by a five-score analytic hierarchy process.【Result】The predictive system was constituted with four factors: product characteristics, local climatic conditions, soil properties and site characteristics, including 11 characteristic indicators: product toxicity, persistence, temperature, precipitation, wind speed, light, soil texture, soil pH, organic matter content, production time and idle time. There is a significant linear correlation between the three indicators: production time level, product toxicity and durability level, and the soil pollution of the pesticide sit. The linear comprehensive prediction accuracy of the three indicators is less than 65%. Also, the comprehensive judgment accuracy of the machine (SVM, BP) learning method combining 11 indicators is 82%, but all of them have significant limitations as they missed classified the severity of the contaminated sites.【Conclusion】The comprehensive evaluation index value P≥0.6 is used as the prediction threshold of soil pollution in pesticide sites. The accuracy of the comprehensive prediction of the five score AHP is 91%, which is better than linear prediction and the machine learning method. It has the characteristics of low demand for key data, fast and efficient diagnosis, and reflects the principle of 'Implemented to the strictest standards without leaving a contaminated site". It can be used for pre-diagnosis of soil pollution in various types of pesticide sites.
Key words: Pesticide site    Soil pollution    AHP    Five- score system    Big data forecast    

农药生产和使用保障了粮食作物稳产和丰产,但大量生产农药及其原材料的场地可能造成环境污染[1]。从中国农药登记网44 780条过期农药产品许可证记录推断,全国农药场地至少4 000个以上[2]。农药场地再利用可有效缓解土地供需矛盾,但其潜在的土壤污染风险不容忽视[3],迫切需要农药场地的土壤污染快速预测。

场地调查是确定场地土壤污染的有效手段。通过实地调查获取土壤污染物浓度,与其安全阈值或筛选值对比预测农药场地的土壤污染状况[4]。目前仍存在污染调查周期长、代价大[5-7],采样方案受主观因素影响[4],未充分考虑时间因素对农药场地土壤污染的影响[8-9]等诸多不足。因此,诸如矿业、尾矿库等类型污染场地已开始探索场地土壤污染快速预测方法。Horta等[4]结合遥感和光谱技术,预测矿山场地土壤中重金属的种类及其浓度,预测场地土壤污染状况。Chakraborty等[10]将光谱技术和地质统计方法相结合,预测场地土壤砷污染;范俊楠等[11]基于BP神经网络方法,结合地理信息和土壤理化指标预测场地土壤重金属污染状况。相比这些行业类型场地,农药场地土壤污染快速预测研究进展缓慢,急需开展研究。

农药与其他行业类型场地的土壤污染特征具有共性特征。部分土壤污染物种类相同,土壤中均可能存在石油烃、重金属等污染物[12-13];污染物在土壤中动态累积过程相似,均包括污染物在不同介质中累积、迁移、转化和被净化过程,并且表现出随时间变化的特点[14];局部气候和土壤属性等因素均通过影响污染物动态累积过程间接影响土壤污染状况[15]。这些共性特征为借鉴和开展农药场地的土壤污染快速预测提供了依据。

农药场地土壤污染与其他行业场地也具有不同点。农药及其相关原材料既是场地生产的产品也是场地土壤的特征污染物,如DDT [16];不同种类农药或原材料的毒性、持久性和分解净化方式存在差异,使得农药不同场地之间以及与其他行业场地之间的土壤污染特点具有显著差别[17]。因此,开展农药场地土壤污染快速预测,除借鉴其他行业经验外,还需充分考虑农药场地的特点。

由于各地方场地环境调查、报告编撰、质量验收等标准以及信息公开与保密制度的差异,农药场地报告或公告等相关资料数量极少,专业术语和评价标准不统一,特征数据缺失严重[18],质量参差不齐。资料搜集结果表明,仅有11%的资料具备气象条件、土壤属性、特征污染物、污染物浓度和超标点位等详细属性记录,其余的仅有农药场地名称、地理位置和土壤污染状况记录。开展农药场地土壤污染快速预测,首先面临解决场地报告资料中存在的一系列问题。

本研究从农药产品视角出发,基于地理位置等关键信息补充现有农药场地数据资料;采取五分制层次分析法,筛选出反映农药场地的生产特征、产品特性、局部气象条件以及土壤特征的预测指标,构建和检验农药场地土壤污染快速预测方法,可为农药土壤污染场地管理和再利用提供决策支持。

1 材料与方法 1.1 万维网大数据检索

以“农药场地”、“场地”和“场地土壤污染”等关键词,利用万维网检索获取59个农药场地的调查报告、公告等相关资料。其中,缺少场地名称、地理位置和土壤污染状况等关键信息的13个场地资料被剔除;5个场地资料齐全,41个场地资料需进行补充。

通过中国天气网补充农药场地所在县区的多年年均气温、年均降水、年均风速和年均光照总时长等均值气候数据[19];利用1︰100万中国土壤数据库,依据地理位置补充表层土壤质地[20]、有机质含量[20-21]和pH等场地土壤数据[20]

通过观察不同年份场地对应空间位置在Landsat影像上的地物类型和场地面积的变化情况,判定场地开始生产和停产年份。如某农药场地A所在的空间位置在2010年Landsat影像上对应的地物类型为林地,2011年该位置新建厂房直至2018年该厂房拆除恢复为林地,由此可预测场地开始生产的年份为2011年,场地的停产年份为2018年,场地生产时间为7年,距2020年的场地闲置时间为2年。若通过目视观察方法无法判定场地开始年份和停产年份,则根据场地生产企业名称在国家信用信息公开系统(网址:http://www.gsxt.gov.cn/index.html)检索企业工商信息,以企业成立年份作为场地开始生产年份,以企业注销或迁出年份作为场地停产年份。农药产品的毒性和持久性数据补充主要来自PPDB数据库[22]。若PPDB中无某农药数据记录,则依次通过《职业性接触毒物危害程度分级(GBZ230-2010)》国家标准[23]、化学物质登录号(Chemical Abstracts Service Registry Number或称Chemical Abstracts Service Number,简称CAS编号)的CAS REGISTRY数据库进行检索和补充[24];若以上均不能进行检索和补充,则将该农药产品的毒性和持久性人为设定为剧毒、强持久性。

1.2 农药场地土壤污染快速预测指标体系构建

采用模糊层次分析法(FAHP)筛选预测指标,建立农药场地土壤污染快速预测指标体系及其层次结构(表 1),各场地以其生产的毒性和持久性最强的农药产品参与土壤污染预测。由于许多场地原始资料缺乏农药产品种类和特征污染物浓度数据,土壤污染状况只能采用场地实际调查的评价记录,定性描述为污染或未污染,46个场地记录为污染的约占50%;这些评价记录均以实际调查的特征污染物浓度是否超过筛选值作为依据[4]

表 1 农药场地土壤污染快速预测指标体系层次结构及其模糊一致性矩阵 Table 1 Hierarchical structure and fuzzy consistency matrix of forecast index system for soil pollution in sites
1.3 土壤污染快速预测指标量化方法

除土壤污染状况外,所有指标按其数值或定性描述分为五个等级。对于数值型指标,在尝试等间距、自然间断点、分位数和标准差等多种分级方法后,采用了各分级指标与污染状况关联性最强的等间距分级方法。其中,气温、风速、光照、土壤有机质和闲置时间等指标以全国最大值和最小值为分级的上下限;降水以干旱和半干旱的200 mm分界线作为分级间距 [25];生产时间则选择分级后与土壤污染相关性最强的6年作为等分间距;土壤pH按强酸、强碱、碱性、酸性和中性规定分为5级[26]

依据产品毒性及其持久性以及降水、光照、生产时间对农药场地土壤污染的正相关作用和风速、气温、土壤有机质含量、闲置时间对农药场地土壤污染的负相关作用[1127-28],对各指标按等级进行5分制打分赋值(表 2)。农药场地土壤污染程度随pH偏离中性而加剧[14],偏离程度越高赋分值越高;土壤质地越黏重,土壤污染程度越严重,赋分值越高[17]

表 2 农药场地相关属性五分制评分标准 Table 2 Pesticide site related attribute five-point scoring standard
1.4 土壤污染预测指标权重确定方法

针对不同目标层次的评价指标重要性标度构建模糊矩阵,自下而上确定各评价指标相对于目标的权重[29-30]。通过专家咨询,采用九标度(0.1~0.9)量化方法,两两比对指标体系中B层各指标相对于A层、C层各指标相对于B层的重要程度。其中,0.5~0.9依次表示同等重要、稍微重要、明显重要、重要很多和极端重要,0.4~0.1则表示重要性递减。其中,B层相对于A层的重要性判断矩阵R为:

$ R = \left[ \begin{gathered} r11\;\;\; \cdots \;\;\;r1j \hfill \\ \vdots \;\;\;\;\;\;\; \ddots \;\;\;\;\; \vdots \hfill \\ ri1\;\;\;\; \cdots \;\;\;rij\; \hfill \\ \end{gathered} \right] $ (1)

式中,0≤rij≤1,rij=0.5,rij+rji=1,(ij=1,2,….,n)。rij表示BiBj的重要性,rij越大表示BiBj越重要。

为避免判断矩阵R主观人为性,需对R矩阵进行随机一致性检验。记W为R的特征向量,R的最大特征根为λmax。首先利用式(2)计算一致性指标CI,查找对应平均随机一致性数值(RI[29],再计算随机一致性检验指标CR=CI/RI;若CR < 0.1,通过一致性检验,利用式(3)计算B层各要素i相对于A层的权重Wi

$ CI = \frac{{\lambda \max - 1}}{{n - 1}} $ (2)
$ Wi = \sum\limits_{j = n}^n {rij \div \sum\limits_{i = 1}^n {\sum\limits_{i = 1}^n {rij} } } $ (3)

式中,ij=1,2,……nn为模糊一致性矩阵的阶数。

同理,分别建立C层各指标相对于B层各相应要素目标的模糊判断矩阵并进行随机一致性检验,计算C层各指标m相对B层相应i要素目标的权重WBim。最后,根据B层各要素i相对于A层的权重Wii要素目标下C层各指标m相对于B层的权重WBim,计算C层各指标m相对于A层的综合权重E1~Ej(式(4))。

$ Em=Wi×W_{Bim} $ (4)

式中,Em为C层第m个指标相对于A层的综合权重,(m=1,2,……,n)。

1.5 农药场地土壤污染快速预测与方法检验

采用最大值标准化方法将各指标五分制评分转换至[0, 1]区间:

$ Cm = \frac{{Cm}}{{MaxC}} = \frac{{Cm}}{5} $ (5)

式中,Cm为C层第m个指标的五分制标准值,0≤Cm≤5;C层各指标五分制评级得分的最大值MaxC为5。最终,根据C层各指标权重和五分制评分计算农药场地土壤污染综合评判指数Pk:

$ Pk = \sum\limits_{m = 1}^{11} {Em \times {\text{C}}m} $ (6)

式中,Pk表示第k个场地的综合评判指数[0, 1];Csm为该场地第m个指标五分制标准化评分。Pk值越接近于1,表示该场地土壤受污染的可能性越高,并且受污染程度越严重,以P=0.60作为预测土壤污染的阈值,则P值[0,0.60)为无污染区间S;按等间距将污染区间D [0.60,1]划分为轻度污染D1 [0.60,0.73)、中度污染D2 [0.73,0.86)和重度污染D3 [0.86,1] 三种不同污染程度区间。

农药场地土壤污染快速预测方法需满足的精度要求:(1)实际土壤污染场地的预测精度L达到100%(式(7)),即预测出所有土壤被污染的场地;(2)综合预测精度H大于75%(式(8))。若预测检验结果不符合标准,则重新筛选指标、调整预测方法,直至符合为止。

$ L = \frac{{t - t1}}{t} \times 100\% $ (7)
$ H = \frac{{T - t1 - t2}}{T} \times 100\% $ (8)

式中,t为土壤污染场地总个数,t1为土壤污染场地误预测个数;T为场地总个数,t2为土壤未污染场地误预测个数。

1.6 数据关联度与相关性分析

采用灰色关联度分析(Grey Relation Analysis,GRA)筛选农药场地土壤污染关联指标,构建农药场地土壤污染预测体系[31]。若量化后的各指标与农药场地土壤污染间的灰色关联度r1≥0.6,则存在关联性,将其纳入指标体系[31]。再分别利用Pearson点二系列和斯皮尔曼相关分析方法,分析气温、降水、日照、风速、土壤有机质、土壤pH、生产时间和闲置时间8个连续变量指标的原始数据及其等级以及产品毒性、产品持久性、土壤质地等级与农药场地土壤污染状况的相关性[32-33]

1.7 其他不同场地土壤污染预测方法的尝试和比对

大数据背景下的机器学习等数据挖掘方法盛行[34-35],故尝试利用SVM模型和BP神经网络模型[36-37]快速预测农药场地土壤污染状况。分别以11个属性(X1~X11)与16个属性(X1~X16)和农药场地污染状况(Y)(表 2)作为输入和目标变量,在Matlab软件平台上构建并训练Linear、Quadratics、Cubic、Fine Gaussian、Medium和Coarse Gaussian六种不同核函数的SVM模型[36]和不同隐层神经元数目的3层BP神经网络模型[37],分析农药场地属性指标数量对模型预测精度的影响。其中,BP神经网络隐层神经元数目由以下经验公式确定[37]

$ a = \sqrt {v + L} + \alpha $ (9)

式中,a为隐层神经元个数,v为输入层节点个数(v=11),L为输出层节点个数(L=1),α为1至10之间的常数,则5~13和5~14分别为11个和16个输入变量下BP隐层神经元数目的数值范围。

2 结果 2.1 农药场地及其土壤污染预测指标概况

46个农药场地分布在江苏(7个)、河南(6个)、浙江(6个)、福建(5个)、贵州(5个)、河北(5个)、山东(4个)、广西(2个)、安徽(1个)、海南(1个)、吉林(1个)、宁夏(1个)十二省和天津市(2个)。约有39%的场地以生产硝基苯和苯胺等农药中间体为主,六六六和乙氰菊酯等杀虫剂为主要的农药产品;仅3个场地生产剧毒强持久性产品。生产除草剂、杀虫剂、杀菌剂、杀螨剂和杀线虫剂的原药与制剂的场地个数之比为9︰22(表 3表 4)。

表 3 农药场地生产产品概要 Table 3 Summary of products produced in pesticide sites

表 4 农药场地属性统计 Table 4 Statistics of pesticide site attributes
2.2 农药场地属性指标与场地污染的关系特征

产品毒性及其持久性、气温、降水、风速、光照、土壤质地、土壤pH、有机质含量、生产时间和闲置时间的等级数据与场地土壤污染的灰色关联度(0.65~0.79)均大于0.6,表明各指标分级前后均与场地土壤污染关联,土壤污染受这些因素共同作用的影响;且气温、降水、风速、光照、土壤质地、土壤pH、有机质含量、生产时间和闲置时间的等级数据与土壤污染状况间关联度较原始数据的关联度增加0.01~0.05,有利于预测农药场地土壤污染[31]

农药场地土壤污染与生产时间、闲置时间、气温、降水、光照、风速、土壤pH和有机质含量原始数据间无显著线性相关,仅生产时间、产品毒性及其持久性的五分制分级数据与农药场地土壤污染呈现显著正相关,五分制分级增强了它们与土壤污染之间的关系(表 5)。无论分级与否,气温、降水、风速、日照、土壤有机质和pH与生产时间均不相关(表 6),表明气候指标采用全国多年平均值、土壤pH和有机质含量采用全国第二次土壤普查数据进行补充有一定合理性。

表 5 农药场地土壤污染预测指标与农药场地土壤污染相关性 Table 5 Correlation analysis results between the continuous index of soil pollution prediction of pesticide site and soil pollution

表 6 不同产品指标等级预测农药场地土壤污染的生产时间阈值 Table 6 Different product index levels to forecast the production time threshold for soil pollution of pesticide sites

以农药场地土壤污染状况为因变量Y,分别以生产时间等级、产品毒性等级和持久性等级为自变量X1X2X3,建立它们与农药场地土壤污染间的线性关系(式(10)~式(15))。分别以Y≥1为前提条件,反推农药场地土壤污染的生产时间(生产时间等级阈值乘以6年间隔)、产品毒性及其持久性的单因素预测阈值,分别为生产时间 > 48年、产品毒性等级 > 5或产品持久性等级≥5级(式(10)~式(12))。仅以生产时间阈值为唯一预测指标,> 48年场地6个,其中实际土壤污染场地1个,发生概率为16%;≤48年场地40个,其中未污染的场地17个,发生概率为43%;场地污染综合预测精度为39%。同样,仅以产品持久性为唯一预测指标,持久性为5级的场地3个,土壤全被污染;持久性 < 5级的场地43个,其中未污染场地23个,发生概率为53%;综合预测精度仅为56%。本研究未涉及产品毒性 > 5级的农药场地。

$ Y=0.105X_{1}+0.132\,\,(R^{2}=0. 11\,\,P=0.028 $ (10)
$ Y=0.213X_{2}–0.210\,\,R^{2}=0.51\,\,P=0.000 $ (11)
$ Y=0.256X_{3}–0.191\,\,R^{2}=0. 44\,\,P=0.000 $ (12)
$ Y=0.058X_{1}+0. 200X_{2}–0.369\,\,R^{2}=0.47\,\,P=0.000 $ (13)
$ Y=0.085X_{1}+0. 248X_{3}–0.464\,\,R^{2}=0.58\,\,P=0.000 $ (14)
$ \begin{array}{c} Y = 0.068X1 + 0.094{X_2} + 0.185{X_3} - 0.549\\ {R^2} = 0.60P = 0.000 \end{array} $ (15)

由于产品毒性与其持久性显著正相关(表 6),依据它们和生产时间与土壤污染的二元关系(式(13)~式(14)),以生产时间预测污染的阈值因产品毒性或其持久性不同发生变化,结合不同产品特性预测场地污染的精度差别明显,平均仅为65%(表 6)。利用生产时间、产品毒性及其持久性的三元关系(式(15)),23个污染场地中正确预测7个,其余23个无污染场地均能正确预测,综合预测精度也仅为65%。显然,以极少数指标简单预测场地土壤污染状况显得极不适宜,多数污染场地未得到正确预测。

2.3 农药场地土壤污染快速预测指标权重

农药场地土壤污染预测指标体系B层(CR=0.0457 < 0.1000)各指标相对于A层满足一致性要求[28]表 1)。因B1和B4只有2个指标,默认满足一致性要求。B2(CR =0.0072)和B4(CR=0.0784)的相容度均小于0.1000,则C层各指标相对于B层也均满足一致性要求[28]。各层次及其指标权重计算结果如表 7

表 7 农药场地土壤污染预测指标体系综合权重 Table 7 Comprehensive weights of indicators for soil pollution prediction system of pesticide site

产品特性B1为因素层第一主导因素,与权重排名第二的场地状况B4的累加权重达到0.5833,表明农药场地土壤污染是一个历史性过程,主要受产品特性和场地自身情况影响。局部气象条件B2和土壤属性B3则是通过改变局部水、热、养分等外在条件,使农药场地土壤污染程度产生差异[38-39]。此外,局部气象条件B2还影响农药生产及工艺选择,从而影响农药场地土壤污染状况[38-40]

产品毒性C2综合权重最高,而光照C6综合权重最低,二者相差近4倍。产品毒性是农药污染场地威胁环境安全的根本原因;通过光催化等反应净化环境中的部分农药,降低其环境威胁,农药毒性的权重应远高于光照[27]。农药持久性C1与农药毒性C2权重仅相差0.03左右,持久性强的农药在土壤中不易被微生物等分解,持续在土壤中积累加剧土壤污染[1638-39]

2.4 基于完整数据报告的快速预测与检验

记录规范、数据完整的5个农药场地(A~D)均检测出污染物;除A场地外,其余场地均被污染(表 8)。A场地P值最小,预测为未污染;B~E均预测为污染场地(表 8)。实际污染状况检验表明,污染场地预测精度L为100%,综合预测精度H为100%,预测效果精准。

表 8 调查报告完备的农药场地污染状况 Table 8 Pollution status of pesticide sites with the complete investigation report
2.5 基于补充数据报告的快速预测与检验

41个补充数据报告快速预测结果表明(表 9),该方法预测出所有土壤被污染的场地,实际预测精度L=100%;4个土壤未被污染的场地被过严预测为污染场地,综合预测精度H=91%;15个和8个场地分别被预测为轻、中度污染场地。污染程度越严重,可能造成的危害越大,应优先进行实地调查和评估。

表 9 补充报告数据的农药场地土壤污染预测结果 Table 9 Supplemental report data of pesticide site soil pollution prediction results

农药场地生产的产品毒性和持久性强、生产时间长、闲置时间短是造成未污染场地被过严预测为污染场地的重要原因。被过严预测为有污染的4个场地中,8号、20号和37号场地生产剧毒产品;8号场地生产的产品持久性强;4号、20号和37号场地的平均生产时间长达40年,而20号场地闲置时间仅为2年。

2.6 基于全部数据报告的SVM与BP神经网络模型污染预测精度

以32个样本(70%)作为训练集,重复训练SVM和BP神经网络模型1 000次,并用训练好的SVM和BP神经网络模型预测46个农药场地的土壤污染状况(表 10)。结果表明,在相同的污染预测指标体系(11个指标)下,SVM和BP神经网络分析方法均出现漏判农药污染场地现象,未满足精度要求。建立的五分制层次分析法诊断出全部土壤被污染的农药场地(t1=0),且土壤污染场地综合预测精度高于SVM和BP神经网络方法的平均预测精度(表 10)。

表 10 不同场地土壤污染预测方法的精度对比 Table 10 Comparison accuracy of different soil pollution prediction methods in sites

在11个指标体系中加入农药稳定性、挥发性、腐蚀性、溶解性和易燃性,BP神经网络模型对实际土壤污染场地的平均预测精度提升12%,综合预测精度提升1%,但仍误判1~11个的农药场地。对SVM模型而言,由于数据冗余度的增加直接造成了土壤污染场地的平均综合预测精度降低了16%,更不符合要求[37]

综上所述,采用11个指标的基于五分制层次分析的农药场地土壤污染快速预测方法,是现有数据规模下快速预测农药场地土壤污染的最佳方法。

3 讨论 3.1 基于五分制层次分析的农药场地土壤污染快速预测方法特点

基于五分制层次分析的农药场地土壤污染快速预测方法,可为场地污染实际详查提供优先的调查对象[37],具有关键数据需求少、预测快速高效的特点。农药场地土壤污染预测,目前常用做法是开展场地土壤实际调查、采样、分析与污染评估[4],但周期长、费用高[6-7],严重影响农药土壤污染场地及时预测和有效管理,阻碍污染场地及时修复,污染场地再利用具有极大潜在风险[9]。五分制层次分析预测方法,忽略复杂土壤污染过程和具体污染物浓度,从污染源及其对受体作用特征角度[41],利用与场地土壤污染高度关联且易于获取的特征指标,对农药场地土壤污染进行快速预测,弥补已有调查评估方法存在的不足。

除考虑农药场地及产品特性等场地自身因素外,该预测方法还考虑气温、降水、土壤有机质、质地、pH等众多环境因素,突显了农药场地土壤污染是多种因素共同作用的特征[40-42]。气候条件影响农药生产及工艺选择[3743]以及特征污染物的横向[3]和纵向迁移[38],影响土壤污染范围[42-44]。土壤条件影响农药在土壤中迁移转换[14]、形态[41]以及活性[42],改变土壤污染风险[39]。气候和土壤因素共同影响土壤微生物作用,影响农药在土壤中的归趋,进而影响农药场地土壤污染程度[39]

该方法设置了实际污染场地预测精度100%和污染与无污染场地综合预测精度75%的双精度目标要求,宁将未污染场地过严预测为污染场地,也不可漏判任何实际存在的污染场地,体现“宁严勿漏”原则。遵循该原则,选择各场地中毒性及其持久性最强的农药产品作为预测场地污染的特征产品,或按剧毒产品补充无农药产品记录场地的毒性数据[353943],确保预测出所有农药污染场地。这种“宁严勿漏”的预测原则,利于最大化管控农药场地土壤污染风险。

3.2 基于五分制层次分析的农药场地土壤污染快速预测方法适用性

对于采用相同土壤污染预测指标体系的SVM和BP神经网络模型而言,SVM能够有效地解决小样本数据预测问题,但受缺失的补充数据影响较大,平均土壤污染综合预测精度为82%;BP神经网络具有良好的自学和自适应能力,其预测综合精度最大值可达96%,但对样本的选取和样本量具有严格要求,小样本数据训练出的BP神经网络的结构稳定性和泛化能力差[45-48],平均综合预测精度为84%。SVM和BP神经网络模型平均综合预测精度均低于五分制层次快速预测法(表 10)。SVM和BP神经网络模型根据分类超平面和误差最小化等原理,其场地污染预测过程由相关函数和算法控制[46-47],均存在土壤污染场地漏判问题,污染场地预测精度远低于五分制层次快速预测法,由此带来环境风险将十分严重[3]

基于完整数据报告和补充数据报告的农药场地土壤污染快速预测检验表明,五分制层次分析预测方法,可用于各类型农药场地的土壤污染预测,是目前农药行业场地数据严重残缺条件下最为理想的方法。该方法要求关键数据少,只需拥有农药场地的地理位置和产品类型等关键信息,可利用万维网大数据平台对场地各预测指标进行数据补充。但在数据补充过程中,除考虑数据来源官方性、权威性外,还应充分考虑预测指标自身特点和补充数据的准确性和时空尺度,如全国尺度的气候[49]和土壤数据[20]。随着地理大数据和信息化技术的发展,农药场地的样本数量大幅增加,数据质量显著提升,具有良好数据处理和自学能力的BP神经网络机器学习方法,也应是未来农药场地土壤污染快速预测方法的发展方向[50-51]

4 结论

通过筛选出46个农药场地数据资料,获得地理位置和产品名称等关键属性,并借助万维网大数据检索手段补充数据;综合考虑农药场地环境因素和自身因素,采用五分制层次分析法建立了农药场地土壤污染快速预测指标体系和方法。结果表明:(1)基于五分制层次分析的农药场地土壤污染预测体系可由产品特性、局部气象条件、土壤属性和场地生产特性四大因素及其相应的产品毒性、持久性、气温、降水、风速、光照、土壤质地、pH、有机质含量、生产时间和闲置时间11个特征指标,其中农药场地生产时间、产品毒性及其持久性与农药场地土壤污染存在显著关联性。(2)综合预测指数P≥0.6可作为农药场地土壤污染的预测阈值,对污染场地预测精度可达100%,平均综合预测精度达到91%。(3)以生产时间、产品毒性及其持久性不同指标组合的线性预测农药场地土壤污染综合精度均小于65%,综合11个指标的机器学习方法综合预测精度平均为82%,但均存在污染场地严重漏判问题;五分制层次分析预测是目前农药行业场地数据严重残缺条件下最为理想的方法。

参考文献
[1]
Lewis K A, Tzilivakis J, Warner D J, et al. An international database for pesticide risk assessments and management[J]. Human and Ecological Risk Assessment, 2016, 22(4): 1050-1064. DOI:10.1080/10807039.2015.1133242 (0)
[2]
中华人民共和国农业农村部农药检定所. 中国农药信息网[DB/OL]. http://www.chinapesticide.org.cn/hysj/index.jhtml.2020-5-1.
Pesticide Inspection Institute of the Ministry of agriculture and rural areas of the people's Republic of China. China Pesticide Information Network [DB/OL]. http://www.chinapestici-de.org.cn/hysj/index.jhtml.2020-5-1. (0)
[3]
Zhao L, Teng Y, Luo Y M. Status of organochlorine pesticide contaminated sites in China and advances in site remediation (In Chinese)[J]. Soils, 2018, 50(3): 435-445. [我国有机氯农药场地污染现状与修复技术研究进展[J]. 土壤, 2018, 50(3): 435-445.] (0)
[4]
Horta A, Malone B, Stockmann U, et al. Potential of integrated field spectroscopy and spatial analysis for enhanced assessment of soil contamination: A prospective review[J]. Geoderma, 2015, 241/242: 180-209. DOI:10.1016/j.geoderma.2014.11.024 (0)
[5]
Bartsch C. The new federal law on brownfields: The small business liability relief and brownfields revitalization act[J]. Environmental Practice, 2003, 5(1): 48-52. DOI:10.1017/S146604660303014X (0)
[6]
Levrel H, Pioch S, Spieler R. Compensatory mitigation in marine ecosystems: Which indicators for assessing the "no net loss" goal of ecosystem services and ecological functions?[J]. Marine Policy, 2012, 36(6): 1202-1210. DOI:10.1016/j.marpol.2012.03.004 (0)
[7]
Schädler S, Morio M, Bartke S, et al. Designing sustainable and economically attractive brownfield revitalization options using an integrated assessment model[J]. Journal of Environmental Management, 2011, 92(3): 827-837. DOI:10.1016/j.jenvman.2010.10.026 (0)
[8]
Die Q Q, Nie Z Q, Liu F, et al. Seasonal variations in atmospheric concentrations and gas-particle partitioning of PCDD/Fs and dioxin-like PCBs around industrial sites in Shanghai, China[J]. Atmospheric Environment, 2015, 119: 220-227. DOI:10.1016/j.atmosenv.2015.08.022 (0)
[9]
Fang Y Y, Nie Z Q, Die Q Q, et al. Spatial distribution, transport dynamics, and health risks of endosulfan at a contaminated site[J]. Environmental Pollution, 2016, 216: 538-547. DOI:10.1016/j.envpol.2016.06.006 (0)
[10]
Chakraborty S, Weindorf D C, Deb S, et al. Rapid assessment of regional soil arsenic pollution risk via diffuse reflectance spectroscopy[J]. Geoderma, 2017, 289: 72-81. DOI:10.1016/j.geoderma.2016.11.024 (0)
[11]
Fan J N, Zhang Y, He X M, et al. BP neural network based prediction and evaluation of heavy metal pollution in soil around the enterprises in key areas of Hubei Province (In Chinese)[J]. Journal of Huazhong Agricultural University, 2019, 38(4): 55-62. [基于BP神经网络的重点行业企业周边土壤重金属污染预测及评价[J]. 华中农业大学学报, 2019, 38(4): 55-62.] (0)
[12]
Liu S H, Zeng G M, Niu Q Y, et al. Bioremediation mechanisms of combined pollution of PAHs and heavy metals by bacteria and fungi: A mini review[J]. Bioresource Technology, 2017, 224: 25-33. DOI:10.1016/j.biortech.2016.11.095 (0)
[13]
Yang Q Q, Li Z Y, Lu X N, et al. A review of soil heavy metal pollution from industrial and agricultural regions in China: Pollution and risk assessment[J]. Science of the Total Environment, 2018, 642: 690-700. DOI:10.1016/j.scitotenv.2018.06.068 (0)
[14]
Gowd S S, Reddy M R, Govil P K. Assessment of heavy metal contamination in soils at Jajmau(Kanpur)and Unnao industrial areas of the Ganga Plain, Uttar Pradesh, India[J]. Journal of Hazardous Materials, 2010, 174(1/2/3): 113-121. (0)
[15]
Han W, Gao G H, Geng J Y, et al. Ecological and health risks assessment and spatial distribution of residual heavy metals in the soil of an e-waste circular economy park in Tianjin, China[J]. Chemosphere, 2018, 197: 325-335. DOI:10.1016/j.chemosphere.2018.01.043 (0)
[16]
Weber R, Watson A, Forter M, et al. Persistent organic pollutants and landfills - A review of past experiences and future challenges[J]. Waste Management & Research, 2011, 29(1): 107-121. (0)
[17]
Khan S, He X X, Khan J A, et al. Kinetics and mechanism of sulfate radical- and hydroxyl radical-induced degradation of highly chlorinated pesticide lindane in UV/peroxymonosulfate system[J]. Chemical Engineering Journal, 2017, 318: 135-142. DOI:10.1016/j.cej.2016.05.150 (0)
[18]
Song X, Lin N, Yin P H. Contaminated site remediation industry in China: Current state and future trends (In Chinese)[J]. Soils, 2015, 47(1): 1-7. [中国污染场地修复现状及产业前景分析[J]. 土壤, 2015, 47(1): 1-7.] (0)
[19]
中国气象局公共气象服务中心. 中国天气网[DB/OL]. http://www.weather.com.cn/.2020-05-01
Public Meteorological Service Center of China Meteorological Administration. China weather net[DB/OL]. http://www.weather.com.cn/.2020-5-1. (0)
[20]
中国科学院南京土壤研究所. 中国土壤数据库[OL/DB]. http://vdb3.soil.csdb.cn/.2020-5-1.
Institute of Soil Science, Chinese Academy of Sciences. China soil database [DB / OL]. http://vdb3.soil.csdb.cn/.2020-5-1. (0)
[21]
Yu D S, Shi X Z, Sun W X, et al. Estimation of China soil organic carbon storage and density based on 1∶1000000 soil database (In Chinese)[J]. Chinese Journal of Applied Ecology, 2005, 16(12): 2279-2283. DOI:10.3321/j.issn:1001-9332.2005.12.011 [基于1∶100万土壤数据库的中国土壤有机碳密度及储量研究[J]. 应用生态学报, 2005, 16(12): 2279-2283.] (0)
[22]
University of Hertfordshire. PPDB: Pesticide Properties DataBase[DB/OL]. [2020-5-1]. http://sitem.herts.ac.uk/aeru/ppdb/en/atoz.htm. (0)
[23]
中华人民共和国国家卫生健康委员会. GBZ230-2010, 职业性接触毒物危害程度分级[S]. 北京: 中国标准出版社, 2011: 1-6.
National Health Commission of the People's Republic of China. GBZ230-2010, Classification for hazards of occupational exposure to toxicant[S]. Beijing: Standards Press of China, 2011: 1-6. (0)
[24]
Shively E. CAS surveys its first 100 years[J]. Chemical & Engineering News, 2007, 85(24): 13. (0)
[25]
刘洁. 近60年来中国北方半干旱区界线与范围时空变化特征研究[D]. 西安: 西北大学, 2019.
Liu J. Study on spatial and temporal variation of the boundary and area of the semi-arid region in Northern China over the past 60 years[D]. Xi'an: Northwest University, 2019. (0)
[26]
Zeng X B. Acidification of red soils and control methods (In Chinese)[J]. Chinese Journal of Soil Science, 2000, 31(3): 111-113. DOI:10.3321/j.issn:0564-3945.2000.03.005 [红壤酸化及其防治[J]. 土壤通报, 2000, 31(3): 111-113.] (0)
[27]
Foreman W T, Majewski M S, Goolsby D A, et al. Pesticides in the atmosphere of the Mississippi River Valley, part II-air[J]. Science of the Total Environment, 2000, 248(2/3): 213-226. (0)
[28]
Passatore L, Rossetti S, Juwarkar A A, et al. Phytoremediation and bioremediation of polychlorinated biphenyls(PCBs): State of knowledge and research perspectives[J]. Journal of Hazardous Materials, 2014, 278: 189-202. DOI:10.1016/j.jhazmat.2014.05.051 (0)
[29]
连启超. 基于模糊层次分析法的建设工程项目的风险分析及对策研究--以北京M项目为例[D]. 西安: 西安工程大学, 2019.
Lian Q C. Risk analysis and countermeasure of construction project based on fuzzy analytic hierarchy process research-A case study of Beijing M project[D]. Xi'an: Xi'an Polytechnic University, 2019. (0)
[30]
元云丽. 基于模糊层次分析法(FAHP)的建设工程项目风险管理研究[D]. 重庆: 重庆大学, 2013.
Yuan Y L. The research on the construction engineering project risk management based on fuzzy analytic hierarchy process[D]. Chongqing: Chongqing University, 2013. (0)
[31]
Guo L Y, Liu B L. Grey correlation evaluation of listed companies' operating performance based on coefficient of variation (In Chinese)[J]. Statistics & Decision, 2005(3): 18-19. DOI:10.3969/j.issn.1002-6487.2005.03.010 [基于变异系数法的上市公司经营业绩灰色关联评价[J]. 统计与决策, 2005(3): 18-19.] (0)
[32]
Liu W, Bian Y F, Chen L L, et al. Comparative research of BP neural network estimates IRT parameters (In Chinese)[J]. China Examinations, 2013(2): 7-11. DOI:10.3969/j.issn.1005-8427.2013.02.004 [BP神经网络估计IRT参数的比较研究[J]. 中国考试, 2013(2): 7-11.] (0)
[33]
孙浩琳. 基于相关性分析和频繁模式挖掘的驾驶行为关联性分析[D]. 辽宁阜新: 辽宁工程技术大学, 2019.
Sun H L. Correlation analysis of driving behavior based on correlation analysis and frequent pattern mining[D]. Fuxin, Liaoning: Liaoning Technical University, 2019. (0)
[34]
He L Z, Gielen G, Bolan N S, et al. Contamination and remediation of phthalic acid esters in agricultural soils in China: A review[J]. Agronomy for Sustainable Development, 2015, 35(2): 519-534. DOI:10.1007/s13593-014-0270-1 (0)
[35]
Dixit R, Wasiullah, Malaviya D, et al. Bioremediation of heavy metals from soil and aquatic environment: An overview of principles and criteria of fundamental processes[J]. Sustainability, 2015, 7(2): 2189-2212. DOI:10.3390/su7022189 (0)
[36]
Idowu O, Semple K T, Ramadass K, et al. Beyond the obvious: Environmental health implications of polar polycyclic aromatic hydrocarbons[J]. Environment International, 2019, 123: 543-557. DOI:10.1016/j.envint.2018.12.051 (0)
[37]
生态环境部. HJ25.3-2019, 建设用地土壤污染风险评估技术导则[S]. 北京: 中国环境出版集团, 2019.
Ministry of Ecology and Environment of the People's Republic of China. HJ 25.3-2019, Technical guidelines for risk assessment of on soil contamination of land for construction[S]. Beijing: China Environmental Publishing Group, 2019. (0)
[38]
Wang Q H, Pang Z, Zheng R L, et al. Effects of contour grass hedges on migration of tribenuron-methyl residue in sloping cropland soil (In Chinese)[J]. Journal of Agro-Environment Science, 2016, 35(6): 1081-1089. [等高草篱对坡耕地土壤苯磺隆残留迁移的影响[J]. 农业环境科学学报, 2016, 35(6): 1081-1089.] (0)
[39]
Alharbi O M L, Basheer A A, Khattab R A, et al. Health and environmental effects of persistent organic pollutants[J]. Journal of Molecular Liquids, 2018, 263: 442-453. DOI:10.1016/j.molliq.2018.05.029 (0)
[40]
Wu X M, Dong F S, Wu X H, et al. Impact of climate change on application risk of pesticide (In Chinese)[J]. Plant Protection, 2019, 45(2): 25-29. [气候变化对农药应用风险的影响[J]. 植物保护, 2019, 45(2): 25-29.] (0)
[41]
徐鹏. 不同类型土壤中有机氯农药形态分布规律研究[D]. 北京: 中国地质大学(北京), 2014.
Xu P. Study on the speciation distribution of organochlorine pesticides in different types of soils[D]. Beijing: China University of Geosciences, 2014. (0)
[42]
Peng S Y, Ye H, Wei J, et al. Residues and dissipation of clothianidin, thiamethoxam, chlorpyrifos and thiosultap- monosodium in soil and sugarcane (In Chinese)[J]. Agrochemicals, 2020, 59(11): 814-820. [噻虫胺、噻虫嗪、毒死蜱、杀虫单在土壤和甘蔗中的残留消解动态[J]. 农药, 2020, 59(11): 814-820.] (0)
[43]
Utembe W, Faustman E M, Matatiele P, et al. Hazards identified and the need for health risk assessment in the South African mining industry[J]. Human & Experimental Toxicology, 2015, 34(12): 1212-1221. (0)
[44]
Chen G H, Zou M T, Huang K X, et al. Methods analysis and frontiers review of vulnerability for coupled multihazard in Chemical Industry Park (In Chinese)[J]. Chemical Industry and Engineering Progress, 2019, 38(5): 2527-2535. [化工园区多灾种耦合脆弱性方法探究与前沿综述[J]. 化工进展, 2019, 38(5): 2527-2535.] (0)
[45]
He Z B, Wen X H, Liu H, et al. A comparative study of artificial neural network, adaptive neuro fuzzy inference system and support vector machine for forecasting river flow in the semiarid mountain region[J]. Journal of Hydrology, 2014, 509: 379-386. DOI:10.1016/j.jhydrol.2013.11.054 (0)
[46]
Kuo Y H, Kusiak A. From data to big data in production research: The past and future trends[J]. International Journal of Production Research, 2019, 57(15/16): 4828-4853. (0)
[47]
Yang J F, Qiao P R, Li Y M, et al. A review of machine-learning classification and algorithms (In Chinese)[J]. Statistics & Decision, 2019, 35(6): 36-40. [机器学习分类问题及算法研究综述[J]. 统计与决策, 2019, 35(6): 36-40.] (0)
[48]
刘天舒. BP神经网络的改进研究及应用[D]. 哈尔滨: 东北农业大学, 2011.
Liu T S. The research and application on BP neural network improvement[D]. Harbin: Northeast Agricultural University, 2011, (0)
[49]
National Oceanic and Atmospheric Administration. Hourly/sub-Hourly Observational Data Map[DB/OL]. https://gis.ncdc.noaa.gov/maps/ncei/cdo/hourly.2020-11-01. (0)
[50]
胡袆. 地理信息系统(GIS)发展史及前景展望[D]. 北京: 中国地质大学, 2011.
Hu H. Introduction of Geographic Information System history and prospects[D]. Beijing: China University of Geosciences, 2011. (0)
[51]
焦春鹏. 基于二分类SVM的多分类方法比较研究[D]. 西安: 西安电子科技大学, 2011.
Jiao C P. Comparison study on multi-category classification with binary SVMs[D]. Xi'an: Xidian University, 2011. (0)