徐伟嘉1.2, 李红霞1.2, 黄慎1.2, 何芳芳1, 江淑3
3.中山大学环境科学与工程学院,广东广州510275)
摘 要:空气质量统计预报模型是当前空气质量预报的重要工具之一。该研究选取珠海市4个围控大气自动监测站点(吉大、唐家、前山、斗门),基于大气环境监测数据和气象数据研究了同期回归、多元回归2种空气质量预报统计模型,并对模型在不同污染物(NO2、SO2、CO、O3、PM10 PM25)、不同预报时段(24、48、72、96、120、144 h)、不同国控监测站点的情景下进行了预报准确度综合评估。结果表明:(1)PM25浓度与风向的皮尔逊相关系数最大,其相关系数为0.403;O2浓度与气温、湿度均具有较大的相关性,其相关系数分别为0.705、-0.823;(2)同期回归模型对于6项污染物浓度预报的准确度由高至低分别为:CO>PM10>PM2.02{>NO2>SO4,其准确度分别为84%、75.9%、73.4%、72.3%、66.80%与61 .g%;(3)多元回归模型对于6项污染物浓度预报的准确度由高至低分别为:CO>PM25>PM10>03>N02>SO2,其准确度分别为85.6%、73.3%、69.9%、67.6%、67.4%与58. 7%。
关键词:空气质量;统计预报模型;大气监测;PM25
中图1分类号:X51 文献标志码:A doi:l0.3969/j.issn.1003-6504.2015.11.026 文章编号:1003-6504(2015)11-0142-06
我国环境空气污染类型已由燃煤型转变为燃煤一机动车一工业排放共存的重度复合大气污染类型,区域性大气细颗粒物和臭氧污染不断加重,京津冀、长三角、珠三角等区域及城市常出现长时间雾霾天气,对公众健康产生了严重威胁。空气质量预报成为继大气环境监测后的又一热点问题。空气质量预报模式是是空气质量分析、预报等相当重要的手段之一。现阶段应用较为广泛的空气质量数值模式包括:美国的WRF/Chem、Models-3/CMAQ和CAMx、德国的EU-RAD、法国的CHIMERE、等。以美国为例,美国投入了大量的人力和物力开发研究大气污染数值预报模式,20世纪90年代末期推出了第三代基于“一个大气”理念的开发设计的“Models-3/CMAQ”模式系统,2000年代后推出的包含大气污染物与气象场之间双向反馈作用的WRF/Chem模式。
我国也相继研发了多个具有自主知识产权的空气质量模式,例如中国科学院大气物理研究所开发了全球环境大气输送模式( GEATM)、全球多尺度嵌套大气化学输送模式(GNAQPMS)、嵌套网格空气质量模式系统( NAQPMS)、多模式空气质量集合预报系统(EMS)、等一系列模式产品;中国气象科学研究院开发了GUACE模式,南京大学研发了NJU-CAQPS模式等。近年来,上述部分模式也已在京津冀、长三角、珠三角地区应用并取得较好的效果,并在重大活动的空气质量保障工作中发挥了重要的作用。
然而,数值模式的建设需要投入大量的数据资源及硬件成本,同时预报准确度受限于源清单、下垫面、边界条件等众多要素本身的精确度,故较适用于有软硬件条件支撑的区域或省市。对于大部分中、小城市而言,统计预报模型建设成本低、简单易于掌握、精度较好,因此成为城市空气质量预报工具的选择之一,以提升当前城市对重污染天气的预报预警能力。空气质量统计预报模型亦是当前的一项研究热点,我国刘闽等用逐步回归法对沈阳空气质量进行了预报研究,预报与实测结果对比表明环境空气预测结果级别准确率达到79.1%。孙峰采用线性回归模型、分类判别树模型等共计5种预报模型,减小了在高污染季节的预报误差。中山大学刘永红等采用基于气象相似性的BP神经网络模型对华南和华北典型地区进行了空气质量预报。该研究基于空气质量监测实况数据和同期气象监测、预报数据,研发多元回归、同期同归模型2种统计预报模型,实现城市未来1-6 d空气质量预报,并对预报准确度进行综合评估。
目前,国内尚没有与珠海市空气质量预测模型研究相关的文献,然而,针对珠海市进行空气质量预测漠型研究能够更好的对珠海市未来空气质量进行预测,反映珠海市大气环境污染变化趋势,为环境管理决策提供及时、准确、全面的环境质量信息,有效应对尺气重污染事件。
1 基础数据分析
该研究基于2014年珠海市吉大、前山、唐家和斗门4个监测站点的空气质量监测实况日均值(N02、S02、CO、03、PMio、PM2.5共计6项参数)、气象实况日均数据(包括风向、风速、温度、气温、湿度、大气压、降雨等级、大气稳定度共计8项参数)为基础,进行统计模型建模并预测。
珠海市吉大、前山、唐家和斗门均为国控点,4个站点的空间位置如图1所示。
l.l 污染物和气象因子的相关性分析
选取PM25、03为例(后文均以PM25、03为例),基于2014年5月1日-6月30日的常规气象要素与污染物浓度监测数据(空气质量发布数据,数据源于全国城市空气质量实况发布平台,http://ll3.108.142.147:20035/emcpublish/)进行分析,相关性分析结果如图2所示。
由图2可看出,PM2.5与风向具有较为相似的变化趋势,与气温和湿度的变化关系不明显;而03浓度与温度、风向、湿度具有较为一致的变化趋势。因此,基于PM2.5和03浓度数据,结合气象数据进行进一步的相关性分析,本文中,我们采用Pearson相关系数分别计算PM2.5和03与4个气象要素(气温、风向、风速、湿度)的相关性,结果如表1所示。其中,皮尔逊相关也称为积差相关或积矩相关,是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。假设有2个变量X、y,那么两变量间的皮尔逊相关系数可通过以下公式计算:
式(l)中,cov表示变量之间的协方差,σ表示标准差,E表示期望。
由表1可知,PM2.5与风向的相关系数最大,其相关系数为0.403;03浓度与气温、湿度均具有较大的相关性,其相关系数分别为0.705、-0.823,即03浓度一定程度上随着气温的升高而升高,随着相对湿度的增加有所减少。
基于珠海市2014年5月1日至2014年6月30日的污染物浓度监测数据进行分析,相关性结果如表2所示。
由表2可知,PM25和PMio、N02、S02之间具有较为明显的相关性,相关系数分别达0.890、0.744、0.714;PMio和S02之间亦具有明显相关性,相关系数达0.753。不同污染物浓度之间的相关性分析可以作为建立污染物浓度预测模型时进行变量筛选的依据,为今后的模型改进提供理论支撑。
2 统计模型
2.1 同期回归模型
同期回归模型承认事物发展的延续性。应用过去的数据,就能推测事物的发展趋势。该方法简单易行,便于掌握,适用于短期预测。
我们将同期回归模型基于如下假设应用到空气质量预测中:假设珠海市每天人流量、车流量变化幅度较小可忽略不计,若相邻几天气象条件(气温、风向、风速、降雨量等)相似,则未来的污染物浓度将与历史污染物浓度密切相关并呈一定函数关系。以线性关系为拟合函数,定义预测日前3d的污染物浓度为自变量,预测日当天的污染物浓度为因变量,建立同期回归模型如下:
式(2)中,Pt表示第f天污染物日均浓度,Pt-1表示第( t-l)天即前ld污染物日均浓度,Pt-2表示第(t-2)天即前2d污染物日均浓度,依次类推。
回归参数的估计采用最小二乘法。参数应使总体预测误差达到最小,即使式(3)的值达到最小。
式(3)中,E为所有样本的总误差,N为样本数,yi为第f个样本的实际值,yi为第i个样本的预测值,根据回归得到的参数进行预测。
2.2 多元回归模型
线性回归(linear regression)是对一个或多个自变量与因变量建立的一种线性模型。回归分析中,如果只包括一个自变量和一个因变量,且二者的关系可用
直线近似表示,这种回归分析称为一元线性回归分析;如果回归分析中包括2个或2个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。多元回归方程一般采用逐步回归算法。逐步回归算法是在所有考虑的参数中,按其对因变量P(大气污染物浓度)影响的显著程度的大小,由大到小逐个引进回归方程。若已被引进回归方程的参数,在引进新参数后,可能会由显著变为不显著,此时需要将其从方程中剔除,以保证在众多预报参数中挑选出最佳的关键参数组合,建立最优预报方程。
根据1.1节部分相关性分析结果可知,污染物浓度与气象条件存在一定的相关性。因此,定义与预测日最接近的一天的污染物浓度及预测日当天的气象因子为自变量,预测日当天的污染物浓度为因变量,建立多元回归模型如下:
式(4)中,Pt表示第f天污染物日均浓度,xi(i=l,2,3…)表示自变量,如预测日当天的气象因子等。
回归参数的估计和同期回归模型的参数估计方法一样。
3 模型预测准确度分析
采用准确度及相对误差对统计模型评估,相对误差越小,准确度越高,即模型预报结果越接近实际值。
(l)准确度。准确度=(1-相对误差)xl00%
(2)相对误差。相对误差=l预报浓度值一实况浓度值J/实况浓度值xl00%,
评估对象包括珠海市4个站点、6项污染物的未来1-6 d预报的污染物浓度。
3.1 监测实况与预报对比
选取珠海市吉大站点,以CO和PM2.5为例,显示2014年10月10日至11月20日的CO和PM2.5监测实况及其24 h预报值对比结果如图3所示。由图3可知,同期回归与多元回归模型的24 h预报结果与实测值大体上相一致。
3.2 同期回归模型准确度分析
针对珠海市4个国控点,基于历史3d的空气质量实况监测数据,采用同期回归模型,对10月1日一11月30日进行每日l—6 d预报,选取N02、CO、PMio和PM2.5,其24、48、72、96、120、144 h的污染物浓度准确度结果分析见表3。
由图4可知,对于珠海市4个站点,NO2、CO、PM10和PM2.5总体上呈现出随着预报的时段越长,污染物浓度预报的准确度则有所小幅下降的趋势,但对于N02和CO而言,该种下降趋势并不明显,而对于PM10和PM2.5该种下降趋势趋为明显。
对不同污染物预报的准确度如表4所示。由表4可知,同期回归模型对于6项污染物浓度预报的准确度由高至低分别为:CO>PM10>PM2.5>03>NO2>S02,其准确度分别为84%、75.9%、73.4%、72.3%、66.8%与61.9%。由此可知,总体上,同期回归模型对于CO、PM10、PM2.5与03具有较好的预报水平。
3.3 多元回归模型准确度分析
基于历史60 d的气象和空气质量实况监测数据,采用多元回归模型,对10月1日-ll月30日进行每日1-6 d预报,选取NO2、CO、PM10和PM2.5,其24、48、72、96、120、144 h的污染物浓度分析如下。
由图5可知,对于珠海市4个站点,采用多元回归模型预测到的NO2、CO、PM10和PM2.5浓度,其预测趋势总体上呈现出随着预报时段的延长,预报准确度则有所下降,除CO以外,其他3项污染物的预报准确度下降幅度均较为明显,这与模型中应用了预报气象数据有关,通常中长期的气象预报数据准确度较短时预报低。
多元回归模型对不同污染物预报的准确度如表5所示。由表5可知,多元回归模型对于6项污染物浓度24 h预报的准确度由高至低分别为:CO>PM25>PM10>03>N02>S02,其准确度分别为85.6%、73.3%、69.9%、67.6%、67.4%与64.0%,与同期回归模型的预报准确度相比,CO、PM2.5、N02和S02的预报准确度相当或部分略有升高,但PM10、03等污染物的准确度有所下降,下降幅度分别为6%和4.7%。
3.4 同期回归模型和多元回归模型准确度对比分析
比较同期回归模型和多元回归模型,会发现2种方法对6项污染物浓度的预报准确度相差不大,如表5所示。
4 总结
通过选取珠海市吉大、唐家、前山、斗门4个大气
自动监测站点,基于大气环境监测数据和气象数据建立的同期回归、多元回归2种空气质量预报统计模型,分析2种模型在不同污染物(N02、SO2、CO、03、PM10、PM2.5)、不同预报时段(24、48、72、96、120、144h)、不同站点下的准确度得到如下结论。
( 1)PM2.5与风向的相关系数最大,其相关系数为0.403;03浓度与气温、湿度均具有较大的相关性,其相关系数分别为0.705、-0.823。
(2)PM2.5和PM10、NO2、S02之间具有较为明显的相关性,相关系数分别达0.890、0.744、0.714。
(3)同期回归模型对于6项污染物浓度预报的准确度由高至低分别为:CO>PM10>PM2.5>03>NO2>S02,其准确度分别为84%、75.9%、73.4%、72.3%、66.8%与61.9%。
(4)多元回归模型对于6项污染物浓度预报的准确度由高至低分别为:CO>PM2.5>PMl0>03>NO2>S02,其准确度分别为85.6%、73.3%、69.9%、67.6%、67.4%与58.7%。
未来将进一步考虑神经网络等非线性模型在空气质量预报中的应用,此外,亦将考虑基于物理机制建立概念模型,如天气形势法,即在考虑气象物理机制的前提下,综合考虑气象与环境空气质量之间的变化特征,预报区域或城市的短、中、长期空气质量变化情况。
下一篇:返回列表