首页 资讯 招标 项目 展会 更多

位置:首页 > 新闻频道 > 技术动态


基于粒子群优化极限学习机的水质评价新模型(环保)

2016-09-22 11:35:21 安装信息网

相关链接: 中国安全网 中国质量网 中国论文网 中国资讯网

基于粒子群优化极限学习机的水质评价新模型(环保)

                               张颖,  李梅*

                   (上海海事大学信息工程学院,上海201306

摘要:河流水质实时评价技术对当前河流水资源管理和保护具有重要意义。该文以淮河水质为例,利用粒子群优化的极限学习机(Particle Swarm Optimization-Extreme Learning MachinePSO-ELM)分类算法对淮河水质进行类别判定。在极限学习机(ELM)分类算法中随机给定输入权值矩阵和隐含层偏置,需要较多的隐含层节点才能达到所需的精度要求,隐含层节点过多易于出现过拟合现象并增加算法的计算量。该文利用粒子群算法(PSO)优化极限学习机的输人权值矩阵和隐含层偏置,计算输出权值矩阵,以减少隐含层节点。通过对比PSO-ELM .ELM2种算法发现,PSO-ELM算法以较少的隐含层节点可获得更高的精度,降低了对实验样本的需求量,提高了模型的拟合能力。实验结果表明,PSO-ELM对于水质类别判定具有一定的可行性和有效性。

关键词:粒子群优化;极限学习机;水质评价;权值;隐含层

中图分类号:X824TP18 doi10.3969/j.issn1003-6504.2016.05.026    文章编号:1003-6504(2016)05-0135-05

  随着社会经济发展和人们生活水平的不断提高,水资源的保护和合理利用备受关注。水是生命之源、生产之要、生态之基。当前,水资源短缺、水污染严重仍然是制约我国经济社会可持续发展的主要瓶颈。以河流为例,作为重要的国土资源,河流是自然生态系统的重要组成部分。河流与人类的生存发展乃至区域生态平衡息息相关,具有沟通航运、繁衍水生生物、改善区域生态环境以及提供工业农业和饮用水源等多种功能。

    自古以来,沿河流地区就是人类栖息、生存和发展的主要地区。河流的水质状况直接影响到沿河流地区居民的饮用水质量及该区经济社会的发展。因此,了解水质优劣的情况显得尤为重要,通常对水体进行质量评价是判断水质优劣最有效的方法。对水环境的定性研究包括对水质的分析,即对水体进行有效的类别判定。极限学习机是一种参数设置简单且被广泛应用的神经网络算法,该算法随机给定输入层与隐含层间的权值和隐含层神经元间的阈值,在训练过程中无需调整,只需设置隐含层节点个数就可获得唯一的最优解。但是极限学习机算法随机产生的隐含层参数会造成网络泛化性能较差,为了提高预测精度,需要增加隐含层节点数。而隐含层节点数过多会增加网络复杂度,容易产生过度拟合的问题。针对ELM

在的问题,本文用粒子群算法优化极限学习机中的连接权值和阂值,建立淮河水质评价的PSO-ELM模型,对淮河三大监测断面进行水质类别的判定。

1  监测区概况

    淮河流域地处中国东部,介于长江和黄河两流域之间,位于东经11201210,北纬310360,流域面积27km2。流域西起桐柏山、伏牛山,东临黄海,南以大别山、江淮丘陵、通扬运河及如泰运河南堤与长江分界,北以黄河南堤和沂蒙山与黄河流域毗邻。由于历史上黄河曾夺淮人海,现淮河分为淮河水系及沂沭泗水系,废黄河以南为淮河水系,以北为沂沭泗水系。洪泽湖以下为淮河下游,水分三路下泄。主流通过三河闸,出三河,经宝应湖、高邮湖在三江营入长江,成为人江水道,至此全长约1 000 km,流域面积187 000 km2;另一路在洪泽湖东岸出高良涧闸,经苏北灌溉总渠在扁担港入黄海;第三路在洪泽湖东北岸出二河闸,经淮沭河北上连云港市,经临洪口注入海州湾。淮河支流众多,流域面积大于1km2的一级支流有4条,大于2 000 km2的一级支流有16条,大于1 000 km2的一级支流有21条。淮河流域包括湖北、河南、安徽、江苏、山东535个地(市),189个县(市)。淮河流域有1.2x105 km2耕地,沿海还有近6.7x103 km2滩涂可资开垦。淮河流域矿产资源丰富,以煤炭资源最多,初步探明的煤炭储量有700多亿t,煤炭产量约占全国的1/8,一批新的大型矿井正在兴建。淮河流域在中国国民经济发展中举足轻重。然而长期以来,随着当

地经济的高速发展,这一流域的水生态环境也遭到很大破坏,水质污染恶化的区域时有出现,实时监测并防范水质异常对这一区域的环境治理具有重要意义。

    本文是以江苏盱眙淮河大桥监测断面、河南周口沈丘闸监测断面和安徽阜阳张大桥监测断面来对淮河水质进行评价。江苏盱眙淮河大桥监测断面的平均水质等级为Ⅲ类、轻度污染;河南周口沈丘闸监测断面平均水质等级为V类、严重污染;安徽阜阳张大桥监测断面平均水质等级为V类、严重污染。对于淮河水质类别的评价预测具有重要的现实意义和紧迫性。及时的评价及预警,能够有效地提醒流域相关部门及时做好预防和保护工作,避免水质进一步恶化。

2  数据来源和粒子群优化的极限学习机算法

2.1  数据来源

    我国在全国范围内的主要水系都建有水质自动监测站,截至目前共有145个重点断面水质自动监测站,可检测到的指标共有8项。本文选用淮河三大监测断面即江苏盱眙淮河大桥监测断面、安徽阜阳张大桥监测断面和河南周口沈丘闸监测断面。3个监测断面分布如表1所示。

基于粒子群优化极限学习机的水质评价新模型(环保)2217.png 

    本文样本数据来自中华人民共和国环境保护部数据中心发布的“全国主要流域重点断面水质自动监测周报”。选取酸碱度(pH)、溶解氧(DO)、氨氮(NH3-N)、五日生化高锰酸盐指数为分析指标。根据《地表水环境质量标准》( GB 3838-2002)对研究区内各主要断面的水体质量展开评价研究,这些参数都可以表征水体污染程度,依据这些参数对水质类别进行判定是准确和科学的。采集从2013年至201490周的淮河水质数据作训练样本数据,以2015年上半年的前13周作测试样本数据集对淮河3大断面进行水质类别判定。3大监测断面的训练样本数据和测试样本数据取自《全国主要流域重点断面水质监测周报》。

2.2  基于粒子群优化的极限学习机算法

    极限学习机是一种针对SLFN的新算法,极限学习机的输人权值矩阵w和隐含层偏置阈值b是随机给定的,只需要设置网络的隐含层节点个数就能产生唯一的最优解,具有学习速度快且泛化性能好的优点。可通过求解线性方程组的最小二乘解获得输出权值。

    虽然极限学习机在大部分情况下可以获得良好的性能,但是连接权值w、偏置阈值b、隐含层节点个数,对极限学习机的精度都存在很大影响。输出权值矩阵由输人权值矩阵和隐含层偏差计算得到,可能会存在输入权值矩阵和隐含层偏差为零的情况,即部分隐含层节点是无效的。因此在一些实际应用中,极限学习机需要大量的隐含层节点才能达到预期的效果。而隐含层节点过多会增加网络复杂度,容易产生过拟合现象。并且造成极限学习机的泛化能力降低。

粒子群算法是一种群体智能的优化算法更是一  

基于粒子群优化极限学习机的水质评价新模型(环保)2887.png 

在每一次的迭代过程中,粒子通过个体极值和全局极值更新自身的速度和位置达到要满足的条件后结束迭代,更新公式如下:

基于粒子群优化极限学习机的水质评价新模型(环保)2945.png 

  本文用粒子群算法优化极限学习机中的连接权值和阈值,建立淮河水质评价的PSO-ELM模型。将极限学习机的输人权值和阈值作为粒子群算法的

基于粒子群优化极限学习机的水质评价新模型(环保)3016.png 

  对于种群中的每个个体,即输人权值矩阵和隐含层偏差,利用极限学习机算法计算输出权值矩阵。将每个粒子的均方根误差作为粒子群优化算法的适应度,由极限学习机的训练样本计算出粒子的均方根误差。粒子群优化极限学习机算法的具体步骤:

  (1)给定学习样本。学习样本包括输入向量和期望输出向量;

  (2)建立PSO-ELM神经网络拓扑结构。包括确定输入层、隐含层、输出层的神经元个数和选择激活函数;

  (3)产生种群。该种群由极限学习机的输人权值和阈值组成,初始化粒子位置和粒子速度,根据权值和阈值的范围设置粒子速度和位置的寻优范围;

  (4)选择适合的参数。主要有最大迭代次数T=500,种群规模M=20,惯性权值w=1,学习因子C1=C2=

2,粒子维数D

  (5)确定以极限学习机训练集的均方根误差作为适应度值函数,计算出每个粒子的适应度值,求出每个粒子的个体极值和全局极值;

  (6)通过比较,不断更新粒子的速度和位置;

  (7)判断是否达到最大迭代次数或者最小误差,若达到,则停止迭代,此时的群体极值即是经过PSO优化的ELM输人权值和隐层节点阈值。若没达到,转到步骤5,继续迭代;其工作流程图如图1所示。

基于粒子群优化极限学习机的水质评价新模型(环保)3529.png 

3  结果与分析

    根据上述获取的样本数据,用粒子群优化的极限学习机算法进行水质评价模型建模。使用2013年至2014年的90周水质对模型进行训练,然后用2015年的13周水质对模型进行测试。训练好的粒子群优化的极限学习机评价模型对淮河3监测断面进行水质类别判定,其结果如图234所示。

基于粒子群优化极限学习机的水质评价新模型(环保)3680.png基于粒子群优化极限学习机的水质评价新模型(环保)3681.png基于粒子群优化极限学习机的水质评价新模型(环保)3682.png 

    综合图2、图3、图4和表2对比可以看出,在江苏盱眙监测断面、河南周口监测断面和安徽阜阳监测断面用PSO-ELM分类模型进行水质类别判定正确率都达到92.31% (12/13:表示对3大监测断面的13周水质测试中,有12周的水质等级评价正确),分别除第8周、第9周和第10评价错误外,其余各周水质评价完全正确;而用ELM分类模型进行水质类别判定正确率均为84.66%(11/13:表示对3大监测断面的13周水质测试中,有11周的水质等级评价正确),因此可以得出用粒子群优化过后的极限学习机的水质类别判定正确率明显高于没有优化的极限学习机。ELM分类模型运行时间都不足2s,虽然ELM分类模型的运行时间比PSQ-ELM分类模型更短,但在分类准确率上却略为逊色;PSO-ELM分类模型的分类准确率较高,体现了较强的分类能力和抗干扰能力,具有较好的泛化能力;ELM分类模型的分类准确率次之。可见采用PSO-ELM分类模型进行淮河水质评价具有较高的准确性和合理性。

4  结论

    本文利用粒子群优化极限学习机模型在分类应用中的特点,将其应用于淮河河流水质的评价。淮河流域包括湖北、河南、安徽、江苏、山东5省,淮河流域范围大,支流众多,为了对淮河整体水质进行合理的评价,故选取江苏盱眙、河南周口、安徽阜阳3大监测断面。通过使用公开数据对淮河3大监测断面进行水质类别判定。实验结果表明,该模型能有效地对淮河流域整体水质做出了合理的评价。在训练样本情况相同的条件下,将粒子群优化极限学习机与极限学习机两种分类模型的预测分类结果进行对比后发现,使用粒子群优化极限学习机模型的分类结果要优于极限学习机算法。粒子群优化极限学习机模型提高了算法的稳健性,可有效避免训练“过学习”的问题,使得模型训练精度和泛化能力获得提高,而且降低了预测精度对训练样本数和隐含层节点数变化的敏感度。因此,粒子群优化的极限学习机算法是一种河流水质评价研究的有效新方法,在其他类似评价与分类应用中有一定的推广价值。

关键字:

上一篇:基于FN曲线的交通事故风险可接受水平研究(安全)

下一篇: 近距离煤层回采巷道布置合理位置研究(煤炭)

行业资讯月点击排行

展会信息月点击排行

招商信息月点击排行

首页 资讯 招标 项目 展会
关于我们 | 广告服务 | 友情连接 | 联系我们
触屏版 电脑版
安装信息网 www.36qyk.cn.