徐 星1,郭兵兵1,王公忠1,2
(1.河南工程学院安全工程学院,河南郑州451191;2.武汉理工大学资源与环境工程学院,湖北武汉430070)
摘要:以焦作矿区水化数据为例,选用Na++K+、Ca2+、Mg2+、C l-、SO42-、HCO3- 6种水化离子浓度作为识别矿井水源的依据,运用M atlab软件分别建立BP神经网络与Elman神经网络的矿井多水源识别模型。应用结果表明:与静态的BP神经网络相比,在结构上增加承接层的Elman神经网络在训练和仿真中拟合能力更强,识别精度更高和泛化能力更好;矿井地下水随着地下开采与扰动具有动态性,将具有非线性动态特征的Elman神经网络应用于矿井多水源的识别,对准确判断突水来源和分析地下水运移规律具有一定的辅助和指导意义。
关键词:矿井多水源;BP神经网络;Elman神经网络;识别;泛化能力
中图分类号:X936 doi: 10. 11731/j.issn.1673 -193x.2016. 01. 034
0 引 言
我国煤矿地质、水文地质条件较为复杂,据统计,目前国有重点煤矿中受水害威胁的矿井约占48%以上,随着煤炭开采的范围增大和深度的增加,潜在的突水危害也随之加大。突水水源的准确识别是有效开展矿井水害防治的前提,由于水化学数据能够反映各地下水各含水层的结构特征,用水质资料作为判别水源具有快速、有效、准确、经济的特点。地下水化学特征组分识别有多种方法,每种方法既有其特点也有其局限性,如何选择适当的水源识别方法是需要不断研究的课题。
人工神经网络( ANN)是由大量神经元通过适当的方式互连构成的复杂网络,能够反映人脑结构及信息处理功能,这种抽象、简化的数学模型通过大量样本的学习可以逼近任意复杂的非线性关系,能够实现输入与输出的高度非线性映射,具有计算、学习、记忆等智能功能。在人工神经网络中,应用静态的BP神经网络进行系统模式识别与分类的较多。分别应用BP神经网络建立了矿井突水水源判别模型,对突水水源进行准确的判别,但煤矿在开采过程中,地下水各含水层的水质会发生不断的变化,地下水系统具有渐变性,将静态的BP神经网络应用于具有动态特点的水源的识别不适合的。采用网络性能最佳状态的BP神经网络和Elman神经网络进行对比,证明了Elman神经网络在训练过程中收敛速度更快,在测试中,输出精度更高,但并未将网络最优的BP神经网络与(设置相同参数的)Elman神经网络进行对比,笔者考虑到兼顾两种模型间的公平比较原则,更为体现Elman神经网络的动态识别特性,在这里采用相同的参数设置进行二者的训练与仿真输出对比,检验二者的性能差异。应用结果可以看出,Elman神经网络更能克服学习过程陷入局部极值的缺点,确保全局最优。将具有非线性动态特征的Elman神经网络应用于矿井多水源的识别,能提高识别精度,更具有应用潜力。
1 人工神经网络模型
BP神经网络(Back Propagation Network)又称为多层前馈型神经网络,主要由输入层、隐含层和输出层三部分组成网络拓扑结构,当给定网络输入模式时,神经元的激活值从输入层单元经各隐含层单元向输出层各单元传播,在输出层单元获得输入响应,隐含层的激活函数一般选用S型非线性函数,输出层的激活函数选用非线性还是线性,要根据输入与输出的映射关系来确定。这种网络模型具有:各层神经元仅与相邻层神经元之间有连接、各层内神经元之间无任何连接和各层神经元间无反馈连接的特点。Elman神经网络属于反馈型网络( Recurrent Network),与BP神经网络相比,在隐含层的基础上增加了一个承接层,主要包括输入层、隐含层、承接层和输出层四部分,其网络拓扑结构如图1。承接层用来记忆隐含层单元前一时刻的输出值并返回网络输入,可以认为一个一步延时算子。通过承接层的延
迟与储存,使网络对历史状态的数据具有敏感性,增强了网络本身处理动态信息的能力。
BP神经网络的学习算法包括正向(前向)计算和误差的反向传播两个过程,Elman神经网络也采用BP神经网络的算法进行权值的修正,其学习指标函数为均方误差F( x):
式中:t和a分别是神经网络的目标值和实际输出值。
通过调整网络参数,使均方误差最小,网络达到最佳性能。使用最速梯度下降法更新权值权重和偏置值,调整量与误差的负梯度成正比。
式中:Wm(k)为第五次训练后第m层的权值矩阵,b m(k)为第m层的偏置,am-1为经过第k次训练后第m-1层的输出向量,s m为第m层的输出误差指数,即敏感性指数。
2 模型训练与仿真
2.1 样本设计与处理
焦作矿区为主采均厚6m的山西组二,煤,矿区自上到下主要有4组含水层:第四系含水层、顶板砂岩含水层、八灰含水层和二灰和奥陶纪含水层。开采期间突水事故频发,据统计,共发生过700余次突水,突水量最大达到320 m3/min。水害对各矿的煤炭开采构成了严重威胁,如何快速有效地识别突水水源是保障矿井安全生产的关键。由于各含水层所处的水文地球化学环境和补给、径流、排泄条件不同,形成的水化学特征也不同。考虑到各含水层中水化学组分较多,用每一种水化学组分作为水源判别的指标不太现实,选取Na++K+、Ca2+、Mg2+、C l-、SO42-、HC03 - 6种水化离子的浓度作为识别矿井水源指标依据(单位均为mg/L),采集到39组水化数据,随机选取4组作为测试样本,如表1所示;以剩余的35组作为训练样本,并以此构造训练模型。
由于采集到的水化数据样本的各项指标值有大有小,过大或过小的输入值将使节点的输出进入饱和区,因此,需将各指标进行归一化处理。将输入输出数据变换为[ -1,1]区间的值,变化式如下:
式中:y i表示输入数据,xmin表示输入数据样本中的最小值,X max表示输入数据样本中的最大值,在Matlab中采用mapmlnmax函数来实现。
2.2模型设计
增加网络中间层数会提高网络的精度,但亦会使网络复杂化,牺牲其训练时间;具有一个隐含层的神经网络能够以任意精度表示任何连续函数。在这里BP与Elman神经网络模型均选用具有3层的网络,中间层数为1;作为识别矿井水源的水化指标依据为6种,输入节点数为6;输出节点数为4,输出为(0,0,0,1)、(0,0,1,0)、(0,1,0,0)、(1,0,0,0),其分别对应二灰和奥陶纪含水层(S1)、八灰含水层(S2)、顶板砂岩含水层(S3)、第四系含水层(S4)。
1)对于BP神经网络,根据经验公式确定隐含层节点数为8,采用试错法来确定隐含层为5、6、7、8、9、10时的收敛程度,这里隐含层的传递函采用非线性S型的logsin函数,输出层采用线性purelin函数,目标误差设置为0. 000 000 01,最大训练次数设置为1 000,测试结果如表2所示。
由表2可知,隐含层节点数为6收敛速度最快,误差最小,因此隐含层个数设置为6,BP神经网络结构如图2。
训练函数的确定:为了测试不同训练函数对迭代次数和收敛精度的影响,以便选取更好的训练函数,分别对trainlm、traingd、traingdm、traingda、traingdx进行测试,测试结果如表3所示。
由表3可知,Levenberg - Marquardt法迭代次数少,收敛精度高,因此选用trainlm作为训练函数。
学习率的确定:学习速率过大可能导致网络系统的不稳定,学习速率过小又可能导致较慢的收敛速度,或者增加收敛步数。在这里只改变学习速率,其他参数不变,分别进行学习速率为0. 01、0.02、0.04、0.06、0.08、0.1、0.2的训练,观察训练次数和收敛精度,运行结果如表4所示。
学习速率为0. 04、0.06、0.2的训练步数都比较少,而0. 04和0.06收敛性比较好,综合比较将学习速率设置0. 04。经过以上分析,最终确定了BP神经网络参数。
2)对于Elman神经网络,为了体现Elman神经网络在增加了承接层后的能够提高突水水源识别的精度,兼顾模型间的公平比较原则,这里仍选用与BP神经网络相同的参数设置。
2.3 训练与仿真
1)神经网络的训练
采用newff函数创建BP神经网络,训练结果如图3。
采用newelm函数创建Elman神经网络,训练结果如图4。
2)神经网络模型的仿真
BP神经网络仿真结果如表5所示。
Elman神经网络仿真结果如表6。
从图3和图4可知,BP神经网络经过14步训练后达到收敛,网络误差为9. 738 6e1.Elman神经网络经过17步训练后达到收敛,网络误差为3. 794 9e-9,可以看到BP神经网络经收敛速度比Elman神经网络快,前提条件是对BP神经网络进行了参数的优选从而使BP神经网络性能达到最佳,而Elman神经网络并没有进行参数的优化(为了兼顾两种模型间的公平比较原则),但也可以看出,Elman神经网络误差要小于BP神经网络误差,这说明所建立的Elman神经网络模型输出精度更高,拟合能力更强;更能克服训练陷入局部极小点,从而确保训练误差收敛程度更好。
从表5和表6可知,BP神经网络与Elman神经网络均对4组测试样本进行了准确识别,但也要看到,BP神经网络的4组输出的平均误差之和为0. 000 134 7,而Elman神经网络的却为0.000 024 6,相比较后者误差更小。
图5为二者的平均误差折线图,可以看出Elman神经网络的平均误差曲线较为平稳,且识别精度要更高一些,综合说明Elman神经网络具有很好的泛化性。
3 结 论
1)结合矿井水化学资料,分别建立BP神经网络和Elman神经网络的识别模型,并进行突水水源的识别应用结果表明:在样本训练过程中,二者的误差收敛速度相差3步,较为接近,这是在最优的BP神经网络与采用相同参数设置的Elman神经网络前提条件,从侧面上反映出Elman神经网络优秀的稳定性,所得的结论不冲突,在训练误差收敛程度上,Elman神经网络比BP神经网络更好一些,拟合能力更强;在样本仿真中,Elman神经网络识别精度更高,泛化性更好。
2) BP神经网络是一种静态网络,网络的输出仅仅是当前输入的非线性映射,而Elman神经网络在BP神经网络基础上增加了一个承接层,通过承接层的延迟与储存,使Elman神经网络对历史状态数据具有敏感性,增强了网络动态记忆功能。对于解决同样的问题,在相同的中小规模网络的条件下,Elman神经网络模型比BP神经网络模型具有更快的收敛速度,分类精度更高,更适合于解决模式分类问题。
3)应看到,矿井经过多年开采,地下各水层水质会因为地下水的流动和开采扰动发生一定变化,具有动态变化性。按时间序列,收集矿井历史突水点水化数据,将具有非线性动态特性Elman神经网络应用于突水水源的识别,可以生动、直观的反映地下水系统动态性,对探寻地下水运移规律具有一定的应用潜力。
下一篇:返回列表