彭东,罗周全,秦亚光,王婷玉
(中南大学资源与安全工程学院,湖南长沙410083)
摘要:以2005 - 2014年湖北省工矿企业事故死亡人数为基础,通过对时间序列图分析可知,该省工矿企业事故具有明显的周期性、季节性。另外,依据安全系统特征属性,系统近期的状况相对远期的状况对未来预测更具有影响力。因此,各个季节数据的权重应有所不同。综合考虑以上两种情况,提出对4个季节建立不同的线性加权线性回归模型,并进行组合,形成加权线性回归模型组,进而对2015 - 2016年各个季度进行预测。最后,与传统的时间序列分析方法比较可知,加权线性回归模型组的方法建立的模型显著性、拟合度更高,并且模型的可读性更强、更简单。
关键词:加权线性回归;模型组;工矿事故;时间序列;预测
0 引言
近年来,湖北省工矿企业安全事故起数、死亡人数、受伤人数指标总体有明显下降趋势,全省生产经营状况持续向好。工矿企业安全事故分类主要分为煤矿、金属与非金属矿、建筑业、危险化学品、烟花爆竹等其他方面事故。工矿企业事故死亡人数中,五大高危行业占主体,达到60%左右。高危行业危险系数较其他行业高,事故发生率较高,财产损失较大,短时间难以恢复或无法恢复。因此,工矿企业安全事故进行统计分析及预测对加强湖北省安全生产监督管理工作具有重要指导意义。
传统的事故分析预测方法主要有回归分析预测法、时间序列预测法、神经网络预测法及灰色预测法等;前者模型简单,但拟合精度不够,后面三者模型拟合度一般较高,但模型过于复杂,可读性差。另外,这些传统的方法都没有考虑实验数据地位不同的问题。本文提出的加权线性回归模型组方法,弥补了传统方法的不足,实现了精度高与模型简单与一体的特点,具有明显的优越性。
本文采用EXCEL、SPSS与MATLAB数据分析软件相结合,对湖北省各月的工矿企业安全生产事故发展趋势进行分析,具有明显的周期性、季节性。另外,由于在实际问题中,测得的所有试验数据,精度和地位并不是等同的。结合上述两个特点,本文对2005 - 2014年各个季度的事故死亡人数进行分析,通过SPSS对权重进行估计,选择模型拟合度最高的加权线性回归模型,建立模型组。并与时间序列模型进行比较,加权线性回归模型组更加简单,拟合程度更高,预测结果也更加精确。
1 加权线性回归模型组分析原理
1.1 加权最小二乘法
在实际问题中测得的所有实验数据,并不是总是等精度、等地位的。显然,对于精度较高或地位较重要的那些数据(x。,yi)应当给予较大的权重。在这种情况下,求给定数据的拟合曲线,就要采用加权最小二乘法。
采用最小二乘解的求法,仍可得法方程组:但其中作为特例,如果选用的拟合曲线为,那么相应的法方程组为:
可以利用SPSS,对模型权重进行估计,选取能使对数似然函数最大化的对应幂,作为权重函数W(X)。同时,根据实验数据的周期变化规律选择合适的模型个数t,建立模型组Y:
2应用实例
2.1 湖北省工矿企业安全事故分析
本文收集的数据主要是湖北省安全生产监督管理局对外公布的事故统计数据。通过收集整理,得到了2005 - 2014年的湖北省工矿企业安全事故各月、各季度的事故死亡人数。统计结果如图1、图2所示。
通过图1可知,工矿企业事故的死亡人数具有明显周期性、季节性;波动幅度逐年减小;死亡人数整体呈下降趋势。根据图2可知,事故各季度死亡人数历年呈下降趋势,第一季度是事故少发时期;第四季度事故发生频繁;二三季度居中。通过以上分析,选择以湖北省工矿企业4个不同季度的死亡人数建立4个加权线性回归模型,形成模型组,进行统计分析及预测。
2.2 加权线性回归模型组分析及预测
本文利用SPSS,以自变量幂的-4~-6之间,并且以0.5为进度对模型权重进行估计。通过分析,4个加权线性回归模型分别当幂值等于2、0.5、1、0.5时,可以使对数似然值最大化。结合SPSS和MATLAB等分析软件,对湖北省工矿企业各个季度的死亡人数进行加权线性回归分析以及显著性检验,4个季度加权线性回归模型分析结果见表1、表2、表3。
由表1可知,4个季度的加权线性回归模型R2与调整后的R方均大于0. 85,表示模型线性关系非常显著。由表2可知,4个季度的P值(Sig)=0. 000<0.05,说明了模型拟合度很高。由表3参数检验中,显著性水平=0. 000<0.05,说明系数显著不为0,从而得出4个季度加权线性回归模型的表达式分别为:
T1、T、T3、T分别代表4个季度的不同年份(时间),Y、Y、Y3、Y4分别代表4个季度对应不同年度的死亡人数。4个季度的观测值与所建立的加权线性回归模型如图3—图6所示。
由图3—图6可知,虽然湖北省各季度工矿企业事故死亡人数都呈明显下降趋势,但第二、三季度较之其他季度下降更快。因此,工矿企业应进一步加强对第一、四季度的安全管理工作,降低、预防事故发生概率。
2.3 时间序列分析
由于温斯特线性和季节性指数平滑法主要使用与中短期的预测。因此本文运用SPSS的时间序列预测,通过专家建模器,由软件选择拟合度最佳的模型类型。由此获得的预测模型类型为Winters加法模型。分析结果见表4、表5。
由表4可知,模型平稳的R2=0. 775,sig值=0. 331>0.05,说明该模型显著性较高,拟合度较好。由表5各参数显著性水平大于0. 05可知,参数显著非0。该时间序列的表达式为:
2.4两模型分析预测结果
为验证两种模型的准确性与实用性,并进行直观比较,本文利用2005 - 2014年的观测值分别与两种方法得到的拟合值、预测值结果进行对比分析,结果如下图7—图8所示。另外,两种方法得到的2015 - 2016年的预测值结果见表6。
3结论
1)通过比较两种模型的显著性可知,加权线性回归模型组建立的各个回归模型调整后的R2均大于0. 85>时间序列模型平稳的R2 (0. 775)。因此可知,加权线性回归模型组显著性水平高于时间序列模型。
2)就两种模型的表达式而言,时间序列模型参数之间存在迭代关系,表达式过于复杂,而加权线性回归模型组简单直观、可读性强。
3)对比加权线性回归模型组法与时间序列法的分析预测结果可知,两种方法得到的拟合值与观测值整体都比较吻合。但比较峰值与谷值可以看出,加权线性回归模型的拟合度明显要高于时间序列模型。
4)加权线性回归模型组方法适用的前提是分析数据具有一定的周期性、季节性,并且各周期或季度具有明显线性关系。因此,该方法在适用范围上存在一定的局限性。
5)通过加权线性回归模型分析结果可知,虽然各季度死亡人数都呈下降趋势,但第四季度下降趋势较弱,且是工矿企业事故高发期。另外,由2015 -2016年的预测结果可知,第四季度死亡人数将分别高达103、95人。因此可知,湖北省工矿企业的安全管理对降低、预防事故发生上确实取得了很大成效,但同时应更加注重对各年第四季度的安全生产监督管理工作。