作者;张毅
变电站全寿命周期成本(life cycle cost, LCC)建模是在保证可靠性的前提下,将变电站整个经济寿命周期内的全部费用归结为总成本的方法。介绍了全寿命周期成本在电力设备管理中的应用,并对LCC的建模方法及应用进行了一定的探索研究。运用全寿命周期理论和方法,
将全部设计要素综合,实现变电站系统整体最优。然而,由于中国现行的变电站投资机制和运行管理机制的局限.LCC技术要实现完全投入实践还需要一段时间,尤其是目前缺乏全面、精细的变电站全寿命周期成本的数学模型。
变电站全寿命周期成本建模对数据需求量较大,关联的环节众多,因此LCC建模不能一蹴而就,需要分阶段建模并逐步完善。目前,关于变电站全寿命周期成本建模的研究较少,建立了变电站全寿命周期成本数学模型,将变电站LCC成本分为初始成本、运行成本、故障成本和报废成本,但在建模时未考虑环境成本对变电站LCC的影响以及资金的潜在时间价值.
随着LCC建模划分的越来越精细,导致计算量增加,耗费人力物力巨大,成本划分也会受到人为主观的影响,使得LCC数学模型的客观性降低。因此,需要建立一种模型能够快速、客观的估算出变电站的LCC,来提高LCC估算的实用性。随着智能算法的兴起,采用非线性能力较为优异的神经网络来建立变电站LCC预测模型,选取了某些特征指标进行训练,解决了参数繁杂、估算难度大、客观性低等问题,预测模型有一定的效果。然而历史数据的匮乏导致变电站LCC建模符合小样本的特点,神经网络在小样本的情况下,容易陷入过拟合和局部最优,导致预测精度大为降低。
本文采用对求解小样本、非线性和高维数据回归拟合能力高的支持向量机回归模型来建立变电站LCC预测模型,该模型的预测精度取决于参数选择。但传统的参数选择法如交叉验证、误差界及统计方法,计算量大,在样本数据较多时更加费时。相比而言,遗传算法GA具有较好的全局搜索能力、并行性和较高的效率。因此通过遗传算法寻找模型参数的全局最优解,将所得到的最优参数组合作为LS-SVM的参数,有利于预测模型精度的提高。然后,建立了基于遗传算法优化最小二乘支持向量机的变电站LCC预测模型.选取变电站全寿命周期各阶段的一些具有代表性的指标作为预测模型输入向量,通过算例对比LS -SVM模型、BP神经网络模型和GA优化LS-SVM模型的预测结果及性能指标,验证了GA优化LS-SVM预测模型的优越性。
1 最小二乘支持向量机算法
支持向量机( support vector machines,SVM)是基于统计学习理论的VC维理论和结构风险最小化原则的一种小样本统计学习理论建模方法。由于SVM具有较强的泛化能力和全局能力,克服了其他机器学习方法的泛化能力差、过拟合和容易陷入局部最优等缺点,该方法已经应用于变压器故障诊断、电力负荷预测等领域,并具有理想的科学指导意义。
最小二乘支持向量机算法是Suykens提出的一种对标准支持向量机的扩展.LS-SVM算法采用平方和误差损失函数代替标准支持向量机的不敏感损失函数,同时实现了将标准SVM算法中的不等式约束转化为等约束。因此,LS-SVM算法将二次规划问题化简为求解线性方程组,明显降低了求解的复杂性,提高了计算速度。
设训练样本集D={(xi,yi)∣i=1,2,…,n},xi和yi分别为输入和输出样本数据,n为样本数。设置非线性函数p(·),它可以将输入样本从原空间R映射到高维特征空间,因此特征空间中的SVM模型选用的线性回归函数如式(1)。
y(x)=w·p(x)+b(1)
由于结构风险最小化原理,另外同时考虑到拟合误差和函数复杂程度,那么LS-SVM回归模型如式(2)、式(3)。
式中:ei为误差,又称松弛因子;y为正规化参数,又称惩罚因子,因为它代表对超出误差样本的惩罚程度。
引入拉格朗日方程,将上述带约束条件的优化问题转化为无约束条件的优化问题,具体过程,最终可得到LS-SVM的线性回归方程。
式中:a和b的值可由最小二乘法求得。
在求解过程中,为了避免求解复杂的非线性映射函数.引入了径向基核函数(radial basis function,RBF)替代高维空间中的点积运算,可以大大减少计算量,而且RBF核函数容易实现SVM的优化过程,因为它的每个基函数的中心与支持向量一一对应.且这些支持向量和权值都可以通过算法得到、该函数为
范数。因此.LS-SVM的线性回归方程变为
2 基于GA优化的LS-SVM变电站LCC预测模型
2.1 变电站LCC的LS-SVM模型
LS-SVM在应用过程中,参数的选取会影响模型的预测精度,而传统的参数选取一般是根据研究者的经验,主观性较强。遗传算法的优点是较强的全局优化能力和鲁棒性,适合对SVM参数进行优化选取。
本文根据支持向量机泛化能力强及遗传算法具有很强的全局优化搜索能力等特点,提出一种基于遗传算法优化支持向量机参数选取的变电站LCC预测模型。
全寿命周期成本管理近年来才引起广大研究人员的关注,因此变电站全寿命周期成本方面缺乏多年的数据积累,符合小样本特性,而且变电站的全寿命周期成本随各参数的变化呈高度非线性的特点,因此利用LS-SVM算法来建立变电站LCC预测模型是合理的。
在建立变电站LCC预测模型时,特征参数的选取很重要,若参数过多,会增加计算量,降低算法的泛化能力,参数过少则影响预测精度。对变电站重要设备变压器进行全寿命周期成本建模.并通过综合灵敏度分析系,得到各参数对全寿命周期的敏感度大小。建立了变电
站效能一成本评价体系,从全寿命周期的角度,分析了相关参数对变电站LCC的影响。综合已有的资料,本文参照已有的全寿命周期模型选取具有代表性的15个变量作为LS-SVM的输入向量,选取变电站LCC总成本作为输出变量来建立预测模型。输入向量和输出向量的物理意义见表1.
根据最小二乘支持向量机算法理论.可得到变电站LCC的LS-SVM的回归支持向量机模型为
该回归支持向量机的结构如图1所示。模型的预测输出是变电站LCC总成本,每个中间节点对应一个支持向量,x1,x2,…,xn为输入变量,a2为网络权重。
2.2 GA优化LS-SVM模型参数
在应用过程中,支持向量机参数选取的效果会直接影响SVM的泛化推广能力和模型预测精度。由于缺乏一种关系式来指导SVM模型参数的选取,一直以来SVM模型参数的选择是该方法推广应用的最大障碍。传统的SVM参数选取具有一定的盲曰性,因为大多是人们通过多次试验或者根据经验人工选取较优的参数。LS-SVM的参数组合y与σ2的选取对预测性能影响较大。本文采用遗传算法通过全局搜索得到LS-SVM模型参数的最优解,并将该解作为LS-SVM的模型参数,利用GA优化后的LS-SVM模型预测变电站的全寿命周期成本。
由于惩罚因子y和核参数σ2的取值对模型预测精度有很大的影响,因此这2个参数的选取是本文研究的重点。y越小,样本精度惩罚值就越小,此时样本训练误差变大,但模型的泛化能力变好。本文采用RBF核函数时,σ2越大则代表支持向量之间的影响较强,容易导致欠学习,σ2越小时模型复杂程度增大,会使得泛化能力变差.容易导致过学习。
本文将参数y和σ2寻优区间分别设定为[O,100]和[0,500]。各操作算子设定为:选择算子采用随机遍历抽样,交叉算子采用单点交叉算子.变异算子采用基本位变异算子.各参数设定为:种群规模为20,最大进化次数为200,交叉概率为0.9,变异概率为0.01,判断终止精度为10-4。
关于变电站LCC预测模型的性能和预测效果,本文选取均方误差(mean squared error,MSE)、平均相对误差eMAPE来评价。当预测结果的MSE和eMAPE:越小,表明模型的预测性能效果越好。即有
式中:n为训练样本数;yi'为预测值;yi为真实值。
2.3 GA优化LS-SVM模型预测步骤
本文建立的变电站LCC预测模型的预测步骤如图2所示。
(1)数据样本归一化。因为仿真数据变量有不同的量纲而且数量级差距较大,在建立LS -SVM回归模型前要对训练样本和测试样本归一化处理。
(2)设置LS-SVM模型参数寻优区间以及遗传算法的初始化和参数设置。
(3)利用GA算法对LS-SVM的模型参数进行寻优。将训练样本的均方误差MSE作为GA的适应度函数,通过选择、交叉和变异等遗传操作来判断当前是否满足目标精度要求,若满足条件则通过解码输出LS-SVM模型的最优参数y和盯σ2组合,否则重新用遗传算法进行计算。
(4)建立参数优化后的LS -SVM预测模型。根据步骤(3)得到的最佳参数y和σ2,利用训练样本,采用RBF核函数训练LS-SVM预测模型.最后根据所得的预测模型,输入测试样本进行预测,并对输出数据反归一化处理。
(5)根据预测值和实际值的比较,采用评价预测模型的性能指标MSE和eMAPE对所建预测模型进行评价。
3算例分析
3.1 数据来源
数据来源于国网下属某省级电网公司科技项目甲方提供,包括34组变电站全寿命周期成本相关参数:初始投资成本、变电站寿命周期、运行维护费率、报废率、社会折现率、通货膨胀率、设备年平均故障率、年故障中断时间、年故障中断功率、年平均故障修复成本、年平均检修成本、单位停电量赔偿费用、年平均非计划停电量、年平均故障修复时间、电价和LCC总成本。变电站LCC相关参数对应编号见表l。本文将34组数据分为2个部分.前30组数据作为训练样本.最后4组数据作为测试样本。由于篇幅所限,表2展示LCC部分训练样本,表3展示LCC的4组测试样本。
3.2 数据预处理
为了消除变电站LCC各参数由于不同量纲对预测模型的预测速度和精度的影响,在建模之前,要对所有样本数据进行归一化处理.归一化公式如式(11)。式中:xi为样本初始值:xi为归一化后的值;xmax和xmin分别为每个样本数据的最大值和最小值。
3.3参数优化对比
本文针对变电站的LCC,分别采用BP神经网络、传统LS-SVM建模和GA优化LS-SVM建模,对相同的样本集进行训练和预测。对模型参数组合y和σ2进行寻优,即为找到优化算法适应度较小时对应的模型参数的取值组合,传统LS -SVM参数选取采用网格搜索法.先粗略寻找最优参数组合,再进行精细的选择。此时设定参数y和σ2初始搜索范围分别为[0,100]和[0,500],判断终止精度为10-4。采用GA优化LS-SVM模型时,选用RBF核函数,寻优区间分别设定为[0,100]和[0,500],遗传算法参数设定种群规模为20,最大进化次数为200,交叉概率为0.9.变异概率为0.01.判断终止精度为10-4。表4为网格搜索寻优法和GA优化寻优法所得到的模型参数y和σ2组合值。
图3为GA优化LS-SVM的进化曲线。从图3可以看到,当进化代数为100次终止进化,此时的适应度值MSE接近最佳适应度值.凶此此时得到的LS-SVM参数组合为最优参数组合.GA优化后参数组合效果最佳。
3.4预测结果分析
本文分别采用基于GA优化的LS-SVM变电站LCC预测模型、LS-SVM算法建模和BP神经网络算法建模,对相同的样本集进行训练和预测。将这3种算法最终得到的预测值与实际值进行对比,通过平均相对误差eMAPE来评价模型的预测效果。
采用BP神经网络进行预测时,经过多次测试.确定BP神经网络的输入层节点数为15,输出层节点数为1.隐层节点数为15,隐层传递函数用tansig函数,输出层传递函数用purelin函数,学习速率为0.01.目标精度为10-4,训练函数选用Levenberg-Marquardt算法。
3种预测模型的预测值与实际值的对比情况见表5和图4。从表5和图4可以看出,与传统LS-SVM和BP神经网络模型相比,GA优化LS-SVM的预测值更加贴近变电站LCC实际输出值,预测效果最优。
图5为3种预测模型预测值与实际值的相对误差曲线。由图5可知,传统LS-SVM预测模型的预测值和实际值的相对误差分别是2.90 010、3.88%、2.610/0和5.20%,GA优化LS -SVM的预测模型的预测值和实际值的相对误差分别是0.41%、2.99%、0.97%和3.65%,BP神经网络预测模型的预测值和实际值的相对误差为1.77%、4.89%、3.23%和4.91%。由此可见,GA优化LS-SVM的预测精度明显高于BP神经网络和传统LS-SVM的预测精度,证明采用遗传算法优化支持向量机的参数的选择对预测模型精度的提高有较好的作用。
3种模型的预测性能结果对比见表6,用eMAPE进行模型预测性能的评价。从表6可以看出,GA2.01%,远小于传统LS -SVM的平均相对误差3.65%和BP神经网络的评价相对误差3.70%, GA优化LS-SVM预测模型具有更高的预测精度和更强的适应性。
由于变电站LCC建模符合小样本的特点,而神经网络采用经验风险最小原则.在小样本的情况下泛化能力较差.容易陷入局部最优导致模型预测精度得不到保证。GA优化LS-SVM预测模型,不仅避免了传统LS-SVM模型参数选取的盲目性,而且采用结构风险最小原则.适用于小样本的情况下.提高模型泛化能力和预测精度.因此GA优化LS-SVM预测模型性能最优。
4结语
本文将支持向量机和遗传算法相结合,建立了基于GA优化最小二乘支持向量机的变电站LCC预测模型,避免了LS-SVM模型参数选取的盲目性。通过算例,对比了传统LS-SVM预测模型、BP神经网络预测模型和GA优化LS-SVM预测模型的预测结果及性能指标.验证了GA优化LS-SVM预测模型性能的优越性。实现了对变电站LCC快速、高效的预测.在电网规划时,首先通过调研影响变电站全寿命周期成本的各参数数值,进而利用该模型对变电站全寿命周期成本进行科学的评估,合理规划预算成本。
5摘要:变电站设备多、投入资金大,建立合理的变电站LCC预测模型,是提高电网资产管理效率的重要手段,其中如何保证算法收敛能力和模型预测精度是目前的研究难点。建立了基于GA优化最小二乘支持向量机的变电站LCC预测模型,选取变电站全寿命周期各阶段的一些具有代表性的指标作为预测模型输入向量,变电站LCC总成本作为输出向量.通过算例,对比了传统LS-SVM预测模型、BP神经网络预测模型和CA优化LS-SVM预测模型的预测结果及性能指标,验证了GA优化LS-SVM预测模型性能的优越性,以便在新建变电站时,实现快速、高效的变电站LCC的预测,有助于实现电网规划时变电站的经济技术评估。
下一篇:返回列表