首页 资讯 招标 项目 展会 更多

位置:首页 > 新闻频道 > 技术动态


相关向量机软件可靠性建模中失效数据选择

2015-11-30 10:31:51 安装信息网

相关链接: 中国安全网 中国质量网 中国论文网 中国资讯网

杨小明,楼俊钢,沈张果,胡文军

(1.湖州师范学院信息工程学院湖州313000;

2.浙江大学控制科学与工程学系杭州310058)

摘要:基于核函数的软件可靠性模型一般对软件失效时间数据与发生在其之前的m次失效时间数据的关系进行建模,着重研究了m取值不同时,其对核函数可靠性模型预测能力的影响。在5个不同类型失效数据集上,采用Mann-Kendall检验观测到m值增大时模型预测能力逐渐下降,说明现时失效时间数据能比较久之前观测的失效时间数据更好地用于预测未来,通过把m的取值划分成几个区间,运用配对T检验进行实验研究,结果表明当mE{6,7,8,9,10)时,模型能够得到最好的预测性能。

关键词:软件可靠性预测模型;相关向量机;核函数;软件失效数据;Mann-Kendall检验

1  引言

    软件可靠性模型是指为预测软件可靠性,利用已有失效数据,根据对软件失效行为的假设,采用一定数学方法建立软件可靠模型的过程。近年来,研究者提出了许多软件可靠性模型,这些模型都是基于一些对软件的开发环境和使用环境的关键假设,利用测试获得的软件失效信息,对软件系统的失效过程进行建模,评估软件系统的可靠性,预测软件实际工作时的现场行为。软件可靠性是最重要的可信性属性之一,而软件可靠性建模是目前提高软件可靠性水平主要工具之一。软件可靠性模型多是基于一些对软件的开发环境和使用环境的关键假设,利用测试获得的软件失效信息,对软件系统的失效过程进行建模,评估软件系统的可靠性水平,预测软件实际工作时的现场行为。随机过程模型是软件可靠性建模研究中最广泛使用的,也是实际项目中应用最广泛的一类,目前这类模型的绝大部分研究工作集中于模型的统一、对非齐次泊松过程类(non-homogeneous Poisson process,NHPP)等模型的改进、可靠性成本模型等,模型改进的出发点是提出更加合理的假设以提高模型预测精度,如考虑测试环境与实际运行环境的差别、考虑故障的相关性、不完美调试以及测试者学习能力、测试效用函数、测试工作量与覆盖率等。此外,也有学者提出采用马尔可夫更新过程、广义Pareto分析、排队论模型、顺序统计量模型、多维随机过程等来描述软件失效过程,取得了很多不错的研究成果。接着,人们尝试利用更多更复杂的数学方法对软件失效行为进行建模及分析,如人工神经网络、未确知理论、混沌理论、时间序列、模糊数学理论、遗传编程、强化学习等,相比随机过程模型,这些方法可以取得更好的预测性能或拟合效果,但在实际软件系统可靠性评估的应用还较为少见。最近,研究者开始考虑核函数方法在软件可靠性建模方面的研究,最主要的包括支持向量机( support vector mlachines,SVM)、相关向量机(relevance vector machine,RVM)等方法的应用,核函数方法一般对软件失效时刻与在它之前的发生m个失效时刻数据之间的对应关系进行建模。Tian等把SVM引入软件可靠性建模中,Xing等、Yang等、Yuan等f19J、Park等对SVM用于可靠性建模进行了适当的改进。楼俊钢等人使用RVM等核函数技术在软件可靠性建模方面做了一些研究工作。与其他方法相比,SVM、RVM等基于核函数模型具有自适应能力和学习功能.通过归纳学习和训练,能发现数据输入与输出之间的关系,经过自适应调整求取问题的解,适用于系统开发环境较复杂,对问题的机理不能用数学模型表示的系统,对大量原始数据的处理往往表现出极大的灵活性和自适应性,容错和抗干扰能力较强,在软件可靠性建模问题上也得到了较好地应用,在模型适用性以及评估预测能力上均有较好的表现,是目前软件可靠性模型研究中较为重要的一个突破口。笔者在使用核函数理论进行软件可靠性预测的前期研究中,发现用于建模的软件失效数据数量的改变对模型的预测性能和适用性有较大影响。然而目前的研究工作中,还很少有专门针对软件失效数据数量选取的工作,本文应用Mann-Kendall及配对T检验等统计方法在5个常用软件失效数据集上对基于相关向量机的软件可靠性预测模型中m值选取问题进行研究。

2.1  使用的数据集和性能比较标准

采用10个来自不同类型软件的失效数据集旧对m不同时模型预测性能进行实验分析,见表1,在实验过程中,取所有数据集的前2/3作为学习数据,对后面1/3数据进行预测后与真实数据进行比较。

    使用软件可靠性预测模型性能分析中最常用的指标平均相对预测误差(average relative prediction error,AE)对模型性能进行评价,AE的值越小说明模型的预测能力越强,计算式为:,其中,n表示失效数据集总共记录的失效次数,%表示用于核函数学习的失效次数,f。表示第i次失效时间估计值而“失效时间实测值。

2.2核函数参数选取

    前期工作表明模型中选用高斯核函数 时可以取得最好预测效果,,>o是高斯核函数的带宽参数。核函数参数选取是一个最优化问题,采用网格搜索法进行核函数参数选择,令r∈[r1,r2],设置变化步长为L,选取其中预测效果最好的值作为模型参数。在数据集1。数据集5上采用不同的r值进行的实验研究结果如图2所示,其中,r,,r:,‘的取值分别为0、12和0.1,其余取值如下:的初始值均为0.5,盯2的初始值为1。从图2中可以看出,r的取值对模型预测性能有较大的影响,本文实验中对5个数据集上r的取值见表2。

3实验分析与比较

4结束语

    基于相关向量机理论,对软件失效时间数据与在其之前发生的m个失效时间数据进行建模,对10个数据集上用于建模的失效数据数量进行实验研究。首先,通过Mann-Kendall检验发现,m值变大时,模型预测性能存在下降趋势,然后采用配对T检验发现,在10个数据集上,m∈{6,7,8,9,10)时,模型具有最好的预测性能。

    进一步工作包括以下内容:采用模糊遗传算法、粒子群算法或者模拟退火算法等优化技术对核函数参数的自动赋值算法进行研究;适合于软件可靠性建模的核函数选择及构建.进一步提高模型预测性能。

关键字:

上一篇:同频异构femtocell联合子信道和功率分配算法

下一篇:成果介绍: 凹凸棒黏土助留助滤效果研究

行业资讯月点击排行

展会信息月点击排行

招商信息月点击排行

首页 资讯 招标 项目 展会
关于我们 | 广告服务 | 友情连接 | 联系我们
触屏版 电脑版
安装信息网 www.36qyk.cn.