关于相关向量机软件可靠性建模中失效数据选择的研究

2016-02-23 10:56:36 安装信息网

作者：张毅

1 引言

软件可靠性模型是指为预测软件可靠性，利用已有失效数据，根据对软件失效行为的假设，采用一定数学方法建立软件可靠模型的过程。近年来，研究者提出了许多软件可靠性模型，这些模型都是基于一些对软件的开发环境和使用环境的关键假设，利用测试获得的软件失效信息，对软件系统的失效过程进行建模，评估软件系统的可靠性，预测软件实际工作时的现场行为。软件可靠性是最重要的可信性属性之一，而软件可靠性建模是目前提高软件可靠性水平主要工具之一。软件可靠性模型多是基于一些对软件的开发环境和使用环境的关键假设，利用测试获得的软件失效信息，对软件系统的失效过程进行建模，评估软件系统的可靠性水平，预测软件实际工作时的现场行为。随机过程模型是软件可靠性建模研究中最广泛使用的，也是实际项目中应用最广泛的一类，目前这类模型的绝大部分研究工作集中于模型的统一、对非齐次泊松过程类(non-homogeneous Poisson process，NHPP)等模型的改进、可靠性成本模型等，模型改进的出发点是提出更加合理的假设以提高模型预测精度，如考虑测试环境与实际运行环境的差别、考虑故障的相关性、不完美调试以及测试者学习能力、测试效用函数、测试工作量与覆盖率等。此外，也有学者提出采用马尔可夫更新过程、广义Pareto分析、排队论模型、顺序统计量模型、多维随机过程等来描述软件失效过程，取得了很多不错的研究成果。接着，人们尝试利用更多更复杂的数学方法对软件失效行为进行建模及分析，如人工神经网络、未确知理论、混沌理论、时间序列、模糊数学理论、遗传编程、强化学习等，相比随机过程模型，这些方法可以取得更好的预测性能或拟合效果，但在实际软件系统可靠性评估的应用还较为少见。最近，研究者开始考虑核函数方法在软件可靠性建模方面的研究，最主要的包括支持向量机( support vector mlachines，SVM)、相关向量机(relevance vector machine，RVM)等方法的应用，核函数方法一般对软件失效时刻与在它之前的发生m个失效时刻数据之间的对应关系进行建模。Tian等把SVM引入软件可靠性建模中，Xing等、Yang等、Yuan等f19J、Park等对SVM用于可靠性建模进行了适当的改进。楼俊钢等人使用RVM等核函数技术在软件可靠性建模方面做了一些研究工作。与其他方法相比，SVM、RVM等基于核函数模型具有自适应能力和学习功能．通过归纳学习和训练，能发现数据输入与输出之间的关系，经过自适应调整求取问题的解，适用于系统开发环境较复杂，对问题的机理不能用数学模型表示的系统，对大量原始数据的处理往往表现出极大的灵活性和自适应性，容错和抗干扰能力较强，在软件可靠性建模问题上也得到了较好地应用，在模型适用性以及评估预测能力上均有较好的表现，是目前软件可靠性模型研究中较为重要的一个突破口。笔者在使用核函数理论进行软件可靠性预测的前期研究中，发现用于建模的软件失效数据数量的改变对模型的预测性能和适用性有较大影响。然而目前的研究工作中，还很少有专门针对软件失效数据数量选取的工作，本文应用Mann-Kendall及配对T检验等统计方法在5个常用软件失效数据集上对基于相关向量机的软件可靠性预测模型中m值选取问题进行研究。

2基于相关向量机的软件可靠性建模

预测的具体实现步骤如图1所示。具体介绍如下。

2.1 使用的数据集和性能比较标准

采用10个来自不同类型软件的失效数据集旧对m不同时模型预测性能进行实验分析，见表1，在实验过程中，取所有数据集的前2/3作为学习数据，对后面1/3数据进行预测后与真实数据进行比较。

3实验分析与比较

3.1 Mann-Kendall检验

3.2检验结果及趋势分析

表3列出了在m取值分别为6，7，…，30情况下各个数据集上模型的预测AE值，图3显示了其变化趋势。模型中盯2的初始值为1，a。(/=1，2，3，…，m)的初始值均为0.5，r的取值为1、10以及表2中的值。从表3中可以看出，随着m值的不同，模型预测性能也有极大差异。例如，在使用数据集1、r =3.8时，AE的值在0.87(m=9)与2.42(m,=28)之间浮动；使用数据集4、r=l时，AE的值在1.68(m=13)与6.15(m=25)之间浮动。

表4中给出了各数据集上m值变化时的Z统计量及置信区间为95%（a=0.5，五n=1.96）时的变化趋势分析。从表4中可以看出，m值增加时，在各数据集的AE值均存在上升趋势，说明随着m的增加，模型的预测性能存在下降的趋势。合理的解释是，最近的失效数据更能反映失效过程中的最新特性，早期失效数据对预测未来短期失效行为作用较小，现时失效时间数据能比很久之前观测的失效时间数据更好地用于预测未来。

3.3配对r检验

本节将设计随机化实验，采用配对r检验的方法找出10个数据集上模型预测能力相对较好的m值。配对r检验的过程，是对两个同质的样本分别接受两种不同的处理，判断不同的处理是否有差别，实验中，将m值作为处理，判断其不同时模型预测能力是否有差别。令{x}、{Y）为m值取值集合，定义集合运算>，Ⅸ}>{y}表示采用集合x中的数值比采用集合Y中数值具有更好的预测性能。实验中，把m值分成5组：

{A}={6,7,8,9,10}

{B}={11,12,13,14,15}

{C}={16,17,18,19,20}

{D}={21,22,23,24,25}

{E}={26,27,28,29,30} ,

配对 10次:

4结束语

基于相关向量机理论，对软件失效时间数据与在其之前发生的m个失效时间数据进行建模，对10个数据集上用于建模的失效数据数量进行实验研究。首先，通过Mann-Kendall检验发现，m值变大时，模型预测性能存在下降趋势，然后采用配对T检验发现，在10个数据集上，m∈{6，7，8，9，10)时，模型具有最好的预测性能。

进一步工作包括以下内容：采用模糊遗传算法、粒子群算法或者模拟退火算法等优化技术对核函数参数的自动赋值算法进行研究；适合于软件可靠性建模的核函数选择及构建．进一步提高模型预测性能。

5摘要：基于核函数的软件可靠性模型一般对软件失效时间数据与发生在其之前的m次失效时间数据的关系进行建模，着重研究了m取值不同时，其对核函数可靠性模型预测能力的影响。在5个不同类型失效数据集上，采用Mann-Kendall检验观测到m值增大时模型预测能力逐渐下降，说明现时失效时间数据能比较久之前观测的失效时间数据更好地用于预测未来，通过把m的取值划分成几个区间，运用配对T检验进行实验研究，结果表明当mE{6，7，8，9，10）时，模型能够得到最好的预测性能。

关键字：

上一篇:关于酸性亚硫酸盐与预水解硫酸盐法溶解浆生产工艺及产品性能的研究

下一篇:返回列表

关于相关向量机软件可靠性建模中失效数据选择的研究

信息筛选

行业资讯月点击排行

展会信息月点击排行

招商信息月点击排行