1.什么是矩阵数据分析法
矩阵数据分析法(Matrix Data Analysis Chart),它是新的质量管理七种工具之一。
矩阵图上各元素间的关系如果能用数据定量化表示,就能更准确地整理和分析结果。这种可以用数据表示的矩阵图法,叫做矩阵数据分析法。在QC新七种工具中,数据矩阵分析法是唯一种利用数据分析问题的方法,但其结果仍要以图形表示。
数据矩阵分析法的主要方法为主成分分析法(Principal component analysis),利用此法可从原始数据获得许多有益的情报。主成分分析法是一种将多个变量化为少数综合变量的一种多元统计方法。
矩阵数据分析法,与矩阵图法类似。它区别于矩阵图法的是:不是在矩阵图上填符号,而是填数据,形成一个分析数据的矩阵。
它是一种定量分析问题的方法。目前,在日本尚广泛应用,只是作为一种“储备工具”提出来的。应用这种方法,往往需求借助电子计算机来求解。
2.矩阵数据分析法的原理
在矩阵图的基础上,把各个因素分别放在行和列,然后在行和列的交叉点中用数量来描述这些因素之间的对比,再进行数量计算,定量分析,确定哪些因素相对比较重要的。
3.矩阵数据分析法的应用时机
4.和其他工具结合使用
1.可以利用亲和图(affinity diagram)把这些要求归纳成几个主要的方面。然后,利用这里介绍进行成对对比,再汇总统计,定量给每个方面进行重要性排队。
2.过程决策图执行时确定哪个决策合适时可以采用。
3.质量功能展开。两者有差别的。本办法是各个因素之间的相互对比,确定重要程度;而质量功能展开可以利用这个方法的结果。用来确定具体产品或者某个特性的重要程度。
当然,还有其他各种方法可以采用,但是,这种方法的好处之一是可以利用电子表格软件来进行。
5.如何使用矩阵数据分析法
下面通过例子来介绍如何进行矩阵数据分析法。
1、确定需要分析的各个方面。我们通过亲和图得到以下几个方面,需要确定它们相对的重要程度:易于控制、易于使用、网络性能、和其他软件可以兼容、便于维护。
2、组成数据矩阵。用Excel或者手工做。把这些因素分别输入表格的行和列,如表所示。
3、确定对比分数。自己和自己对比的地方都打0分。以 “行”为基础,逐个和“列”对比,确定分数。“行”比“列”重要,给正分。分数范围从9到1分。打1分表示两个重要性相当。譬如,第2行“易于控制”分别和C列“易于使用”比较,重要一些,打4分。和D列“网络性能”比较,相当,打1分。…………如果“行”没有“列””重要,给反过来重要分数的倒数。譬如,第3行的“易于使用”和B列的“易于控制”前面已经对比过了。前面是4分,现在取倒数,1/4=0.25。有D列“网络性能”比,没有“网络性能”重要,反过来,“网络性能”比“易于使用”重要,打5分。现在取倒数,就是0.20。实际上,做的时候可以围绕以0组成的对角线对称填写对比的结果就可以了。
表1:矩阵数据分析法
A B C D E F G H 1 易控制 易使用 网络性能 软件兼容 便于维护 总分 权重% 2 易于控制 0 4 1 3 1 9 26.2 3 易于使用 0.25 0 0.20 0.33 0.25 1.03 3.0 4 网络性能 1 5 0 3 3 12 34.9 5 软件兼容 0.33 3 0.33 0 0.33 4 11.6 6 便于维护 1 4 0.33 3 0 8.33 24.2 总分之和 34.37
4、加总分。按照“行”把分数加起来。在G列内得到各行的“总分”。
5、算权重分。把各行的“总分”加起来,得到“总分之和”。再把每行“总分”除以“总分之和”得到H列每个“行”的权重分数。权重分数愈大,说明这个方面最重要,“网络性能”34.9分。其次是“易于控制”26.2分。
6.矩阵数据分析法案例分析
案例一:矩阵数据分析法在软件项目中的应用
软件缺陷的产生是由多方面的因素造成的,缺陷数据反映了开发过程中多个因素相互作用的对应关系。在实施了多个软件项目的开发以后,已经积累了一定数量的历史缺陷数据,我们如何利用这些数据找到开发过程中容易产生质量问题的环节和因素呢?如果只是粗略地看历史统计数据,是很难看出各项目之间及项目的生命周期各阶段的缺陷率的差异的。我们可以用这些历史数据来设计一个矩阵,用矩阵数据分析法就能求出多个项目的各个阶段产生缺陷率的高低,找到产生缺陷的关键因素,这样可以帮助了解引入的缺陷,从而对新开发的项目会引入的缺陷数做出一个相当合理的预测,达到控制缺陷率,提高软件质量的目的。随着实施的软件项目数量的增加,收集到的缺陷数据越来越多,生成的矩阵越大,对未来缺陷率预测和控制的准确性也就越高,软件整体质量呈螺旋式稳步上升。
下面通过一个例子来说明矩阵数据分析法在软件缺陷管理中的具体应用。为了确定软件缺陷主要出现在项目生命周期六个阶段中的哪几个阶段,我们对n个开发项目进行统计,每个项目计算六个阶段的缺陷密度,为了验证结果重复性,又将这n个项目分为Ⅰ、Ⅱ两组,每组n/2个项目,然后对数据求均值、标准差、相关系数、特征值、特征向量,得出三个主成分,也就确定了项目生命周期中出现大部分缺陷的几个阶段,为改进项目薄弱环节提供依据。详细步骤如下:
①将以往软件项目积累的历史缺陷数据进行分类、统计列表。各项目在生命周期各阶段的历史缺陷率数据见表3。
② 根据表3数据计算均值、标准差和相关系数,计算结果见表4。
③根据相关系数矩阵(表4)求特征值、特征向量和贡献率。由于计算量很大,方程的计算用计算机完成。计算结果见表5。
④ 分析计算结果。贡献率代表主成分的影响程度,数值越大代表性越大,特征向量表示项目与该主成分的关系。从表5可看到,第一、二、三主成分的贡献率达90.4% , 已代表所有变量的绝大部分,也就是说在项目开发过程中,软件缺陷主要出现在项目生命周期的需求、构架和设计阶段。这样由上述的主成分分析,找到了容易出现软件缺陷问题的阶段,在以后的改进过程中把注意力集中到特征值大的方面来,就可以有效地控制、预防软件缺陷问题。