数据挖掘与软件测试

上一篇 / 下一篇  2007-05-28 21:02:49

   最近看数据挖掘方面的资料比较多,我觉得在我们软件的质量保证上也可以运用这项技术.

   首先,就从数据挖掘的定义说起:数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。

   这么说,可能没有接触过数据挖掘的人看得不是很明白,这里引用一下Hand et al. (2000) 的说法"数据挖掘是一种在大型数据库中寻找你感兴趣或是有价值信息的过程",这样可能更容易被理解.接触过数据挖掘的人可能都知道啤酒和尿布的故事,我认为这可以说是数据挖掘中的经典案例了,很多人都认为啤酒和尿布根本是不搭界的两个事物,但是商场通过对两者销量的分析居然巧妙的发现了两者的关系,年轻的爸爸们在买尿布的时候往往会顺便买上啤酒,所以商场就把两种商品的柜台放在一起了,结果两者的销量都大大提升.

    那么数据挖掘技术对我们的软件测试又有什么可以利用的地方呢?就我们当前的项目来说,我们会利用TD对测试的缺陷做一些统计和分析,从而判断哪种类型的缺陷比较多等等.如果我们想把分析的层次更深入一点,得到一些让我们意想不到的有价值的数据的时候,我们可以尝试着引入数据挖掘的技术.

    你们可能会问,采用了数据挖掘技术后,我们究竟可以挖掘出什么样的有价值数据呢?这么说吧,我们至少可以知道缺陷之间互相影响的情况,比如缺陷甲增长的同时带动缺陷乙的增长,缺陷丙消亡的同时又使缺陷丁增长了.有了这样的数据,我们可以利用它来解决一些世界的问题,既然缺陷甲增长的同时带动缺陷乙的增长, 那它们之间存在某种共性或联系的可能性比较大,即使它们看起来是那么的无亲无故,当我们发现它们的共性的时候,我相信大家都应该想到很好的避免或者减少这种情况发生的方法,因为我们烦恼的并不是解决问题,而是发现问题.同样的,如果一个缺陷的消亡带动了另一个缺陷的增长,我们应该引起注意了,代码之间的相互作用的能力我们实在不能小看,在了解清楚根源后,我们可以通过改变一下修改缺陷的办法来避免新缺陷产生的频率.

    这些只是我所能想到的一些,我相信数据挖掘在软件测试或者开发中可以发挥更大的作用,只要我们去用心去发现,去探索.

   

 


TAG:

lishuchankuaile的个人空间 引用 删除 lishuchankuaile   /   2012-04-20 09:38:54
不错,思想已经说出来了,能不能领悟就看个人了
lishuchankuaile的个人空间 引用 删除 lishuchankuaile   /   2012-04-20 09:38:07
1
木夕小窝 引用 删除 猫妖木夕   /   2007-05-30 19:12:41
啤酒和尿布的关系已经修正了哦,太久了,不记得了,呵呵:)
测火燎原--态度决定质量 引用 删除 ppent   /   2007-05-29 18:12:43
哈哈,同行。
应该是在买尿布的同时顺便买了啤酒吧,^_^。
这个想法我很早就想过,但一直没有真正去把它沉淀下来成为一种模型。
希望能有更多的交流。
*z参y谋c* 引用 删除 zhuyuancan   /   2007-05-29 08:55:26
谢谢分享!!!若能举出一些在软件测试中用的到的数据就跟好了,啊哈哈
 

评分:0

我来说两句

我的栏目

日历

« 2024-05-04  
   1234
567891011
12131415161718
19202122232425
262728293031 

数据统计

  • 访问量: 8522
  • 日志数: 7
  • 建立时间: 2007-04-10
  • 更新时间: 2008-03-19

RSS订阅

Open Toolbar