联系我:新浪微博@架构师Jack 或 dongjietest#163.com联系.(#换为@)

大数据本质与测试

上一篇 / 下一篇  2013-04-09 21:14:35 / 个人分类:测试技术


_q"H+S+m(I_:u!Z0
大数据本质是预测:只找数据相关性而不是找到准确的因果性。找因果关系的成本和难度 远大于找相关性,什么是相关性就是我知道当出现A现象时必然会出现B现。我不一定花成本去搞明白为什么,而只需要努力的提高出现A现象时一定会出现B现象的预测准确率。设计测试系统的本质是发现一堆bug数据,然后找到bug数据集与软件质量的相关性,不一定找到准确的因果性。测试设计的测试系统或测试评价模型对挖掘出的bug数据集的质量非常重要,否则在寻找bug集与质量相关性时,就会很难或不靠谱。
51Testing软件测试网9OlK6D,f.o Cq1B
大数据是对所有数据进行分析处理而不是随机样本,最有价值的数据是异常数据,对全部数据进行统计分析发现这些小概率的异常数据对其分析是大数据分析的最大价值,异常数据说明我们的认知和建模还有漏洞,从而可发现我们过去未知的新事物,完善我们的认知模型。

f3bAX8F&z!^f&Dz/j0
大数据分析既然要全部数据就不怕数据中有错误数据的干扰 2+2=3.9也挺好的。从软件质量角度来看,只要是全部bug数集,即使有一些无效bug,但对产品发布质量的相关性准确性的负面影响 也小于 仅是随机抽样bug数据或按规则抽样bug数据进行数据分析的负面影响。
51Testing软件测试网qhy;O#Q8F"b^
大数据时代三大关键资源:拥有大数据资源、拥有统计算法工具、拥有大数据思维模式。对于大多数人或组织没法拥有大数据资源,也不一定精通统计算法工具,但都可以拥有大数据思维模式,依靠大数据思维模式提升工作的效率和质量。我们就曾在图片搜索中发挥大数据思维模式,成功实现了高性能(单机计算机能力1秒1个)高准确率(85%)的自动识别“文不对图”的测试系统。

TAG:

引用 删除 Sanford_Bella   /   2015-07-06 13:55:57
5
jj_happy的个人空间 引用 删除 jj_happy   /   2015-06-03 13:40:13
5
whisky328的个人空间 引用 删除 whisky328   /   2015-05-20 15:31:57
5
liulisuo的个人空间 引用 删除 liulisuo   /   2013-12-03 16:08:32
5
lys696969的个人空间 引用 删除 lys696969   /   2013-08-15 16:04:35
5
测试人生 引用 删除 mexia   /   2013-06-04 15:17:32
同感,有时候你想再多的边缘测试用例都无法模拟真实上线后各种各样的大数据出现的问题
xin_晴的个人空间 引用 删除 xin_晴   /   2013-04-10 13:40:10
您好,我是51Testing软件测试网的编辑,您的本篇博文被推荐至51Testing软件测试网首页发表:http://www.51testing.com/html/70/n-843770.html
感谢您关注并支持51Testing博客,期待您更多的优秀原创博文。
 

评分:0

我来说两句

Open Toolbar