最近,自己对DW的测试进行了下总结,粗略归为如下:
DW的测试可以分为以下几类:
<!--[if !supportLists]-->1、 <!--[endif]-->数据完备性测试
<!--[if !supportLists]-->2、 <!--[endif]-->数据转换过程测试
<!--[if !supportLists]-->3、 <!--[endif]-->数据质量测试
<!--[if !supportLists]-->4、 <!--[endif]-->性能和可扩展性
<!--[if !supportLists]-->5、 <!--[endif]-->集成性测试
<!--[if !supportLists]-->6、 <!--[endif]-->用户可接受性测试
数据完备性测试:
<!--[if !supportLists]-->1、 <!--[endif]-->记录总数比较
<!--[if !supportLists]-->2、 <!--[endif]-->主键数比较
<!--[if !supportLists]-->3、 <!--[endif]-->数据分布比较
<!--[if !supportLists]-->4、 <!--[endif]-->字段长度比较
<!--[if !supportLists]-->5、 <!--[endif]-->字段边界测试
数据转换过程测试:
采取样本法,取源数据的一个样本,保证样本的代表性(各值的分布,边界)(需要了解具体的转换规则),查看ETL结果是否正确。
数据质量:
此处的质量是指对一些异常值的处理过程。例如:空值,被拒绝的记录
性能测试:
发现整个ETL过程中哪些过程较耗时间
读文件的次数、加载数据量的大小对运算的影响,写数据库的耗时等指标,查看是否可以分解、重组其中的过程。