基于如上复杂的系统架构,尤其是4)模式,我们在测试当中也碰到相当多棘手的技术问题
1) 海量数据是否都按预期的分词算法建立索引了呢?
2) 机器分词的效果与手工分词相差有多大呢?
3) 海量查询的返回结果是否多查了
4) 海量查询的返回结果是否漏查了
5) 海量查询的返回结果的加亮、标注如期加了?
6) 海量查询的返回结果中相关性分数计算是否正确?
7) 海量查询的返回结果积分计算是否正确了呢
8) 海量查询的返回结果积分相同时,排序的先后依据唯一么?
9) 加入即时更新模块后,每次查询结果都不同,新建的索引内容是否都反馈到查询结果里面了呢 ?
10) 海量数据时CACHE是否预期CACHE该cache的内容?
11) 海量数据时CACHE是否依照一定的过时算法令cache的内容失效呢?
12) 应用程序在32位LINUX 操作系统和64位的LINUX的索引、查询结果是否依然一样?
13) 应用程序在不同的OS 上索引、查询结果是否依然一样?