对于图片和CSS等内容其实一般都不是我们关心的,系统的动态数据需要关联的服务器返回信息一般都保存在HTML正文中。所以接着修改一下关联函数,将Search In选项从All修改为Noresource,也就是只需要关联HTML、XML等资源而不关联附属的信息。关联函数变为如下形式:
web_reg_save_param("temp","LB=","RB=","Ord=1","Search=Noresource",LAST); |
再运行一次可以看到被关联的内容只有一个了,而且就是服务器返回的HTTP包中的正文内容,和通过VuGen看到的服务器返回内容完全相同,现在这个返回是保存在一个叫做temp的参数中。
整个HTTP请求分为两段,一段是开头的HTTP头数据包,叫做header;另外一段就是HTML页面,叫做body。在“Search”选项中可以修改为Headers或者Body来更加精确地划分关联范围。
通常我们还是使用Noresource来处理关联范围,因为这样可以得到最常用的返回内容。在得到了服务器返回的内容后,接着就可以做任何想做的事情,比如获得页面中的任意一个对象,例如如何将MS Petshop 4.0首页上Powered by的字样抓出来作为参数呢?
关联函数提供了一个叫做左边界、右边界的策略,只需要填写这个规则,它会在整个被关联范围内查找符合该规则的内容。先查看需要关联的内容的对应代码。
<tr> <td> </td> <td> </td> <td class="footerHome"> Version 4.0 - Powered by .NET 2.0</td> <td> </td> <td> </td> </tr> |
在服务器返回的内容中,可以找到Powered by这个词,那么什么样的边界条件能够让我们获取这个词呢?可以通过设置左边界为 Version 4.0 -,右边界为.NET 2.0的方式来检索这个词,然后修改关联函数。
修改关联函数有以下两种方法:
1.直接在代码上修改。
2.切换到Tree模式下,双击关联函数,在Left Boundary/Right Boundary中输入条件,修改关联函数,如图3.139所示。
图3.139 修改关联函数的左右边界