(转)如何用QTP解决图片验证码(解析QuickTest文本识别机制)?

上一篇 / 下一篇  2008-10-15 10:06:30 / 个人分类:QTP

本文出自songfun的51Testing软件测试博客,转载请保留出处及链接:http://www.51testing.com/?songfun51Testing软件测试网 lb(sdG/C-j*_
51Testing软件测试网U+OAT%VHj8j
大家在使用QTP进行自动化测试的过程中经常会遇到图片验证码的问题——大家所关心的就是如何解决此类问题。51Testing软件测试网S s)O @+m QJ E
这里我们首先要去了解为什么会有图片验证码。其实验证码的本质作用就是防止有人利用工具(灌水机、注册机,当然也不小心包括了我们的自动化测试工具)恶意猜解登陆或者不停的注册和灌水的。因此如果我们完全寄希望于通过GUI识别来获取内容是不切实际的——先打好预防针,免得读者希望太大,失望更大,呵呵!
Z3GZF4X0下面说说验证码的解决思路:
Gy'`1Jd{ OeT0其实解决图片验证码的思路有很多,我这里主要结合QTP9.5的新特性给大家介绍其中一种解决方案,就是利用它的OCR机制抓取文本内容。51Testing软件测试网%a4Q S1\y'n#QP,hP X
在QTP9.5中,对象识别能力有了进一步改善,其中针对文本识别方面进行了优化,引入了ABBYY公司的OCR解决方案——这个相关的功能体现在QTP菜单的“Tools-->Options-->General--Use text recognition mechanisms in this order”里,详细内容后面会有具体介绍。51Testing软件测试网7} O0imK?
先来看看ABBYY是何许公司,登录他们的官方网站可以看到一段相关介绍:“ABBYY是世界OCR(光学字符识别)、ICR(手写体识别)和语言软件的领航者。ABBYY 致力于人工智能(AI)和语言软件开发。提供全套文档识别,转换和数据捕获技术的产品解决方案。”如果你使用过图像文档转换的软件,一定会听说过FineReader OCR Professional ,其实它就是ABBYY公司的产品,用官方的说法就是“将通过扫描仪、MFP 或数码相机生成的图像快速转换为可编辑和可搜索的电子格式,而且识别率很高”,说白了就是可以借助它先进的OCR机制“读”出图片里的文本内容,并转换为PDF之类的文档。
S,h h} {)n(v i0有了ABBYY这么强大的背后支持,QTP自然底气十足,那么QTP到底如何以OCR机制识别文本呢?我们首先先了解一下什么是OCR。
C;p;C#{.j2ZE5T0打开“百度百科_OCR”,它的说明:“OCR(Optical Character Recognition,光学字符识别),是属于图型识别(Pattern Recognition,PR)的一门学问。其目的就是要让计算机知道它到底看到了什么,尤其是文字资料。 由于OCR是一门与识别率拔河的技术,因此如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。而根据文字资料存在的媒体介质不同,及取得这些资料的方式不同,就衍生出各式各样、各种不同的应用。”这里有个关键词:“正确率”,也就是“识别率”——既然不能够总是100%,我们自然不可能完全寄希望于通过QTP能够每次100%正确的去识别图片里的文本。尤其是“道高一尺魔高一丈”的今天,验证码加入了大量的干扰素,如扭曲、变形、错位、随机背景花纹,给OCR识别增加了很多难度——本来就不希望被软件识别到嘛。
.GIG)q"MQt:}C x0
)s+j h*z$}(O0本文出自songfun的51Testing软件测试博客,转载请保留出处及链接:http://www.51testing.com/?songfun51Testing软件测试网 i.WC| {1W2ut2Q
51Testing软件测试网WN#`n'M1m
MhAXF,A/J0了解了OCR之后,我们再来看看QTP对应的这个设置。如前面所说,通过QTP菜单的“Tools-->Options”选中到“General--Use text recognition mechanisms in this order”,这里的四个选项就是对应的不同设置。我们看看帮助的描述(我做了翻译):51Testing软件测试网 Uz"\;Oa g/kh
=================================51Testing软件测试网WZ4i"a9j,A|P&P
使用文本识别机制
sTP/dq0
7blEu"v!\R0R0指定QTP在采用 “文本”或者“文本区域” 的 检查点或输出值 的步骤时,捕获文本内容所使用的文本识别机制。
!],H OBw[0以下有三种识别方式:51Testing软件测试网'J W/RgZ1F*J
1、先使用WindowsAPI,再使用OCR(默认)。
}2xU(l+?4^.n d._0    指示QTP首先尝试以基于Windows API的机制从对象上直接获取文本内容。如果未获取到文本(比如,文本属于图片的一部分),QTP就会使用OCR的机制尝试获取这段文本。51Testing软件测试网;D(Kc%_]*Y/C&R#e }|
    强烈建议在使用中日韩(象形文字)、英的语言环境下采用这个设置。51Testing软件测试网 EL+r(h omoF

$Te;|V&teH$a02、先使用OCR,再使用Windows API。51Testing软件测试网X4E7}4lk4Z$w
    指示QTP首先尝试使用OCR机制从对象上去获取文本。如果未获取到文本,QTP就会以Windows API的机制去获取文本内容。51Testing软件测试网7V/F2q ['Vv0}Fc-w4a
51Testing软件测试网(g M5zZ9T9a&K8Kh
3、仅使用Windows API方式。51Testing软件测试网hoBS;Rab\ r$Q
    指示QTP仅采用基于Windows API的机制从对象上获取文本内容。51Testing软件测试网l)n Kf1Z%z

PO!H[:X6H:k9Q X04、仅使用OCR的方式。51Testing软件测试网3a[e[GSy Cp
    指示QTP仅采用基于OCR的机制从对象上获取文本内容。51Testing软件测试网 QT6A M/w~ d:SZQ
    在使用WindowsVista要使用这种方式。
0v?\+r&hj0
gL1T5u,\kD0=================================51Testing软件测试网)Ps%t;G%co(^:Lt}
本文出自songfun的51Testing软件测试博客,转载请保留出处及链接:http://www.51testing.com/?songfun51Testing软件测试网k3t%f)d!GO Q]
51Testing软件测试网WN#`n'M1m
Bb4p,]pv FP0上面的内容已经解释的很明确了,接下来我们通过TextArea Output Value看看效果。51Testing软件测试网D.sH.j Yt'd^#g

HG6`O!_0如下图所示,QTP针对几张图片的识别效果:51Testing软件测试网(@rB:F7kF
(一)、内容是51Testing的,QTP获取正确;内容是51Testing的G风格彩字,QTP获取错误(显示为IC_CHECK_PATTERN)
I6hY8m:P g-\K051Testing软件测试网 xt Ow'bd

+bnq jEB+V`.g1D0
q:Q D!eO4T^)q/e0(二)、内容是songfun的普通文本,QTP获取正确;内容是songfun的G风格彩字,QTP获取错误(也显示为IC_CHECK_PATTERN)
\+Q3F$q6G x:WV'U0
'n$rb.zs"D8tTc%h051Testing软件测试网*C0NR"a"i#|R:hz
51Testing软件测试网*g,EQ/gM'hx
51Testing软件测试网&dfgDO/?Av;G
有兴趣大家可以自己做一些图片,甚至可以用QQ的验证码图片来试验一下,看看OCR效果。
]~$d!X4D^ a G051Testing软件测试网a?#mt)u aH]-W
本文出自songfun的51Testing软件测试博客,转载请保留出处及链接:http://www.51testing.com/?songfun
e \.lI$r+L9B#l$Z051Testing软件测试网WN#`n'M1m51Testing软件测试网6W1R-V}go[p

TAG: QTP

 

评分:0

我来说两句

日历

« 2024-04-30  
 123456
78910111213
14151617181920
21222324252627
282930    

数据统计

  • 访问量: 20496
  • 日志数: 32
  • 建立时间: 2007-12-13
  • 更新时间: 2008-12-04

RSS订阅

Open Toolbar