OCR识别测试探索

发表于:2021-7-23 09:36

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:雷陈芳    来源:51Testing软件测试网原创

#
OCR
  随着人工智能技术的蓬勃发展,越来越多成熟的人工智能技术被应用于软件系统中,OCR就是被广泛应用的技术之一。本文结合实际工作中的总结,探索如何针对OCR开展测试

  什么是OCR
  OCR(Optical Character Recognition光学字符识别)是指通过对图像的分析处理将图像中的文字信息识别、提取并转化为计算机文字,简单来说是识别图片中的字符转化为可编辑文档。例如识别书籍扫描照片中的文字、识别身份证照片中的关键信息、识别银行卡照片中的银行卡号等。
  OCR的一般过程为图像预处理、特征提取、文字区域检测、文本识别与输出。
  OCR技术从文字类型的角度可分为印刷文字识别与手写文字识别,从识别目的的角度可分为通用OCR与专用OCR。
  通用OCR是指对图片中所有文字和字符进行识别,并可返回文字对应位置信息。
  专用OCR是指对图片中的特定位置、特定信息进行识别提取,通常是针对票据、证件、牌照等制式票证图片。

  OCR的应用场景
  随着OCR技术不断发展,其应用领域也得到相应的扩展,OCR产品丰富多样,涵盖金融、教育、交通等诸多行业。
  金融行业在柜面、运营、手机银行等业务领域中存在大量凭证识别需求,例如存折、存单、银行卡、营业执照、各类票据、报表等,通过OCR识别替代手工输入,可大幅提高业务办理效率,同时OCR+人工复核提供了双重保障。
  教育行业,通过OCR技术可实现自动化试卷分析与识别,提高试卷录入效率,并可辅助教师阅卷;题目图片、公式图片OCR结合搜索引擎实现快捷智能搜题;笔记图片OCR识别实现笔记电子化,方便存储、编辑、传输与查找;OCR与自然语言处理技术结合,可实现写作辅导与纠错。
  行政领域,身份证识别、税票识别、车牌识别等场景都离不开OCR技术的应用。

  OCR测试
  OCR模型是OCR功能的核心,经过大量图片及标注数据学习训练而成,在此基础上封装为OCR服务对外提供服务,通常以联机接口形式实现供其他系统调用。
  OCR测试可分为两部分,一是对OCR模型识别的效果进行测试,判断其是否满足业务应用场景的要求,二是对OCR服务进行测试,包括功能测试性能测试以及安全测试等。



版权声明:本文出自《51测试天地》第六十二期。51Testing软件测试网及相关内容提供者拥有51testing.com内容的全部版权,未经明确的书面许可,任何人或单位不得对本网站内容复制、转载或进行镜像,否则将追究法律责任。
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号