OCR识别测试探索

发表于：2021-7-23 09:36

作者：雷陈芳来源：51Testing软件测试网原创

OCR

　　随着人工智能技术的蓬勃发展，越来越多成熟的人工智能技术被应用于软件系统中，OCR就是被广泛应用的技术之一。本文结合实际工作中的总结，探索如何针对OCR开展测试。

　　什么是OCR

　　OCR（Optical Character Recognition光学字符识别）是指通过对图像的分析处理将图像中的文字信息识别、提取并转化为计算机文字，简单来说是识别图片中的字符转化为可编辑文档。例如识别书籍扫描照片中的文字、识别身份证照片中的关键信息、识别银行卡照片中的银行卡号等。

　　OCR的一般过程为图像预处理、特征提取、文字区域检测、文本识别与输出。

　　OCR技术从文字类型的角度可分为印刷文字识别与手写文字识别，从识别目的的角度可分为通用OCR与专用OCR。

　　通用OCR是指对图片中所有文字和字符进行识别，并可返回文字对应位置信息。

　　专用OCR是指对图片中的特定位置、特定信息进行识别提取，通常是针对票据、证件、牌照等制式票证图片。

　　OCR的应用场景

　　随着OCR技术不断发展，其应用领域也得到相应的扩展，OCR产品丰富多样，涵盖金融、教育、交通等诸多行业。

　　金融行业在柜面、运营、手机银行等业务领域中存在大量凭证识别需求，例如存折、存单、银行卡、营业执照、各类票据、报表等，通过OCR识别替代手工输入，可大幅提高业务办理效率，同时OCR+人工复核提供了双重保障。

　　教育行业，通过OCR技术可实现自动化试卷分析与识别，提高试卷录入效率，并可辅助教师阅卷；题目图片、公式图片OCR结合搜索引擎实现快捷智能搜题；笔记图片OCR识别实现笔记电子化，方便存储、编辑、传输与查找；OCR与自然语言处理技术结合，可实现写作辅导与纠错。

　　行政领域，身份证识别、税票识别、车牌识别等场景都离不开OCR技术的应用。

　　OCR测试

　　OCR模型是OCR功能的核心，经过大量图片及标注数据学习训练而成，在此基础上封装为OCR服务对外提供服务，通常以联机接口形式实现供其他系统调用。

　　OCR测试可分为两部分，一是对OCR模型识别的效果进行测试，判断其是否满足业务应用场景的要求，二是对OCR服务进行测试，包括功能测试、性能测试以及安全测试等。

......

《2023软件测试行业现状调查报告》独家发布~

搜索风云榜

测试技术了解

2023测试行业调查报告

挣点稿费

AI与软件测试

文章资料精选