什么是OCR
OCR(Optical Character Recognition光学字符识别)是指通过对图像的分析处理将图像中的文字信息识别、提取并转化为计算机文字,简单来说是识别图片中的字符转化为可编辑文档。例如识别书籍扫描照片中的文字、识别身份证照片中的关键信息、识别银行卡照片中的银行卡号等。
OCR的一般过程为图像预处理、特征提取、文字区域检测、文本识别与输出。
OCR技术从文字类型的角度可分为印刷文字识别与手写文字识别,从识别目的的角度可分为通用OCR与专用OCR。
通用OCR是指对图片中所有文字和字符进行识别,并可返回文字对应位置信息。
专用OCR是指对图片中的特定位置、特定信息进行识别提取,通常是针对票据、证件、牌照等制式票证图片。
OCR的应用场景
随着OCR技术不断发展,其应用领域也得到相应的扩展,OCR产品丰富多样,涵盖金融、教育、交通等诸多行业。
金融行业在柜面、运营、手机银行等业务领域中存在大量凭证识别需求,例如存折、存单、银行卡、营业执照、各类票据、报表等,通过OCR识别替代手工输入,可大幅提高业务办理效率,同时OCR+人工复核提供了双重保障。
教育行业,通过OCR技术可实现自动化试卷分析与识别,提高试卷录入效率,并可辅助教师阅卷;题目图片、公式图片OCR结合搜索引擎实现快捷智能搜题;笔记图片OCR识别实现笔记电子化,方便存储、编辑、传输与查找;OCR与自然语言处理技术结合,可实现写作辅导与纠错。
行政领域,身份证识别、税票识别、车牌识别等场景都离不开OCR技术的应用。
OCR测试
OCR模型是OCR功能的核心,经过大量图片及标注数据学习训练而成,在此基础上封装为OCR服务对外提供服务,通常以联机接口形式实现供其他系统调用。
版权声明:本文出自《51测试天地》第六十二期。51Testing软件测试网及相关内容提供者拥有51testing.com内容的全部版权,未经明确的书面许可,任何人或单位不得对本网站内容复制、转载或进行镜像,否则将追究法律责任。