随着人工智能的发展,在生活中有许多方便高效的应用,如人脸识别、证书识别与认证、名片识别、车牌识别等。,这些都方便了我们的日常生活。同样,这些技术也可以为我们的日常业务流程提供智能高效的解决方案。
日常交易和清算业务交易中有各种电子邮件、传真等文件,主要包括交易确认文件、存款协议、敲门指令、跨行收费、线下中标公告、海外券商确认单等。这些文档需要手动识别并提取到系统中。利用光学字符识别技术,可以识别和纠正文档图像内容,提取关键字段元素并与相关系统连接,减少人工输入,提高工作效率,减少人工输入错误。
典型的光学字符识别技术路线如下图所示:
在光学字符识别技术中,图像预处理通常旨在纠正图像的成像问题。输入的文字通过扫描仪进入电脑后,纸张的厚度、平滑度、打印质量等都会造成文字失真,造成断笔、粘连、污渍等干扰。因此,在进行文本识别之前,需要对有噪声的文本图像进行处理。因为这种处理工作是在字符识别之前,所以叫做预处理。预处理一般包括灰度化、二值化、几何变换(透视、畸变、旋转等)。),畸变校正,模糊去除,图像增强和光线校正,线和字分割,平滑,归一化等。
最重要的环节,也是影响识别准确率的环节,是文本检测和文本识别。文本检测是检测文本的位置、范围和布局,包括布局分析和文本行检测。文本检测的主要问题是哪里有字符,字符的范围有多大。
文本识别是基于文本检测,识别文本的内容,主要是识别每个字符是什么。对于文本图像,提取特征并将其扔给分类器,分类器将对其进行分类,并告诉您该特征应该识别哪个文本。分类器一般通过模板匹配、判别函数、神经网络分类、基于规则的推理等方法来设计。分类器通常在实际识别之前进行训练,这是一个有监督的学习过程。有很多成熟的分类器,比如SVM,CNN。将图像中的文本信息翻译成文本信息。
识别出的文本可以通过词库中的匹配词典进行修正,比如相似词的处理:“分”和“Xi”是相似的,但如果遇到“分数”这个词,就不应该识别为“Xi数”,因为“分数”是一个正常的词。这需要语言模型来纠正,通常需要再次检查以确保其正确性。
剧终
OCR技术步骤多,算法复杂。但是随着识别算法的不断完善和成熟,字符编码库更加准确,OCR识别的准确率也大大提高。目前,OCR字符特征的主流算法识别率几乎达到95%。同时有成熟的OCR引擎,可以帮助开发者提高开发效率。
前期我们在部分业务中测试了近1000份文档,整体成功率在97%以上。通过引入OCR技术,将优化业务流程,减少人工提取操作,提高清算估价业务的自动化水平,使业务流程更加简单高效。
1.《ocr技术 OCR技术简介》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《ocr技术 OCR技术简介》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/guonei/1296980.html