银行票据识别开发包
核心关键词:文字识别、票据识别、数据捕获、OCR、事后监督、事中监督
1 需求背景:
长期以来,银行凭证管理工作因管理手段落后而造成的一系列麻烦和困惑,一直困扰着银行界,在票据处理方面,多数银行仍停留在"人工分散处理+纸质库房保存+人工查询"的阶段,成为阻碍金融电子化的薄弱环节。因此,建设"集中、统一、规范、高效"的电子化票据处理中心,已成为银行亟待解决的问题。
2 产品简介 :
文通银行票据识别引擎是针对银行巨大的票据业务,使用票据OCR技术提取票据影像上的关键字段要素,自动建立索引,从而完成金融领域风险监督、票据自动存档。银行票据识别引擎(SDK)由两部份组成:模板编辑器和分类识别核心。其中模板编辑器完成票据模板的规则定制工作,并由识别模板指导识别核心进行影像分类和识别。
3 产品概述:
文通银行票据识别引擎主要由以下功能模块组成
银行票据识别模板编辑器
图像预处理模块
票据分类核心模块
字符识别核心模块
工作原理如下图:
3.1 模板编辑器
文通银行票据识别系统提供了便捷的模板制作工具——模板编辑器。模板为识别过程提供指导,包括分类标识、定位标识、识别要素等详细信息。分类标识信息包括:图像大小、版面特征文件、框线信息、标题信息、文本信息等多种分类信息。在识别过程中具体采用的分类算法可以通过模板编辑器在主模板中配置。
3.2 图像预处理模块
文通银行票据识别系统在对影像进行识别前做了多项预处理操作,为之后识别输出最优的图像质量,具体有纠偏、偏色校正、滤色、降噪、二值化、增强识别单元对比度等功能。这些预处理功能均可通过参数灵活配置、自由组合。
3.3 票据分类模块
文通银行票据识别系统票据分类功能强大:系统同时支持表格框线(位置、颜色)分类、标题单元(标题内容、标题颜色)分类、文本区域(文本内容、文本颜色)分类等,以最大限度发掘不同凭证之间的差异。如框线颜色、标题颜色均可以用来区分多联凭证的不同联;文本内容可以区分同一凭证打印多种交易的影像;文本颜色可以用来区分同一种凭证分多联并且不同联之间框线颜色和标题颜色均相同的影像。
3.4 字符识别核心模块
系统支持印刷汉字识别、印刷英文识别、印刷数字识别、手写汉字识别、手写英文识别、手写数字识别、磁码识别、条形码识别、客户签字检测、附件章检测等多个识别引擎。
4 票据识别引擎的特性
1. 适应性强
文通银行票据识别系统简体中文识别核心支持常用的宋体、仿宋、楷体、黑体、隶书、幼圆等汉字字体。印刷体英文和数字同样支持多种字体包括常见的:Arial、Times New Roman、Avant Garde、Bookman Old Style、 Helvetica、Verdana等多种字体。
2.票据分类精准
文通银行票据识别系统有很强的版面区分能力,充分利于框线、框线颜色、标题内容、标题颜色、文本内容、文本颜色等多种特征来进行版面的区分,版面识别的准确率在99%以上。
3.识别速度快
经过实际生产线运行计算,单张票据识别时间为300ms~900ms,平均识别时间约为500ms。
4.识别率高
印刷体汉字识别率达99.5%;
印刷体英文和数字识别率>99.6%;
规范手写数字识别率达99%;
一维条码、二维条码(PDF417、DataMatrix)识别率>99%。
5 我们的技术服务
我们的宗旨:为客户提供企业级的数据采集技术
我们的技术服务内容:
1、识别需求评估;
2、二次开发技术支持,在企事业客户开发应用系统的过程中,我们将全程跟踪,为客户方提供专业团队的技术服务;
3、持续的软件升级服务;
6 应用领域/解决方案
银行票据事后监督系统
流程银行(无纸化办公)