文通表格识别AI训练平台—让OCR识别进入自主时代
2023-06-30
一、AI模型训练平台应用不断深化
“AI模型训练平台是一种提供人工智能应用解决方案的平台,通过使用不同的深度学习算法进行大规模的训练,对数据集和模型进行管理和迭代,并接入到具体业务场景中使用,加快算法开发效率,提高产品的迭代周期。”
伴随着OCR识别场景应用不断丰富深化,无论是大型企业还是中小企业都需要一套低成本、可延续性的OCR项目部署方案,一改企业多次采购业务扩展周期长、自己投入研发技术成本高的僵局。
面对企业多样化、定制化的识别需求,文通科技表格识别AI训练平台应运而生。用户可结合自身需求,通过标注、训练、测试,创建相应的高精度模型,实现快速部署到生产服务集群并落地应用的目的,仅一个平台就可满足复杂的OCR全识别工作。
二、文通表格识别AI训练平台
文通表格识别AI训练平台,自发布以来持续迭代优化,可实现任意表票单证的识别定制,用户在该平台自主搭建独有的训练模型,实现银行票据、医疗票据、卡证、明细表等各类表单卡证的电子化应用,并进行结构化数据提取。
更多新功能来袭,一起来看看吧!
1、识别核心更丰富
支持识别中文简体、手写、中文繁体、印刷混排样本、英文和数字,识别率高,可自行设置识别字段。
2、智能滤色
可将样本中的红蓝色过滤,提升识别率。
3、关键字段信息智能抽取
支持在多行内容中抽取固定行或固定同一字段信息。
4、字符替换
内置正则表达式,可对易出错文本进行校对并替换。
5、复杂不规则样本模型训练
支持对复杂不规则样本模型(例如:药瓶瓶身说明书)进行识别训练。
6、增加模板搜索
可根据模板ID和模板名称搜索,快捷方便。
三、文通表格识别AI训练平台功能回顾
1、模型训练
自动/手动框选图片中文字及位置固定的内容,对模板图像进行自动分析,快速设定参考区和识别区,可对每个模型进行编辑、测试、发布、删除等操作,几分钟即可完成。
2、模型标注
自动进行全版面的分析与识别,训练时可以基于此结果标注参考区和识别区,可对模板图像进行旋转、放大、缩小、移动等操作。
3、无框线/有框线明细表自动分析
可对无框线/有框线列表明细区域进行自动列分析,支持对自动分析的明细列进行增加、删除和修改,识别率高。
4、自定义分类器
针对需要分类的企业独有格式文档,每类上传30张训练图片即可创建分类器,实现对不同版式图片的自动分类。
5、输出结构化数据
返回各类表单/卡证的JSON、XML结构化数据,方便编辑,实现电子和纸质文件信息即时同步。
6、高级设置
可对每个识别区进行更多高级设置,包括行数限制、字符集限制、正则表达式限制,以提升识别率。
7、内嵌多种成熟模型、可直接调用
内嵌传统证卡、票据等成熟模型,可直接选择使用,识别率高。
8、深度学习算法技术
倾斜、旋转、拍照畸变、背景、证件不全等复杂样本均可识别。
9、支持识别多种文件格式图片
支持JPEG、PNG、PDF等多种文件格式上传,可支持拍照、扫描、打印等多种获取形式的表单识别。