- TH-OCR文字识别SDK
- OCR文字识别系统(信创版)
- TH-OCR少数民族文档识别
功能介绍
-
1:1还原重构表格
支持OCR自动识别分析表格,并1:1还原重构表格,确保数据完整性
-
OCR识别多种版面报刊
可以识别不同版式的报刊内容,精确重现原始布局
-
支持多种采集方式
通过手机、平板电脑、高拍仪、扫描仪、数码相机等途径获取的图像均可识别
-
可识别多门语种,字符集广
支持OCR识别印刷简体、手写简体、印刷繁体、手写繁体、生僻字、手写体和印刷体混合文本及通用英文
-
支持OCR识别、导出多种格式图像/文件
支持识别BMP、JPG、JPEG、PNG、PDF等主流图片格式;导出JSON、TXT、双层PDF等多种格式文件
-
自动旋正图片
TH-OCR文字识别支持45°、90°、180°、270°等多角度图片旋正
-
可与多种系统集成应用
提供标准的API接口,实现与档案、OA、ERP等应用系统快速集成
-
多种部署方式
既支持B/S端服务部署,也支持PC端SDK集成部署,也支持移动端SDK(Android)集成
-
支持CPU和GPU硬件配置部署
同样识别性能情况下,支持CPU和GPU硬件配置部署,节约硬件投入成本
产品优势
-
国家科技进步二等奖
- TH-OCR技术荣获国家科技进步二等奖、教育部科技进步一等奖等多个奖项
-
拓展应用
- 支持与AI扫描仪等硬件产品拓展应用,实现大量数据档案的管理与数字化
-
自动校正
- 支持对图像由于扫描引起的倾斜进行自动校正
-
支持版面分析、版面还原
- 支持对图像进行自动版面分析,根据分析结果 1:1还原版面格式及信息
-
智能OCR识别
- 在线可识别字在原文中的位置和大小,可识别多页PDF文件
-
支持OCR生僻字识别
- TH-OCR文字识别可高精度识别多种生僻字
-
可擦除下划线、滤色后识别
- 可过滤图片上的红色或粉色等干扰背景
-
保证数据安全
- 企业内网部署,满足用户数据安全的需求
-
OCR秒级识别、识别率高
- 识别速度快,识别速度在1秒以内,识别准确率高达99%以上
-
应用范围广
- 可广泛应用于档案系统、大模型、RPA等多领域
应用场景
- 电子档案安全管理系统
- 系统办公软件
- 档案数字化加工
- 智能硬件
- 合同管理
- 大模型
-
电子档案安全管理系统
将文通科技OCR文字识别系统应用于计算机终端保密检查系统、电子文档安全管理系统、邮件防控管理系统、电子档案安全管理等系统,超高识别率为数据安全和风险防范提供高效技术支持。
-
系统办公软件
将文通科技TH-OCR文字识别SDK嵌入到RPA等办公软件中,可应用于金融、医疗保健、企业、政府、招标机构等各领域,为终端客户提供各类文档或者内部资料的文字提取功能,操作便捷,提升整体的工作效率、节约人力成本。
-
档案数字化加工
将文通科技OCR文字识别系统应用于大量数据档案的管理与数字化场景,通过扫描企业纸质档案,可导出双层PDF、TXT、WORD、XML、XLS等格式文件,方便企业编辑、查找档案信息,应用于图书馆数字化项目、历史档案数字化、军政档案管理、军政档案管理等项目,实现档案数字化管理,提升效率和智能化水平。
-
智能硬件
将文通科技文字识别SDK嵌入到多功能一体机、扫描仪或其他智能硬件中,在进行文档录入的工作时,可快速识别和提取文字,实现企业信息数字化管理。
-
合同管理
合同比对基于文通科技TH-OCR文字识别,自动抽取合同文本中的关键信息,可识别字在原文中的位置和大小,将图像识别输出为可编辑的文件格式,进行存储,实现计算机替代人工审核比对,解决合同管理工作中人工审核时间成本高、人力成本高的难题。
-
大模型
文通科技OCR识别技术与大模型相结合,通过对文档整体内容和结构的理解,能够更准确地识别和分类信息,从而显著提升文档检索和管理的效率。例如,深度学习模型可以理解复杂的文档版面,自动提取关键信息,处理各种文字和排版风格,确保转换后的电子文本质量和可编辑性,极大地减少了人工操作的时间和成本。
客户案例
免费测试
TH-OCR文字识别SDK 识别
图像建议:大小在200KB左右,位深度24以上。扫描图像建议:分辨率为300DPI,小于3M。
- TH-OCR文字识别SDK
- 结果
- JSON数据