在线客服



文通2016数据录入工厂发布 OCR文字识别软件加速信息化

2016年两会之后,分享经济火了,各方代表都高度看好分享经济的未来。在各类数据库、行业信息化、电子出版物、数字图书馆、网络资源等新型行业的资源建设中,数字信息化是必不可少的基础性重要工作,可以说这些行业没有数字化就谈不上分享经济,如何高效快速的进行印刷品的识别与准确录入成为考验这些行业数字化水平的重要一环。作为中文识别的全球性领导厂商,北京文通科技有限公司日前发布了2016数据录入工厂系统,新版的文字识别软件让信息化工作插上TH-OCR的翅膀。

对于出版社、图书馆、档案馆、网络出版、电力等行业及政府机关信息化建设来说,每天都需要把纸质印刷品转化为电子文档,可是即便投入了大量的人力物力财力,转换的过程也并不顺利,因为很多行业多数还在采用传统的人工录入并校对的方式,这就造成转换速度慢,效率极低且差错率极高,极大影响了资源使用效率,这与互联网时代的快节奏极其不符。文通科技看准这一市场需求,真正实现了技术创新与市场应用的完美结合,升级发布了OCR文字识别软件——数据录入工厂2016版,识别的速度及准确性大幅提升,并加入了更多人性化的功能。

文通OCR2016数据录入工厂的功能极其强大,借助文通领先的OCR技术,支持扫描、图像导入、图像处理、版面分析,识别,横向校对,集字校对,版面还原,导出支持wordrtftxt、双层PDF及纯文本pdf。采用UNICODE国际编码标准,识别语言种类也很丰富,除了简体、繁体中文,还支持日文、韩文、英文识别,还可以进行混排识别及校对修改。而对藏文、蒙文、维文的识别,也可以根据需求进行定制。OCR文字识别软件采用了文通公司最新研发的高性能文字识别引擎,中文识别率高达99.8%以上,对英文、日文、韩文的识别率也居于世界领先水平。

上述功能只是文通OCR2016数据录入工厂功能中的冰山一角,更强大的人性化功能还包括:支持横向、纵向校对;支持脱机批量导入;系统基于开放式XML数据结构,可以对数据进行扩充和再定义。同时,该文字识别软件支持第三方开发厂商方便地进行文档数据的转换、迁移和再利用。文字识别软件还具备强大的版面还原技术,可将识别后的报刊、杂志、图书等多种形式的文档,通过还原字体、字号、版面位置、字体颜色等信息以原版原式呈现在读者面前,最终生成优质的全息PDF文档。集字校对可大幅提高校对的准确率与效率,避免校对人员的视觉疲劳。


OCR画框识别与自学功能则为用户提供了最大的灵活性与方便性,Image to PDF的批量转换工具,可实现扫描、识别、转换、导出文件自动流程化的工作,彻底做到人机分离,大幅节约人力成本。双层PDF批量制作功能可实现全文检索,可以复制粘贴,或对某个指定目录进行长期监视,真正实现无人操作。“快速准确、方便、人性化,这是我对文通TH-OCR2016数据录入工厂的直观印象,不仅节省了人工录入校对的人力物力财力,还大幅提高了我们的工作效率,用OCR技术解决信息化录入确实事半功倍”,北京某大学数字图书馆主任张女士评价到。

作为一家拥有自主知识产权,以清华光学字符识别TH-OCR及手写识别两大核心技术为先导的OCR技术生产商、文档影像技术和应用解决方案提供商,文通公司一直致力于文字识别软件的应用开发与市场推广,业务已涵盖金融、税务、电信、 电力、公安、政府机构和教育机构等领域,为我国信息化建设做出了巨大的贡献。依托清华大学强大的技术后盾,文通TH-OCR将带领众多行业、企业一起飞向信息化!