- TH-OCR文字識別SDK
- OCR文字識別系統(信創版)
- TH-OCR少數民族文檔識別
功能介紹
-
1:1還原重構表格
支援OCR自動識別分析表格,並1:1還原重構表格,確保資料完整性
-
OCR辨識多種版面報刊
可辨識不同版式的報紙內容,精確重現原始佈局
-
支援多種採集方式
透過手機、平板電腦、高拍機、掃描器、數位相機等途徑取得的影像皆可辨識
-
可辨識多門語種,字符集廣
支援OCR辨識印刷簡體、手寫簡體、印刷繁體、手寫繁體、生僻字、手寫體及印刷體混合文字及通用英文
-
支援OCR辨識、匯出多種格式影像/文件
支援識別BMP、JPG、JPEG、PNG、PDF等主流圖片格式;匯出JSON、TXT、雙層PDF等多種格式文件
-
自動旋正圖片
TH-OCR文字辨識支援45°、90°、180°、270°等多角度圖片旋正
-
可與多種系統整合應用
提供標準的API接口,實現與檔案、OA、ERP等應用系統快速集成
-
多種部署方式
既支援B/S端服務部署,也支援PC端SDK整合部署,也支援行動裝置SDK(Android,鴻蒙)集成
-
支援CPU和GPU硬體配置部署
同樣辨識效能情況下,支援CPU與GPU硬體配置部署,節省硬體投入成本
產品優勢
國家科技進步二等獎
- TH-OCR技術榮獲國家科技進步二等獎、教育部科技進步一等獎等多個獎項
拓展應用
- 支援與AI掃描器等硬體產品拓展應用,實現大量資料檔案的管理與數位化
自動校正
- 支援對影像因掃描引起的傾斜進行自動校正
支援版面分析、版面還原
- 支援對影像進行自動版面分析,根據分析結果 1:1還原版面格式及訊息
智慧型OCR識別
- 在線可識別字在原文中的位置和大小,可識別多頁PDF文件
支援OCR生僻字識別
- TH-OCR文字辨識可高精準度辨識多種生僻字
可擦除底線、濾色後識別
- 可過濾圖片上的紅色或粉紅色等乾擾背景
保證資料安全
- 企業內部網路部署,滿足使用者資料安全的需求
OCR秒級辨識、辨識率高
- 辨識速度快,辨識速度在1秒內,辨識準確率高達99%以上
應用範圍廣
- 可廣泛應用於檔案系統、大模型、RPA等多領域
應用場景
- 電子檔案安全管理系統
- 系統辦公室軟體
- 檔案數位化加工
- 智慧硬體
- 合約管理
- 大模型
-
電子檔案安全管理系統
將文通科技OCR文字辨識系統應用於電腦終端保密檢查系統、電子文檔安全管理系統、郵件防控管理系統、電子檔案安全管理等系統,超高辨識率為資料安全與風險防範提供高效率技術支援。
-
系統辦公室軟體
將文通科技TH-OCR文字辨識SDK嵌入RPA等辦公室軟體中,可應用於金融、醫療保健、企業、政府、招標機構等各領域,為終端客戶提供各類文件或內部資料的文字擷取功能,操作便捷,提升整體的工作效率、節約人力成本。
-
檔案數位化加工
將文通科技OCR文字識別系統應用於大量資料檔案的管理與數位化場景,透過掃描企業紙本檔案,可匯出雙層PDF、TXT、WORD、XML、XLS等格式文件,方便企業編輯、查找檔案信息,應用於圖書館數位化專案、歷史檔案數位化、軍政檔案管理、軍政檔案管理等項目,實現檔案數位化管理,提升效率和智慧化水平。
-
智慧硬體
將文通科技文字辨識SDK嵌入到多功能一體機、掃描器或其他智慧硬體中,在進行文件錄入的工作時,可快速識別和提取文字,實現企業資訊數位化管理。
-
合約管理
合約比對基於文通科技TH-OCR文字識別,自動抽取合約文本中的關鍵信息,可識別字在原文中的位置和大小,將圖像識別輸出為可編輯的文件格式,進行存儲,實現計算機替代人工審核比對,解決合同管理工作中人工審核時間成本高、人力成本高的難題。
-
大模型
應用OCR訓練平台對版式不統一的選票卡、准考證等各類卡證、文件進行結構化識別,實現各類卡證及文件的電子化管理,可應用於紙本文件分類歸檔、資訊統計分析、關鍵內容擷取等場景,有效降低人工輸入成本,大幅提升資訊管理效率。
客戶案例
免費測試
TH-OCR文字識別SDK 識別
圖像建議:大小在200KB左右,位深度24以上。掃描圖像建議:解析度為300DPI,小於3M。

- TH-OCR文字識別SDK
- 結果
- JSON數據