Aplikasi pengenalan dokumen Wintone diterapkan pada Badan Pengelola Arsip.
2022-09-30 13:42:49
Teknologi Pengenalan Karakter Optik (OCR) memiliki peran yang sangat penting dalam pengumpulan data dan pekerjaan digitalisasi arsip. Sejak 2013, dalam konteks kuatnya implementasi strategi "digitalisasi arsip yang ada, elektrifikasi arsip yang baru" oleh Badan Arsip Negara, salinan digital arsip berbentuk kertas telah diproduksi dalam jumlah besar. Pekerjaan OCR arsip telah sepenuhnya dimulai. Untuk menstandarisasi pelaksanaan pekerjaan terkait, Badan Arsip Negara dengan bijaksana mengeluarkan "Standar Pekerjaan Pengenalan Karakter Optik (OCR) untuk Salinan Digital Arsip Kertas" pada Desember 2019, yang menetapkan persyaratan organisasi, pelaksanaan, dan manajemen pekerjaan OCR salinan digital arsip kertas.
Namun, jenis arsip yang beragam, dengan konten teks yang mencakup berbagai bahasa, gaya font, ukuran, susunan, dan perataan, bahkan termasuk tulisan tangan dan teks dalam bentuk tradisional atau sederhana, membawa tantangan tersendiri dalam pekerjaan pengumpulan data dan digitalisasi arsip.
Pengenalan Dokumen Wintone
Wintone Technology meluncurkan pengenalan teks umum berbasis kerangka teknologi pembelajaran mendalam yang baru, mendukung pengenalan bahasa Mandarin dalam bentuk tradisional dan sederhana, Tibet, Uighur, Mongol, Arab, Kazakh, Kirgiz, Jepang, Korea, serta campuran bahasa Mandarin-Inggris dan lebih dari sepuluh bahasa lainnya. Teknologi ini memungkinkan penyesuaian cepat dan pengembangan set karakter, memainkan peran penting dalam manajemen arsip, ekstraksi teks, dan manajemen arsip elektronik.
Badan Kekayaan Intelektual Negara, Badan Geologi, Universitas Qinghai, China Post, dan Neusoft Group, semuanya telah mengaplikasikan teknologi pengenalan teks Wintone, baik untuk melayani klien atau mengintegrasikannya ke dalam sistem perusahaan, digunakan dalam manajemen arsip digital, manajemen kontrak, pengolahan data, dan digitalisasi dokumen kertas, serta berbagai skenario lainnya.
Pengenalan Teks Umum Wintone mendukung pengenalan bahasa Inggris murni, Mandarin tradisional dan sederhana, Jepang, Tibet, campuran Mandarin-Inggris, serta lebih dari sepuluh bahasa lainnya.
Pengenalan teks umum menggabungkan mode tradisional dan algoritma pembelajaran mendalam, mendukung pengenalan karakter etnis minoritas, karakter langka, dan tulisan tangan. Dapat mengenali lebih dari 16.000 set karakter dan kompatibel dengan platform perangkat keras domestik seperti Loongson, Zhaoxin, dan Feiteng.
Teknologi ini juga dapat melakukan koreksi kemiringan otomatis, rotasi otomatis, penghapusan garis bawah otomatis, penghilangan noda otomatis, pemotongan otomatis, dan lainnya.
Secara otomatis memfilter gangguan seperti kemiringan, distorsi, perubahan pencahayaan, garis tertekan, grid, cap, kabur, dan resolusi rendah.
Mendukung analisis tata letak, dapat secara otomatis membedakan teks dalam orientasi horizontal dan vertikal; dapat mengenali posisi dan ukuran karakter dalam teks asli secara online, serta dapat mengenali file PDF multi-halaman secara bersamaan.
Wintone Technology akan terus terlibat lebih luas dan mendalam dalam pekerjaan arsip, menggunakan teknologi pengenalan OCR untuk menjalankan digitalisasi arsip, meningkatkan efisiensi dan akurasi kerja, serta mendorong transformasi digital dalam pembangunan sumber daya informasi arsip.