首页 新闻中心 视频文字识别不再难文通助爱奇艺轻松搞定视频内容检索

视频文字识别不再难文通助爱奇艺轻松搞定视频内容检索

2015-02-09
       互联网在一步一步的改变我们的生活,早期的互联网只有文字,后来发展到了图片+文字的图文时代,而如今我们已经置身于视频时代之中。当微信微博里遍地都是视频的段子,以图片、视频为主的新媒体时代大大丰富了我们的生活,但同时也给视频网站、电视台等行业工作者带来不小的难题,如何在海量视频中检索到想要的视频?国内知名视频网站爱奇艺借助“文通视频文字识别技术”实现了视频检索轻松化,为视频信息检索打开了一扇新的大门。
 
       众所周知,每一个视频网站平台都存在海量视频节目,需要进行分类管理,另外为了应对版权及视频监管的需要,各大视频网站平台及电视台还需要对视频信息进行检索,以便发现问题或者更好的编辑整理视频文件。对于任何一个视频网站来说,查询检索视频文件内的信息成为了一个巨大的工作量。
 
       据了解,原始的视频文件是无法检索文件内信息的,检索的时候必须要输入检索信息文字,也就是关键词或者组合检索项。视频文件想要进行检索必须要把视频帧(图片)上出现的文字信息(字幕)与时间轴对应,才可以进行查询检索。这个繁琐的工作必须要人工进行才行,爱奇艺为此雇佣了大量的录入人员,将视频帧(图片)上出现的文字手工录入到计算机,通过与时间轴的匹配对应进行检索,这样检索的效率非常低,而且还耗费了巨大的人力物力与财力。
 
       “采用文通视频文字识别技术后,我们的检索效率提高了很多倍,而且也节省了大量的人力物力”,爱奇艺公司技术负责人介绍说,文通的视频文字识别技术将新闻字幕、电影、电视剧字幕自动识别成文本信息,与视频时间轴对应后,就可以对视频内容进行检索了,视频检索的速度特别快,效率非常高。
 
       据介绍,文通基于TH-OCR推出的视频文字识别技术,可支持avi、rmvb、rm、mp4、3gp等各类主流视频格式,可以识别纯英文、简繁体中文等视频图像,还支持TIFF、JPEG、PNG、BMP格式图像的读取,及对视频图像字幕进行自动版面分析,获取识别字符在原文中的位置和大小信息,完成对指定区域的识别。TH-OCR文通视频文字识别产品的出现完全解决了目前OCR产品对于视频文字无法识别的问题,省却了视频文字重新输入的麻烦。
 
       文通视频文字识别技术的推出,很好解决了目前视频文字识别的障碍,省却了视频文字重新输入的麻烦,对于视频网站和用户来说是一大福音。据文通负责人介绍,文通视频文字识别技术和产品的出现,能够充分满足不同行业对文字识别的要求,除视频网站外,在电视台媒资管理、政府舆情监控和维稳等各个领域正在发挥越来越大的作用。