客观日本

AI为文字识别带来创新,纸上信息快速数字化

2021年04月28日 信息通信

人工智能(AI)正在为光学字符识别(OCR)技术带来创新。新技术可以识别写在纸上的文字信息,并将其快速数字化,用途正在迅速扩大。通过与图像和语音识别技术相结合,应用范围还有望扩大到基于多种信息执行高级任务的“多模态AI”。

title

变形或者带有校正标记的文字也能高精度识别 (图片由AI inside提供)

在繁忙的季节,工作人员经常要加班,甚至没有其他部门的支援就无法完成工作。为解决这种情况,横滨市从2021年度开始导入基于AI的“AI-OCR”识别技术,用于保育所认证的相关工作。

确认申请文件并输入到系统中的工作将利用AI-OCR和RPA(机器人流程自动化)实现自动化。2020年度试用了在东证创业板上市的AI Inside公司的技术,确认可以减少500个小时的工作量,该部门的20个工作人员就能应对。

OCR从很早以前就开始用于邮编的识别等,但一直很难用来处理包括种类繁多的汉字等在内的手写文字,格式也有限。

掀起创新的是AI技术。随着“深度学习”技术日趋成熟,最近几年AI-OCR的性能得到提高。数据的积累量也不断增加,通过大量进行学习,变形的手写汉字等也已经可以准确识别,甚至还出现了宣称精度达到90%以上的服务。

使用时先用扫描仪扫描文件,然后用AI识别文字,最后由RPA输入信息。截至2020年底,签约AI inside公司服务的数量达到12900件,增至一年前的约25倍。

为应对新冠疫情蔓延,日本为每位国民提供10万日元补贴,一些地方政府就利用AI-OCR处理了相关的事务工作。京都府舞鹤市利用了Cogent Labs公司(东京港区)的AI-OCR技术和RPA。人工处理的话,每人每天最多只能处理约200件,而利用AI-OCR能处理2000件。

AI-OCR服务可以显示出AI在识别文字时的“自信”程度。无法充分读取时,可以通过人工检查来防止出错。

提供AI-OCR服务的Arise Innovation公司(东京·中央)首席执行官(CEO)清水真表示,“越来越多的人开始认识到该服务可以有效提高工作效率”。部分地方政府还考虑将其用于新冠病毒疫苗接种相关工作。

据调查公司ITR(东京·新宿)预测,日本国内的OCR市场在AI的推动下将以年均20%的速度增长,预计到2024年度市场规模将达到215亿日元。虽然今后还必须推进无纸化,但AI-OCR也支持PDF形式的文件读取。

目前AI-OCR服务范围也有可能扩大。AI inside公司开发了结合面部认证(利用驾驶证等的照片)和AI-OCR来提高身份验证工作效率的系统,已于2月份开始对外提供。在AI研究中,利用图像、声音和文件等多种信息实现高级识别等的多模态AI正成为新趋势。

多模态AI有望提高一直由人工负责的各类工作的效率。把用来掌握对话内容的语音识别和AI-OCR相结合的话,可能会大大改变窗口业务和医疗现场。

日文:AI量子编辑 生川晓、《日本经济新闻》,2021/04/19
中文:JST客观日本编辑部