九继肺结节智能读片、AI作曲和ISBI眼底图分析技术分别斩获国际大赛第一后,中国平安AI技术再下一城。近日,平安集团旗下平安科技OCR团队的图像文本识别技术在此领域评测比赛——COCO-Text任务文本定位比赛中,成绩排名第一。
COCO-Text是面向全球发起的挑战赛,全球不少优秀团队和知名公司参与了此次比赛,此次比赛基于真实场景图像,围绕三个任务主题(Text Localization、 Cropped Word Recognition、 End-to-End Recognition)展开激烈竞争。大赛提供65万张图片,按比例用于训练、验证和测试,与许多其它场景文本数据集不同的是,COCO-Text的某些图像根本不包含文本,图像是在不考虑文本的情况下收集的。最终评估指标将平均精度(AP)视为主要评测度量,对算法适应性有极高要求。
平安科技OCR团队以在图像识别领域所积累的深厚经验为基础,针对大赛的第一项任务进行深入研究,采用前沿技术架构,多种算法进行数据增强,其中历经多次实验与参数调整,目前以平均精度(AP)68.61%勇夺第一。
COCO-Text测评成绩排名(PATech-AILab为平安科技)
目前参赛的团队中,最高成绩是平安科技OCR团队,平均精度(AP)高达68.61%。其余团队包括有:第二名Sogou团队,AP68.45%;第四名三星R&D团队,AP66.30%;第五名上海交通大学,AP64.67%;第七名腾讯团队,AP61.95%,以及其他国内外重要公司和学术机构团队。
文本识别技术的研究价值巨大,对人工智能在地图导航、智能交通、信息检索、机器视觉等领域的发展有较强推动作用,具有广阔的应用空间和重要的研究意义。
基于文本识别技术,目前平安已经研发出“平安票证识别通”,该系统是平安科技OCR团队自主研发的文字识别AI产品,以基于深度学习的先进算法为智能引擎,精准识别身份证、行驶证等多种卡证和票据的图像文字信息,适用于各应用场景,可以迅速提升输入效率,优化用户体验。目前平安票证识别通已接入平安产险、平安寿险、平安信托等企业中,广泛应用于移动开户、移动投保、银行票据录入、医疗单据录入等场景,可准确识别身份证、行驶证、驾驶证、营业执照、医疗发票等证件票据。目前,平安票证识别通调用量已达超过3000万次,证件识别准确率超过98%。
一直以来,中国平安以科技引领业务变革,不断加强核心技术研究和自主知识产权掌控,截至2018年6月末,专利申请数累计达6121项,在智能认知、人工智能、区块链和云等多个领域取得了重大突破。其中,平安的人脸识别技术准确率达99.84%,声纹识别准确率达99.7%,肺结节智能读片技术世界领先,并应用人工智能和大数据建立起流感、手足口病预测模型,精确度达90%以上。
中国平安表示,此次平安文本识别获得世界竞赛第一,表明平安的文本识别技术在准确性和细分性上均处于世界领先水平。公司将继续深化“金融+科技”,探索“金融+生态”,将创新科技成果运用到传统金融业务中,提升竞争力的同时,搭建生态圈与平台,促进科技成果转化为价值,致力于成为国际领先的科技型个人金融生活服务集团。平安产险青岛分公司供稿。