当前位置: 首页   -   新闻中心   -   峰会资讯

2022数字中国创新大赛·大数据赛道科技金融子赛道赛题解析来了!

来源: 数字中国建设峰会大赛组 日期:2022-03-10 11:11

| | | |

  随着互联网的飞速发展,验证码技术已应用到各类信息系统,尤其是金融科技领域的交易类系统中,普遍应用用验证码技术,来保证交易系统的可靠性和安全性。验证码识别技术的发展,不仅可以探索验证码的识别极限,还可以提升图像字符识别技术水平,从而推动验证码设计技术的发展。

  2022数字中国创新大赛·大数据赛道科技金融子赛道推出的赛题“基于文本字符的交易验证码识别”,由兴业银行股份有限公司出题,题目结合企业真实业务场景,围绕验证码自动识别技术,由参赛选手利用已提供的验证码数据,设计合适的训练模型,提升验证码图片的识别准确率。

  赛题地址:https://www.dcic-china.com/competitions/10023

  一、问题价值 

  验证码识别技术作为图像识别领域经典问题,在网络越来越普及的今天,有众多的应用场景,包括注册、登录、找回密码、抢购下单、评论、投票等等。通过解决验证码自动识别问题并提高验证码识别精确度,对于金融领域的自动化技术拓展使用,具有一定的商业价值。

  二、解决意义

  在RPA(流程机器人)、超级自动化、爬虫、自动化测试等领域,验证码自动识别技术都扮演着关键的角色,无法绕开,高效、精准的验证码识别模型决定了相关领域是否可以得到广泛应用。

  本赛题主要以英文和数字类型的验证码为主,不仅可以使用传统的OCR图像识别算法,如OpenCV、CNN等,也可以将图像识别问题转化为多标签分类问题进行处理,通过数据增广和不同模型融合可以有效提高验证码识别的准确度,辅助提升金融领域的自动化业务流程处理能力。

  三、赛题重点难点 

  主要表现为以下三点:

  1.背景图片有较多随机干扰点、干扰线,数字和字母的分辨率存在差异、颜色不统一;

  2.字符图片包括不同字体的数字和大小写字母,部分字符(如0和O、I和l、9和g等)相似度极高,难以识别;

  3.多位字符在图片上的位置重叠,且有不同程度的旋转、变形,无法进行切割处理。

  以上不同的验证码处理方式,加大了验证码识别的复杂度,部分图片肉眼也无法一次性准确识别,如何进行数据预处理或者增强,选取合适算法模型提高验证码的识别精度,成为每一位参赛选手的挑战。

  验证码技术作为交易信息系统中必不可少的环节,通过自动化识别处理验证码,可以有效提高金融机构的自动化流程处理能力,减少固定重复的业务流程操作,为业务人员和科技人员赋能。期待通过大家的共同努力提升金融科技自动化水平,助力金融企业数字化转型。

扫一扫在手机上查看当前页面
附件下载:

©2018-2021数字中国建设峰会网站版权所有

备案证号:闽ICP备10019069号