前端时间做了一个行程码+健康码自动识别的程序,有些网友很感兴趣,今天详细为大家阐明一下开发思路和程序功能。
自动识别的原理采用了上传图片中的文字识别功能,关于这个功能,许多大公司已经开发了成型的API接口,可以直接调用,比如腾讯云和阿里云以及百度的ORC识别都已经比较成熟了。大家可以选择性使用,个人感觉现在百度ORC是比较优惠的,而且有一定量的免费额度。
开发思路
利用ORC的文字识别可以获取到行程码或者健康码里的文字内容,但是要把文字内容截取出来对应各部分信息还是需要处理一下的,比如我们截取下来的信息包括姓名,电话,途经点,码的颜色等信息,获取出来是一大串文字或者利用高精度位置接口获取下来的数组,要通过自己处理后归档归字段整理入库。我暂且从前端和后端阐明一下我自己的开发思路。
1、前端设计
收集到大部分网友前端的要求只是填写简单的个人信息以及上传双码即可,那么前端可以设计为简单表单的形式,通过填写姓名,电话(可对接短信验证),单选的温度自我评估以及其他信息,主要还是两个码的图片上传。
2、后端集成
收到前端表单提交的信息之后,后端做一个接收处理,基本信息直接写入数据库,当然,根据每个人要求不同,表单的字段信息不一样,就设计不同的数据库字段,我们的ORC接口可以在后端入库前集中接入,进行行程码和健康码的识别返回处理,同前端数据一起入库,也可以在前端上传图片的时候进行处理,个人感觉前端上传一张图片就处理一张比较科学,否则前端提交后等待后端一并处理的话等待时间会集中到一起,用户体验稍微差些。当然如果是企业客户可以申请本地SDK,会大大加快识别速度。
后端具体功能就因人而异了,基本还是以表格形式呈现,展示前台提交的表单信息,直接转换成姓名,电话,途径地区,是否有风险,码的颜色等等。可以筛选绿码,黄码和红码以及哪些行程码有途径风险区等选项,可以统计出有多少风险人数。
3、延申功能
也有些网友是收集了大批行程码或者健康码需要集中统计上传后统计识别,这个也可以在后端做一个多图上传功能,上传一张处理一张后识别入库。
总结
今天算是比较系统地为大家介绍了行程码+健康码自动识别的系统开发,欢迎大家交流!