一个好问题。我刚刚对健康代码做了深入研究。现在试着回答你的问题。
健康宝是一种卫生防疫代码。是一个适用于北京的健康码,本质上是一个二维码。健康看似简单,背后的原理却不简单。在我看来,健康宝其实是一个大数据产品。下面,从数据产品的角度解读健康宝的实现。
首先,从数据产品的角度定义健康宝
健康宝是指适用于北京的“电子健康证明”二维码,集成了个人申报信息、出行数据、联系方式、就医数据等。,通过识别、数据比对、规则判别等手段,实现个人疫情风险等级的识别和可视化展示。
二、健康宝的技术实现
因为健康宝是一种健康码,所以对健康码实现过程的分析将代替对健康宝实现过程的解剖。
1.卫生法规中使用了哪些数据?
根据相关资料的汇总,笔者真正得到了健康码产品背后所需要的数据(如下表)。当然,在实际的健康码制作过程中,可能会用到一些数据,也可能会有一些数据缺失,但重点是用户填写的信息,位置轨迹,交通信息,医疗检测数据等。
可见,健康码的生成理论上实际上依赖于很多数据来源,比如电信运营商、卫生健康委、社区、海关、采集点、用户自身等等。从这一方面说明了健康码在数据整合上的难度,也证明了多源数据跨界整合的重要性。
2.健康代码的工作原理
假设A和B属于同一个家族。第一天,A坐地铁出门上班,和C、D在地铁里亲密接触。到单位后,A与同事E、F有密切联系,E、F与g有密切联系,当天A下班回家。第二天,A出现发热症状,体温高于37.3,去医院做核酸检测,检测结果显示阳性。初步判定A为疑似病例,卫生编码颜色由绿色变为红色。她立即采取了隔离措施,并发出了危险信号。对于密切接触者B、C、D、E、F,健康码颜色为红色,G颜色为黄色。
3.风险等级判别和健康代码颜色的生成。
个人防疫风险等级是基于个人输入信息和后台大数据的综合对比判断。这个综合判断的标准就是健康码规则引擎。以某省的健康代码为例,其健康风险等级的标准如下:
(1)红色代码标准
①确诊病例、疑似病例、无症状感染者,以及居家(集中)隔离医学观察不超过14天的治愈出院患者和无症状感染者;
②确诊病例、疑似病例和无症状感染者的密切接触者;
③来自高危地区的人;
④正在进行集中隔离医学观察的人员;
⑤其他需要纳入红色代码管理的人员。
以上五项为“或”关系,只要满足一项,其健康代码就会被标记为红色。
(2)黄色代码标准
①体温37的人。3 C以上或临床表现为呼吸道症状(干咳、咳痰、鼻塞、咽痛、气短、呼吸困难)、躯体不适(乏力、肌肉酸痛、头痛、关节痛)、消化道症状(腹痛、腹泻、恶心、呕吐)、结膜出血等之一。
②来自疫情危险地区的人群;
③14天内可能与确诊患者、疑似患者和无症状感染者有密切接触,如乘坐同一公共交通工具、居住在同一建筑单元;
④其他需要纳入黄码管理的人员。
以上四项为“或”关系,只要满足其中一项,其健康代码就会被标记为黄色。
(3)绿色代码标准
(1)除红色代码、黄色代码标准以外的其他人员;
②列入疫情防控“白名单”的人员。
以上两项为“或”,只要满足其中一项,其健康代码就会标记为绿色。
个人健康代码的颜色是通过将个人信息与健康风险等级的标准进行比较而生成的。一般流程如下:
4.防疫卫生信息服务平台
为了保证健康码产品的正常运行和服务的常态化,需要建立一个配套的集成平台,即防疫健康信息服务平台。该平台的总体框架如下图所示:
5.卫生法背后的关键技术
(1)大数据技术:实际上,健康代码需要与动态数据进行对比和监控。健康代码的实现依赖于规则引擎的操作和计算。要支持上亿用户的大规模实时动态查询,大数据技术必不可少。从存储角度,只有利用大数据技术的海量存储功能,接近PB级的数据存储和容量扩展,才能支撑健康码亿级用户的数据存储;从计算的角度来说,这里最重要的是ETL和流处理技术。无论是采用Spark架构的内存计算,还是采用Flink的流处理模式,其背后都少不了数千台服务器的计算能力,所以阿里云或者腾讯云强大的计算能力在背后起到了根本性的支撑作用。
(2)架构设计:腾讯健康码小程序今年2月覆盖超过7亿用户,要承担超过5000万日活跃用户的查询和报表需求,对平台的架构提出了很高的要求。因此,平台的架构设计必须满足三个原则:①高性能和高可用性;②安全稳定③可扩展,易于维护。以腾讯为例,其采用的架构如下:
(3)二维码生成:
健康码本质上是一种二维码,日常生活中最常见的二维码是二维码(快速响应码)。二维码的编码遵循国际标准ISO/IEC 18004,而国内标准GB/T 18284。一般二维码的编码过程是这样的:对于给定的数据,首先需要通过标准定义的转换方法将其转换成二进制的0和1表示,然后0和1的代码按照规则对应二维码图案,0对应白色方块,1对应黑色方块。除了数据信息,QR码还包含定位图形、位置检测图形(图像搜索图形)、纠错码、格式信息等。
按照分类,健康码是一种动态码,其生成过程如下:使用网页链接时,网页上显示个人身份信息和健康信息,网页上的数据来自底层数据库,网页链接编码在二维码中。可以对链接进行加密,以限制特定扫码设备对网页的访问,在访问网页时还可以验证访问者的身份和授权,以保护用户的个人敏感信息,只有授权后才能访问。网页可以随着用户健康状况的变化而更新,也可以在不再使用时直接删除。同时,根据网页被访问的情况,也方便记录用户扫码的时间、地点和次数,以满足后续追查的需要,省去用户重复填写和注册的麻烦。
(4)二维码检验:
二维码如何实现“非接触式”验货?以支付宝为例,有两种实现方式:
①“同步+异步”相结合:即不仅公民端可以通过支付宝修正自己的健康状态,代码后端也会轮询底层源数据库,更新会触发代码重新生成逻辑。
②“实时与离线”相结合:即可以通过管道技术实时更新防控体系中的实时变化列表;根据支持算法的接口数据,可以每日批量更新,保证数据服务的及时性。
(5)数据安全和隐私保护:
健康码在给广大用户带来便利的同时,也引起了用户对隐私保护的担忧。通过分析发现,系统的初始阶段、开发过程、系统运行过程、数据传输过程都可能存在数据泄露的风险,因此需要加强对数据安全的保护。
在数据安全和隐私保护方面,腾讯和阿里都注重遵守《中华人民共和国网络安全法》等以满足合规要求。敏感信息在使用中脱敏,重要数据加密存储,核心数据在使用中水印。对数据库采取安全保护和审计措施。在运维过程中,使用堡垒机保障运维,同时备份重要数据进行容灾。
此外,在健康代码的背后,这两家公司还应该使用区块链技术。通过数字身份合约和数据存证服务,有效保障了“身份健康码”和人员数据的安全性和授权使用。在数据应用过程中,依托区块链技术,使用可信数据源管理机制保证数据源的安全性,使用数字身份锁定数据责任主体,使用区块链存款证书溯源保证数据不被篡改和伪造,使用数据网关对数据访问进行认证、授权和审计。
以上是对健康宝技术实现的解读。希望我的回归能帮到你。
我是数据价值的发现者。欢迎关注我的WX微信官方账号:大数据产品设计与运营。